Masarykova univerzita Filozofická fakulta

Ústav románských jazyků a literatur

Anna Zelenková

Arabismes dans les chansons de rap français : traitement lexicographique, adaptation phonique et rôle de l’origine des rappeurs

Magisterská diplomová práce

Vedoucí práce: PhDr. Alena Polická, Ph.D.

Brno 2013

1

Prohlašuji, že jsem diplomovou práci vypracovala samostatně s využitìm uvedených pramenů a literatury a že se elektronická verze plně shoduje s verzì tištěnou.

V Brně dne 30.4. 2013

…………………………………………………… Anna Zelenková

2

Je tiens à remercier Madame Alena Polická, directrice de mon mémoire, pour son soutien, ses corrections et ses conseils précieux. Je voudrais remercier également les locuteurs arabophones - Dominique Caubet, Roland Laffitte, Tomáš Duběda, Igor Dostalìk et Midou Benterari - à qui je me suis adressée et qui ont patiemment répondu à mes questions concernant la langue arabe. 3

Table des matières

INTRODUCTION...... 6 1. EMPRUNTS ET ARABISMES ...... 9

1.1. DEFINITION DE L’EMPRUNT...... 9 1.2. EMPRUNTS À L’ARABE PARMI LES AUTRES TYPES D’EMPRUNTS LEXICAUX ...... 12 1.3. ARABISMES AU COURS DE L’HISTOIRE ...... 14 1.4. LANGUE ARABE...... 15 1.4.1. Arabe maghrébin ...... 18 1.4.2. Arabe maghrébin en ...... 19 1.5. BANLIEUE, IMMIGRATION ET LANGAGE ...... 22 1.6. ROLE DES ARABISMES DANS LES PARLERS DES JEUNES ...... 24 1.6.1. Influence des arabismes sur le français ...... 28 1.7. RAP, IMMIGRATION ET EMPRUNTS ...... 32 2. METHODOLOGIE ...... 34

2.1. CHOIX DES INTERPRETES ...... 35 2.2. RECHERCHE DES ARABISMES ...... 38 2.3. VERS LA PARTIE ANALYTIQUE ...... 39 3. ASPECT FREQUENTIEL ...... 41

3.1. ARABISMES DANS LES CHANSONS DU CORPUS ...... 42 3.2. ARABISMES DANS LES SUBCORPUS ...... 44 3.3. ARABISMES AUX FREQUENCES ELEVEES...... 45 3.4. ARABISMES AUX FREQUENCES BASSES ...... 49 3.5. VARIANTES GRAPHIQUES ...... 50 3.6. RAPPEURS ET LES ARABISMES...... 50 3.6.1. Les plus grands utilisateurs des arabismes ...... 55 4. ANALYSE LEXICOGRAPHIQUE ...... 55

4.1. TYPOLOGIE DES DICTIONNAIRES ...... 55 4.1.1. Dictionnaires généraux de langue ...... 55 4.1.2. Dictionnaires de l’argot ...... 56 4.1.3. Dictionnaires spécialisés en argot contemporain des cités ...... 56 4.1.4. Autres sources ...... 56 4.2. RESULTATS DE LA RECHERCHE LEXICOGRAPHIQUE ...... 57 4.2.1. Présence des arabismes dans les dictionnaires ...... 57 4.2.1.1. Arabismes présents dans les trois groupes des dictionnaires ...... 60 4.2.1.2. Arabismes présents dans les dictionnaires généraux et dans les dictionnaires de l’argot ...... 68 4.2.1.3. Arabismes présents seulement dans les dictionnaires spécialisés en argot contemporain des cités ...... 69 4.2.1.4. Arabismes qui ne sont présents dans aucun dictionnaire ...... 71 4.2.2. Fréquence des arabismes dans les dictionnaires ...... 77 4.2.3. Variantes graphiques des arabismes dans les dictionnaires ...... 81 5. ADAPTATION PHONIQUE ...... 87

5.1. PHONETIQUE ARABE ...... 88 4

5.1.1. Système vocalique ...... 89 5.1.2. Consonnes propres à l’arabe ...... 90 5.1.2.1. Consonnes postérieures ...... 92 5.1.3. Accentuation des syllabes ...... 92 5.2. ANALYSE PHONIQUE ...... 93 5.2.1. Consonne kh [x] ...... 93 5.2.1.1. Proposition de la réalisation graphique du [x] ...... 95 5.2.2. Consonnes ḥ [ħ], h [h] ...... 96 5.2.2.1. Proposition de la réalisation graphique des [ħ], [h] ...... 100 5.2.3. Consonnes ‘ [ʔ], ᶜ [ʕ] ...... 100 5.2.3.1. Proposition de la réalisation graphique des [ʔ], [ʕ] ...... 102 5.2.4. Consonnes emphatiques ...... 103 5.2.4.1. Proposition de la réalisation graphique des consonnes emphatiques ...... 103 5.2.5. Voyelles ...... 104 5.2.5.1. Proposition de la réalisation graphique des voyelles ...... 107 6. LEMMATISATION DES ARABISMES ...... 108

6.1. VARIABILITE GRAPHIQUE DES ARABISMES DANS LES DICTIONNAIRES ET DANS LE CORPUS ...... 108 6.2. METHODE DES FILTRES SUCCESSIFS ...... 109 6.2.1. Filtre 1 ...... 110 6.2.1.1. Cas problématiques relevant du filtre 1 ...... 111 6.2.2. Filtre 2 ...... 111 6.2.3. Filtre 3 ...... 111 6.2.3.1. Cas problématiques relevant du filtre 3 ...... 112 6.2.4. Filtre 4 ...... 114 6.2.5. Résultats de la lemmatisation ...... 115 EN GUISE DE CONCLUSION ...... 116 CONCLUSION ...... 118 LISTE DES ILLUSTRATIONS ...... 122 LISTE DES ABREVIATIONS ...... 125 LISTE DES ANNEXES...... 126 BIBLIOGRAPHIE ...... 127 ANNEXES ...... 133

5

Introduction

Le présent mémoire traite des emprunts à l’arabe dans les parlers des jeunes sur des exemples concrets issus des paroles du rap français. Aujourd’hui, les emprunts aux langues étrangères et leur influence sur la langue française sont un phénomène qui intéresse les (socio)linguistes. Or, le phénomène d’emprunts n’est pas récent, il est présent en français depuis le XIIe siècle, car le français n’arrête pas à emprunter aux langues différentes jusqu’à nos jours. Naturellement, il y a des langues qui ont enrichi le français plus que d’autres, ce qui est dû notamment aux faits historiques. Nous trouvons les arabismes dans les divers domaines de la vie humaine, en particulier dans le domaine de la science, du commerce ou de la culture.

Aujourd’hui, ce sont surtout les enfants des immigrés, qui sont arrivés en France après la décolonisation de l’Afrique, qui introduisent de nouveaux arabismes en français. Bien que Français par leur carte d’identité, ils restent considérés comme des « jeunes issus de l’immigration ». Considérés comme les « Beurs » par les Français de souche, leurs conditions de vie ne sont pas toujours faciles et l’intégration demeure difficile. Ils vivent souvent dans les banlieues, dites également les « quartiers sensibles ». Un des moyens comment échapper à cette stigmatisation est l’emploi de leur propre langage où ils mélangent le français, l’arabe mais également d’autres langues d’immigration pour refléter ainsi leur appartenance à deux milieux culturels différents. Un des relais entre ces parlers des jeunes urbains et les parlers jeunes en général est le rap français, car un nombre considérable de rappeurs est issu de la banlieue et/ou de l’immigration.

C’est pourquoi les chansons de rap français nous serviront comme le point de départ pour notre recherche. Le corpus utilisé sera créé par 126 chansons tirées de RapCor - un corpus de chansons de rap français créé et constamment enrichi depuis 2009 - qui sont parues entre 2003 et 2008. Il sera composé de sorte pour pouvoir comparer le mode de l’emploi, la quantité ou la nature. Nous observerons s’il y a une directe relation entre la manière de prononciation des arabismes et l’origine de l’interprète. Une autre partie de l’analyse sera consacrée à la comparaison entre la fréquence de l’emploi des arabismes entre les interprètes d’origine arabe ou d’origine non arabe.

6

Le présent mémoire se compose de deux parties : la partie théorique et la partie pratique. Dans la partie théorique nous définirons l’emprunt de point d’un vue linguistique et nous caractériserons la position de l’emprunt à l’arabe parmi les emprunts aux autres langues. Ensuite, nous décrirons la manière dont les arabismes ont influencé le lexique français au cours de l’histoire. Nous nous concentrons également sur la langue arabe, en particulier sur l’arabe maghrébin, parlé par les immigrés de l’Afrique du Nord en France et qui est, depuis 1999, présent même dans la Charte européenne des langues régionales ou minoritaires. Puis, la position des immigrés et de leur(s) langue(s) maternelle(s) au sein de banlieue française et la création de leur propre langage qui est, parmi autres, nommé parlers des jeunes urbains, seront décrites. Ensuite, nous chercherons quel est le rôle des arabismes dans ce type des parlers. Nous observerons également comment les arabismes influencent la langue française sur différents niveaux : lexical, syntaxique ou phonique. Enfin, nous décrirons brièvement les rapports entre l’immigration, les emprunts aux langues étrangères et le rap, dont les paroles nous ont servi comme le point de départ dans la partie pratique. La partie pratique sera introduite par la description détaillée de l’élaboration du corpus et des étapes successives de l’analyse. La recherche est basée sur trois hypothèses suivantes : Premièrement, nous supposons que les rappeurs d’origine arabe vont utiliser les arabismes plus abondamment que les rappeurs d’origine non arabe. Deuxièmement, nous présumons que les interprètes non arabes vont utiliser plutôt les emprunts généralement connus et facilement trouvables dans les dictionnaires, tandis que les rappeurs ayant un lien avec la langue arabe vont enrichir notre corpus des arabismes moins connus et utilisés par les jeunes et qui ne sont pas encore présents dans les dictionnaires. La troisième hypothèse concerne la prononciation et les formes graphiques des arabismes de notre corpus. Nous partons du postulat que leur prononciation ainsi que leurs formes graphiques vont être plus proches des mots originaux arabes dans la réalisation des rappeurs d’origine arabe, tandis que la réalisation (écrite et graphique) de leurs collègues non arabes va être plus ou moins influencée par le français ou par leur compétence plus ou moins bonne de réaliser certains phonèmes arabes. Nous commencerons notre recherche par une analyse quantitative des arabismes du corpus appartenant au registre substandard. Nous nous concentrerons sur l’occurrence des arabismes dans les chansons analysées. Nous observerons surtout (mais non seulement) leur emploi par les rappeurs selon leur origine. Cela nous permet de confirmer ou de réfuter notre première hypothèse.

7

Dans le chapitre nommé Analyse lexicographique, nous comparerons la présence des arabismes dans neuf dictionnaires employés. D’une part, cette analyse nous servira pour répondre à la deuxième hypothèse et d’autre part nous allons également observer dans quelle mesure les arabismes analysés sont intégrés dans la langue française et nous allons comparer les formes graphiques trouvées dans les dictionnaires avec celles du corpus. Dans le chapitre Analyse phonique, nous nous focaliserons sur l’adaptation phonique des arabismes. Nous allons établir une comparaison entre la prononciation arabe des mots originels et la prononciation de ces mots dans les chansons analysées. Sur la base de cette analyse, nous proposerons la réalisation graphique de certains phonèmes « problématiques », ce qui pourrait être utile pour la lemmatisation de tous les arabismes dans le RapCor ou dans les dictionnaires franco-tchèque à venir. Comme le nombre de variantes graphiques que nous avons recueilli pendant la recherche dans le corpus et, en particulier, dans les dictionnaires est assez élevé, nous procéderons, dans le dernier chapitre de notre mémoire, à la lemmatisation des arabismes du corpus. Nous commencerons par l’application de la méthode des filtres successifs qui sera utilisée pour obtenir les lemmes. Cette méthode de lemmatisation des arabismes pourra être également utilisée pour la lemmatisation de tous les arabismes, non seulement dans le RapCor, qui pourront être ainsi désambiguïsés.

8

1. Emprunts et arabismes

Dans ce chapitre, nous allons apporter en premier lieu les définitions d’emprunt lexical dans plusieurs ouvrages de référence et présenter différents types d’emprunts. Ensuite, nous allons décrire la situation des mots empruntés dans la langue française et nous allons brièvement mentionner les emprunts au cours de l’histoire. Nous allons également traiter la langue arabe et son influence sur le français et nous allons nous concentrer surtout sur l’arabe maghrébin et sa situation en France. Dans la dernière partie de ce chapitre, nous allons nous intéresser à la position des arabismes dans les parlers des jeunes.

1.1. Définition de l’emprunt

Avant de présenter la situation des emprunts en général et des emprunts à l’arabe en français en particulier, nous allons réfléchir sur les approches des linguistes envers la définition de l’emprunt. L’emprunt en tant que résultat du processus d’un contact de langues a été décrit dans le Grand dictionnaire, Linguistique et sciences du langage ainsi : « Il y a emprunt linguistique quand un parler A utilise et finit par intégrer une unité ou un trait linguistique qui existait précédemment dans un parler B (dit langue source) et que A ne possède pas ; l’unité ou le trait emprunté sont eux-mêmes qualifiés d’emprunts1 ». Le phénomène de l’interférence, c’est-à-dire l’influence d’un système linguistique sur l’autre aboutissant à un résultat hybride, est présenté dans l’ouvrage de Maurice Pergnier comme une conséquence fréquente du contact de langues. Pour Pergnier : « [...] le produit de ces interférences étant dénommé soit sous le terme générique de formes interférentes soit sous les termes plus spécifiques de notre typologie : emprunt (lexical, phonétique, etc.) et calque (lexical, morphologique, etc.)2 ». Pergnier parle également de l’identification de l’emprunt :

Le caractère facilement identifiable (à l’anglais comme à d’autres langues), tient à ce que leur introduction est d’abord l’introduction d’un signifiant, c’est-à-dire d’une forme phonique et graphique nouvelle. Ce signifiant se signale le plupart de temps à l’attention par une organisation des phonèmes

1 Jean DUBOIS et al. : Grand dictionnaire, Linguistique et sciences du langage, Paris, Larousse, 2007, p. 177. 2 Maurice PERGNIER, Les anglicismes : danger ou enrichissement pour la langue française?, Paris, PUF, 1989, p. 28. 9

et lettres, inhabituelle et non conforme au système de syllabation du français. Son caractère ‘étranger’ saute ainsi aux yeux et aux oreilles de l’autochtone3.

Une approche concernant la reconnaissance (dans des productions écrites) des emprunts qui ne sont pas encore absolument intégrés est présentée par Christine Jacquet-Pfau et Jean-François Sablayrolles. En TAL4, il faut d’abord repérer des emprunts « qui sont identifiables comme éléments pas encore ou seulement partiellement intégrés au système5 ». De cette analyse sont donc exclus les emprunts déjà intégrés et elle ne comprend que les emprunts conservés sous sa forme initiale et les emprunts adaptés, moyennant des adaptations phonétiques ou/et graphiques ou morphologiques6. Puis, il s’agit de reconnaître des particularités graphiques qui ne correspondent pas au code de la langue qui emprunte et qui peuvent être diverses : le code graphique différent, l’instabilité orthographique du français (des graphies « flottantes »), les propriétés morphologiques qui peuvent présenter des écarts par rapport au système français. Ensuite, une graphotaxe7 particulière pour les emprunts qui ne sont pas encore intégrés graphiquement au français est construite à l’aide de deux critères principales : la distribution et la position des chaînes graphiques ou les graphèmes8. Dans ce système, les emprunts sont « […] alors analysés selon des règles de reconnaissance des unités lexicales non intégrées au code morphographique du français9 ».

Une fois les emprunts insérés, ils subissent souvent une transformation qui touche leurs structures phonétique, morphologique et syntaxique. Cette problématique concernant l’intégration d’un emprunt dans la langue emprunteuse est traitée par Georges Mounin ainsi :

Les problèmes posés par l’emprunt sont surtout l’intégration au système phonologique de la langue emprunteuse, les modifications de sens, et le réajustement des paradigmes lexicaux troublés par le mot nouveau. Des emprunts massifs peuvent modifier la physionomie du lexique d’une langue,

3 M. PERGNIER, Les anglicismes…, op. cit., pp. 30 – 31. 4 Traitement automatique des langues. 5 Jean-François SABLAYROLLES, Christine JACQUET-PFAU, « Les emprunts : du repérage aux analyses. Diversité des objectifs et des traitements», Neologica, 2008, n° 2, p. 30. 6 Ibid, p. 31. 7 La description ou l’analyse des règles d’organisation des graphèmes à l’intérieur des mots d’une langue donnée. 8 J. F. SABLAYROLLES, Christine JACQUET-PFAU, « Les emprunts ... », art.cit., p. 34. 9 Ibid, p. 34. 10

comme le fut le cas pour les emprunts de l’anglais au français entre le XIIe et XVe siècle10.

Jean-François Sablayrolles et Christine Jacquet-Pfau, travaillant sur la néologie, un champ d’étude dynamique, décrivent le terme emprunt comme un phénomène qui « dure ce que dure un néologisme : quelques années avant disparition ou intégration11 » et ils réservent le terme emprunt « à la matrice qui fait introduire dans des énoncés français des lexies existant dans d’autres langues et absentes dans un état immédiatement antérieur de la langue française12 ». Ils n’appliquent donc pas le terme emprunt à tous les mots qui ne sont pas de création française. De ce point de vue, les emprunts sont moins nombreux.

Pour s’orienter plus facilement dans les emprunts, Henriette Walter a proposé, dans son ouvrage, le regroupement des emprunts en quatre grands catégories : les emprunts tels quels, les nouvelles dérivations, un nouveau sens pour un mot déjà existant, traductions et calques. Le premier groupe des emprunts tels quels comprend des mots dont les deux aspects – la signification et la forme phonique et graphique, plus ou moins adaptée en français – ont été intégrés totalement en français. Or, pendant le passage d’une langue à l’autre, les mots ne gardent pas toujours absolument mêmes extensions de sens. Le deuxième type, les nouvelles dérivations, est constitué des formes dérivées qui sont des emprunts tandis que les formes simples ne les sont pas (p. ex. l’emprunt à l’anglais romantique). Le troisième groupe est formé par les emprunts qui acquièrent un nouveau sens pour des mots déjà existant. Il s’agit souvent d’une extension du sens que porte l’emprunt. Ce type d’emprunts est fréquemment représenté par des mots français qui ont été adopté en Angleterre et plus tard ont été de nouveau emprunté par le français, mais cette fois enrichis d’un sens qu’ils n’avaient pas à l’origine. Le dernier groupe que Walter mentionne sont les traductions et calques. C’est un groupe qui est même difficile à apercevoir sans une bonne connaissance des deux langues concernées. En plus, il faut distinguer entre vrais calques et les simples traductions (p. ex. lune de miel/honeymoon). Les calques sont des répliques pures, des traductions littérales de la langue prêteuse (le vrai calque de honeymoon serait miel lune). Les calques et traductions

10 Georges MOUNIN, Dictionnaire de la linguistique, Paris, PUF, 1974, p. 124. 11 J.-F. SABLAYROLLES, Christine JACQUET-PFAU, « Les emprunts ...», art. cit., p. 21. 12 Ibid. 11

réussites perdent rapidement sa coloration étrangère et leur chance de perdurer donc augmente13. Nous y pouvons ajouter également le terme xénismes qui désigne des emprunts qui correspondent au niveau le plus élémentaire. Ils gardent plus ou moins la forme qu’ils avaient dans la langue d’origine mais ils renvoient à des réalités du pays ou de la région où cette langue est pratiquée (p. ex. vodka du russe, pizza de l’italien ou fado du portugais). Les xénismes peuvent être « naturalisés » en désignant des emprunts qui, tout en gardant leur forme originale, ont fini par désigner des réalités nouvelles dans la langue d’arrivée et peuvent donc être considérés comme le premier stade de l’emprunt14.

1.2. Emprunts à l’arabe parmi les autres types d’emprunts lexicaux

Les langues ne connaissent pas les frontières, elles émigrent d’une culture à l’autre et s’enrichissent mutuellement. Le français depuis le XIIe siècle jusqu’à nos jours n’arrête pas à adopter des mots des langues fort diverses. Bien sûr que la contribution des langues particulières n’est pas la même. Nous pouvons constater que l’anglais, l’italien et la germanique ancien ont enrichi considérablement le lexique français tandis que l’apport d’autres langues est plus ou moins réduit. Nous pouvons observer les chiffres plus précis dans l’ouvrage d’Henriette Walter l’Aventure des mots français venus d’ailleurs même si l’auteure elle-même dit que :

[...] il est toujours hasardeux de donner des chiffres [...], certains (mots d’une langue) d’entre eux tombent lentement et imperceptiblement dans l’oubli, tandis que des créations indigènes ou des emprunts aux autres langues pénètrent sans discontinuer dans l’usage, au gré des besoins et des rencontres15.

Néanmoins son étude de 1991 rappelle, qu’en français, sur 60 000 mots d’un dictionnaire usuel, sont approximativement 8600 mots d’origine étrangère, ce qui correspond à un peu plus de 14%. Si on garde seulement 35 000 mots, on aboutit à environ 4200 mots courants d’origine étrangère, ce qui correspond à un peu moins de 13%. En ce qui concerne la

13 Henriette WALTER, L’Aventure des mots français venus d’ailleurs, Paris, LGF - Livre de Poche, 1999, pp. 253 – 256. 14 Nurcan Delen KARAAGAÇ, « Sur l’innovation lexicale et l’intégration phonétique et sémantique de quelques emprunts lexicaux en français et en turc », Synergies Turquie, 2009, n° 2, p. 151. 15 Henriette WALTER, L’Aventure…, op. cit., p.17. 12

répartition par langues de ces 4 200 mots empruntés, ses résultats montrent une distribution suivante :

- anglais 25% - italien 16,8% - germanique ancien 13% - dialectes gallo-romans 11,5% - arabe 5,1% - allemand 3,9% - langues celtiques 3,8% - espagnol 3,7% - néerlandais 3,6%16

Or, ce n’est pas seulement la quantité d’emprunts qui nous intéresse. Une autre remarque concerne les catégories grammaticales des mots empruntés. Dans son article La langue française et les mots migrateurs Henriette Walter mentionne, que la grande majorité, à savoir 90%, d’emprunts sont des substantifs. Les verbes empruntés, dont la majorité provient du germanique ancien, atteignent environ 6%, les adjectifs 3% et les adverbes moins de 1%17. Dans notre corpus (dans lequel 100% = 48 arabismes) nous avons trouvé 67% de substantifs, 13% de verbes, 10% d’interjections, 6% de locutions et seulement 2% représentent les adjectifs et les adverbes. La troisième remarque concerne la chronologie des emprunts. Les emprunts les plus anciens en français proviennent du gaulois et, à partir du Ve siècle, également du germanique ancien. Grâce au commerce oriental, le vocabulaire français médiéval puise surtout de trois sources : arabe, italien et néerlandais. Mais ce sont également les langues régionales qui ont enrichi le vocabulaire français au Moyen Âge. Ensuite, dans l’époque de la Renaissance, ce sont les emprunts à l’italien qui prédominent. En effet, c’est à l’italien que le français a emprunté le plus jusqu’au milieu du XXe siècle. Au siècle suivant, ce sont les mots de l’espagnol et du portugais qui arrivent en France avec des conquêtes. Au XVIIIe siècle, les emprunts à l’anglais commencent à être introduits en français ce qui continue encore plus considérablement pendant le siècle suivant et culmine au XXe siècle pendant lequel le

16 Henriette WALTER, L’Aventure…, op. cit., pp.17 – 20. 17 Henriette WALTER, « La langue français et les mots migrateurs », Synergies Italie, 2008, n° 4, p. 16. 13

vocabulaire anglais et américain arrive abondamment et s’implante assez facilement en français18.

1.3. Arabismes au cours de l’histoire

Depuis Moyen Âge, le français a emprunté et gardé une quantité considérable de mots arabes (plus de 20019) en puisant de différentes sphères de vie humain, surtout celles du savoir, des échanges commerciaux et de la culture. Quant au vocabulaire savant, les Arabes ont recueilli le savoir des Grecs et des Hindous et c’était grâce aux traductions du grec à l’arabe, puis de l’arabe au latin, à l’espagnol ou à l’italien que les textes scientifiques ont été diffusés dans le monde occidental. Surtout des médecins, des astronomes, des alchimistes, des pharmaciens, des mathématiciens mais aussi des botanistes ont puisé à la science arabe. Le vocabulaire du commerce n’était plus diffusé par les livres. C’étaient des navigateurs et des commerçants arabes qui ont sillonné la Méditerranée et joué le rôle d’intermédiaires. Ils ont introduit aux Occidentaux de nouveaux produits inconnus comme divers types des épices, des fruits et des légumes, des fleurs et des animaux mais aussi le vocabulaire que désignait ces réalités exotiques. Le vocabulaire de la culture reflète des contacts et des échanges humains. Par la voie pacifique du commerce ou par la voie plus violente de l’occupation, le monde arabe a fourni à l’Occident le vocabulaire concernant de nouvelles structures commerciales (la navigation, la pesée, les taxes etc.), de nouvelles manières de vivre (l’équipement de la maison, les vêtements, les matières, les couleurs, les jeux etc.) mais aussi le vocabulaire désignant des titres arabes des souverains, chefs religieux ou militaires. À la fin de XIXe siècle et dans la première moitié du siècle suivant, après la colonisation française de l’Afrique du Nord, arrive en français le vocabulaire prélevé de l’arabe parlé au Maghreb et apporté par les soldats français. Ces mots font partie de l’argot français. Et enfin, c’est le vocabulaire également lié à des mouvements de population – le vocabulaire magrébin utilisé en France par des immigrés du Maghreb qui fait partie de l’argot des banlieues (voir infra) et qui parfois enrichit le français familier20.

18 Marie TREPS, Les mots voyageurs. Petit histoire du français venu d’ailleurs, Paris, Seuil, 2003, pp. 12 – 14. 19 Ibid., p. 21. 20 Ibid., pp. 22-64. 14

Nous pouvons donc distinguer trois époques importantes21 pendant lesquelles l’arabe a influencé le lexique français :

Moyen Âge (de termes savants d’origine arabo-persane souvent véhiculés par des langues intermédiaires : l’espagnol, l’italien, le latin médiéval); Renaissance (surtout le termes de la domaine des sciences et des techniques véhiculés soit par l’intermédiaire de l’italien soit directement); XIXe et XXe siècles (les termes liés à la colonisation de l’Afrique prélevés directement dans l’arabe parlé au Maghreb).

Dans les chapitres suivants (et surtout dans le chapitre concernant l’analyse lexicographique, voir §4), nous allons observer de quelle période proviennent les emprunts à l’arabe de notre corpus.

1.4. Langue arabe

L’expansion de la langue arabe a été faite en étapes. Au Ve siècle, l’arabe était parlé seulement dans une partie assez grande de la péninsule Arabique. À partir du milieu du VIIe siècle, l’arabe a subi une expansion considérable avec la naissance de l’islam et avec la diffusion du Coran. Le rayonnement de la langue et également de la culture arabes est lié avec des conquêtes territoriales22 pendant le Moyen Âge où la Mecque et Médine ont été des centres religieux et intellectuels importants. Dans cette époque-là, l’arabe est une des grandes sources pour la culture occidentale et il l’influence dans les divers domaines23 (voir infra §1.3.). On distingue deux grandes vagues d’expansion musulmane. La première vague, vers des pays situés hors de la péninsule Arabique, a commencé après la mort du prophète

21 Le Nouveau Petit Robert de la langue française 2009. Dictionnaire alphabétique et analogique de la langue française. (Version CD-ROM). 22 La conquête de la Palestine (638), de la Syrie (636), de la Mésopotamie (642), de l’Égypte (644), du Maghreb (676), de l’Espagne (711-716). 23 Le Nouveau Petit Robert de la langue française 2009. Dictionnaire alphabétique et analogique de la langue française. (Version CD-ROM). 15

Mahomet par la conquête des pays voisins. La deuxième vague (661 – 750) s’est déroulée sous le règne de la dynastie des Omeyyades et maintenant on parle d’un Empire arabe24.

Carte nº 1 : Carte de l’expansion musulmane du VIIe au IXe siècle25 :

Le XIIIe siècle est le début du déclin de l’Empire musulman et également de la langue arabe. Les contacts entre le monde arabe et l’Occident sont limités jusqu’à XIXe siècle où commencent les interventions militaires européennes en Afrique (campagne d’Égypte de Napoléon et les conquêtes coloniales de la France en Afrique du Nord). À partir de ce moment l’arabe (essentiellement l’arabe maghrébin : algérien, marocain, tunisien), recommence à influencer le français26. Les militaires français ont donc apporté les mots de l’arabe parlé au Maghreb qui ont été injectés surtout dans l’argot français27. Et enfin, après la décolonisation et l’indépendance des pays nord africains, ce sont les enfants des immigrés venus en France qui aujourd’hui, en trouvant leurs racines et en revendiquant une identité culturelle, « vont se faire les ambassadeurs d’un vocabulaire maghrébin qui vient à point pour renouveler notre français familier28 ». Actuellement, la langue arabe est une langue la plus parlée au Proche-Orient et en Afrique du Nord. Comme il y a à peu près 200 millions de locuteurs natifs, l’arabe est une

24 Henriette WALTER, Bassam BARAKÉ, Arabesques, l’Aventure de la langue arabe en Occident, Paris, Robert Laffond, 2006, pp. 31 – 33. 25 Ibid., p. 33. 26 Le Nouveau Petit Robert de la langue française 2009. Dictionnaire alphabétique et analogique de la langue française. (Version CD-ROM). 27 Marie TREPS, Les mots voyageurs…, op. cit., p. 23. 28 Ibid. 16

des langues numériquement les plus importantes au monde entier29. Il est langue officielle dans une vingtaine de pays, soit seule, soit avec d’autres langues. Dans la carte suivante sont nommés seulement les pays où l’arabe est la langue officielle30.

Carte nº 2 : Pays où l’arabe a une position de la langue officielle31

En ce qui concerne son origine, l’arabe appartient aux langues dites chamito- sémitiques dont le sémitique est représenté en particulier par l’arabe et aussi par l’hébreu, la langue de la Bible. La langue arabe se présente sous trois formes principales : l’arabe classique, langue du Coran, parlée au VIIe siècle, l’arabe standard moderne, une langue écrite et de l’administration, qui est la langue officielle des pays de la Ligue arabe32, mais qui n’est la langue maternelle de personne. Et finalement, les dialectes qui sont quotidiennement parlés dans les pays arabes, et qui sont assez différents de l’arabe standard et parmi lesquels l’intercompréhension n’est pas toujours facile. Les dialectes les plus parlés en France soit par citoyens français, soit par résidents étrangers sont les formes libanaise, égyptienne, syrienne et en particulier la forme maghrébine33. Le dialecte maghrébin a une forte influence sur le langage des jeunes, quelle que soit leur origine et ce sont des emprunts du dialecte maghrébin

29 Olivier BAUDE, Jean SIBILE, « L’arabe en France », Langues et cité, octobre 2009. n° 15, p. 1. 30 Sur la carte ne sont pas représentées les îles Comores où l’arabe est également une des langues oficielles (avec le français et le shikomori). 31 Henriette WALTER, B. BARAKÉ, Arabesques…, op. cit., p. 106. 32 La ligue arabe est composée de 21 membres. Les dix pays fondateurs, en 1945 sont : l’Arabie Saoudite, le Bahreïn, l’Égypte, les Émirats Arabes Unis, l’Irak, la Jordanie, le Koweït, le Liban, la Syrie et le Yémen. Les onze membres suivants y ont adhéré plus tard : l’Algérie en 1962, Djibouti en 1977, la Libye en 1953, le Maroc en 1958, la Mauritanie en 1973, Oman en 1971, le Qatar en 1971, la Somalie en 1974, la Tunisie en 1958, le Soudan en 1956 et l’Organisation de Libération de la Palestine en 1976. 33 O. BAUDE, J. SIBILE, « L’arabe en … », art. cit., p. 1. 17

qui font une partie considérable de notre corpus. C’est pourquoi nous allons le traiter plus en détail dans la partie suivante.

1.4.1. Arabe maghrébin

L’arabe maghrébin est une des langues maternelles, à côté des langues berbères34, au Nord de l’Afrique, plus précisément au Maroc, en Tunisie et en Algérie mais également en Mauritanie et en Lybie. Il est nommé aussi darja/darija au Maghreb35. L’arabe maghrébin comporte différents dialectes (dont les plus importants sont l’arabe marocain, l’arabe algérien et l’arabe tunisien) parmi lesquels il y a en général l’intercompréhension. Même si la population du Maghreb compte approximativement 80 millions d’habitants et l’arabe maghrébin est une langue maternelle de la plupart d’entre eux, il n’a aucun statut officiel et il n’est considéré que comme un dialecte36. Il est parfois considéré comme inférieur à l’arabe standard. Il est également souvent dévalorisé bien que ce soit une langue de l’identité du peuple du Maghreb, de leur culture, de la communication quotidienne. C’est l’arabe standard qui est considéré comme la langue de l’écrit, des médias et de l’enseignement, tandis que l’arabe maghrébin comme la langue de l’oral. Or, ce n’est pas seulement la langue de la communication orale. Il est également utilisé par les habitants du Maghreb comme la langue de la littérature (il existe des pièces de théâtre, des proverbes, poèmes, contes, devinettes etc. en arabe maghrébin) et comme la langue des médias. Christophe Pereira signale des tendances au Maroc de créer une chaîne de télévision uniquement en arabe maghrébin37. L’arabe maghrébin est également une langue écrite, avec la graphie soit arabe (p. ex. dans les publicités ou dans certains journaux et magazines, dans le code de la route au Maroc), soit latine (utilisé p. ex. dans les SMS, dans les chats ou dans les courriels), soit hébraïque. Pereira mentionne encore que :

34 C’est un groupe de langues de la famille chamito-sémitique, qui compte une trentaine de langues parlées par plus de 20 millions de personnes notamment au Maroc, en Algérie et en Libye. Parmi ce langues, nous pouvons citer le kabyle, le tamazight ou le chaouïa. 35 Dominique CAUBET, Les mots du bled, Paris, L’Harmattan, 2004, p. 10. 36 Christophe PEREIRA, « L’Arabe maghrébin », Communication au colloque international "Langues d’Europe et de la Méditerranée", Nice, 2005, p. 3. 37 CH. PEREIRA, « L’Arabe maghrébin…», art. cit., p. 4. 18

[...] les linguistes qui se sont intéressés à l’arabe maghrébin, depuis la fin du XIXe siècle, par souci de précision, ont noté l’arabe maghrébin au moyen d’une transcription en graphie latine phonétique, étant donné que la graphie arabe ne permet pas de transcrire fidèlement toute la variété phonétique de l’arabe maghrébin et qu’il n’y avait pas de convention orthographique38.

Il nous paraît utile de définir ici deux termes liés avec le passage d’une graphie à l’autre : la transcription et la translittération. Les deux opérations peuvent être utilisées pour noter les mots issus des langues qui utilisent un autre système d’écriture (comme p. ex. l’arabe). Pour représenter les sons effectivement prononcés, on utilise la transcription qui peut être définie ainsi : « transcrire c’est faire correspondre terme à terme les unités discrètes de la langue parlée et les unités graphiques; la transcription phonétique fait aussi correspondre à des phonèmes de la langue des symboles uniques empruntés à l’alphabet phonétique internationale39 ». La translittération consiste en « rechercher, pour chaque lettre ou suite de lettres, une lettre ou une suite de lettres correspondante sans s’inquiéter des sons effectivement prononcés40 ». Pour illustrer ces définitions, mentionnons un exemple de notre translittéré en graphie ,تونح : corpus : le mot hanout, « épicerie, boutique », en graphie arabe latine comme ḥanūṭ et transcrit (à l’aide de l’alphabet phonétique internationale) comme ħanuːtˁ.

1.4.2. Arabe maghrébin en France

L’arabe maghrébin fait également partie des langues de l’Europe. Il s’agit d’une langue maternelle de millions de personnes originaires des pays du Nord de l’Afrique, vivant en Europe. En France, l’arabe est pratiqué quotidiennement par plus de 3 millions de personnes majoritairement sous une de ses variantes maghrébines. Près de 10%41 de population française (immigrés, rapatriés, harkis42 et leurs descendants) ont un lien personnel avec l’Afrique du Nord et donc également avec l’arabe maghrébin ou le berbère. De plus,

38 CH. PEREIRA, « L’Arabe maghrébin…», art. cit., p. 4. 39 J. DUBOIS et al. : Grand dictionnaire…, op. cit., p. 489. 40 Ibid., p. 494. 41 Dominique CAUBET, « La "darja", langue de culture en France », Revue Hommes et migrations, 2004, n° 1252, p. 43. 42 Militaires autochtones d’Algérie qui servaient comme supplétifs aux côtés des Français. 19

l’arabe maghrébin est présent dans la Charte européenne des langues régionales ou minoritaires. Cette liste des langues de France a été dressée par le rapport de Bernard Cerquiglini à la demande du Premier Ministre Lionel Jospin en 1999. Or, des apports culturels et sociaux des immigrés à la société française ont été et sont toujours dévalorisés ou sous- estimés malgré des changements profonds sur la scène culturelle française en particulier. Ainsi, depuis une vingtaine d’années, de nombreux éléments venus du Maghreb ont été acceptés et leur culture valorisée. Ce changement est expliqué par Dominique Caubet ainsi : « Il ne s’agit donc plus de considérer que l’on se trouve ‘entre deux cultures’ ou dans des cas de ‘métissage’ culturel, mais bien de se référer à un changement au sein même de la culture française, qui, par un processus dynamique, est devenu l’affaire de tous43 ». En France, l’arabe maghrébin est transmis surtout dans le contexte familial. Les enfants grandissant souvent tout en pratiquant (plus ou moins passivement) deux ou trois langues (le français, l’arabe maghrébin et/ou le berbère). Dans l’article d’Alexandrine Barontini qui s’intitule Pratiques et transmission de l’arabe maghrébin en France, l’auteure fait apparaître deux facteurs déterminants qui favorisent la transmission : 1) l’absence de stigmatisation et l’accompagnement dans l’apprentissage par l’entourage, 2) l’utilité, même ponctuelle, de cette connaissance linguistique (pour communiquer avec certains membres de la famille ne parlant pas français par exemple)44. Les langues sont souvent mélangées dans les familles immigrées où les parents n’ont pas une bonne connaissance du français. Leur pratique consiste parfois en une simple insertion de quelques mots français dans l’arabe maghrébin. Le bilinguisme dans les pays où vivent des communautés des langues différentes peut causer « des problèmes linguistiques, psychologiques et sociaux [...]45 ». Il s’agit notamment des familles ou des groupes d’immigrés qui sont « insuffisamment intégrés à leur patrie d’adoption et qui continuent à utiliser dans les relations intérieures au groupe qu’ils constituent la langue de leur pays d’origine46 ». La situation de leurs enfants est différente : ils parlent français et ils ont également une connaissance (parfois seulement partielle ou même passive) de l’arabe maghrébin. Nous parlons également d’un bilinguisme soustractif « quand une des langues en présence est

43 Dominique CAUBET, « La "darja"…», art. cit., p. 34. 44 Alexandrine BARONTINI, « Pratiques et transmission de l’arabe maghrébin en France », Langues et cité, octobre 2009, n° 15, p. 6. 45 J. DUBOIS et al. : Grand dictionnaire…, op. cit., p. 66. 46 Ibid. 20

dévalorisée, ce qui ne permet pas le plein développement des capacités de l’individu47 ». La valorisation sociale de la langue maternelle (dans notre cas l’arabe maghrébin) des enfants issus de l’immigration est faible et c’est la langue seconde (dans notre cas le français) qui est exclusivement valorisée (dans la société en général, à l’école etc.). Or, ce n’est pas seulement au sein de la famille où l’arabe maghrébin est transmis. Il est également médiatisé, comme nous avons déjà mentionné supra, dans la sphère publique par les écrivains, les acteurs, les musiciens, les humoristes originaires de l’Afrique du Nord. C’est sur la scène culturelle que l’arabe maghrébin a dépassé le cadre familial. De ce manière, les artistes rendent hommage à leur culture ou à celle de leurs parents tout en produisant une création originale et moderne. L’emploi de l’arabe maghrébin par des artistes ayant du succès populaire peut véhiculer également une certaine revanche sur les langues dominantes imposées (le français, l’arabe classique). Dominique Caubet l’explique dans son ouvrage Les mots du bled de la manière suivante :

[...] on devine cependant, parfois sous une forme de détachement, un sentiment de colère qui ne s’exprime pas toujours de façon explicite. Comme s’il y avait un lien entre l’utilisation de la langue méprisée qu’est la darja (ou le berbère) et l’expression d’un sentiment de hogra (humiliation, dévaluation systématique)48.

Le troisième « moyen de transmission » de l’arabe maghrébin , à côté des familles et des artistes d’origine magrébine, sont les jeunes qui, même s’ils ne sont pas originaires d’un des pays du Nord de l’Afrique, peuvent communiquer en arabe maghrébin qu’ils apprennent avec leurs amis. Dominique Caubet remarque que : « [...] le sentiment de complicité entre pairs, de partage d’une langue, le plaisir de mélanger les langues chez les bilingues sont des phénomènes qu’il ne faut pas sous-estimer49 ». L’emploi de l’arabe au sein du français a donc une connotation identitaire (voir infra §1.6.).

47 J. DUBOIS et al. : Grand dictionnaire…, op. cit., p. 439. 48 Dominique CAUBET, « Les mots…», art. cit., p. 19. 49 Dominique CAUBET , « Du baba (papa) à la mère, des emplois parallèles en arabe marocain et dans les parlures jeunes en France », Cahiers d’études africaines, 2001, nº 163 – 164,, p. 746. 21

1.5. Banlieue, immigration et langage

Un bon nombre d’immigrés maghrébins en France vit aujourd’hui dans les banlieues des grandes villes (en 1992, 74 % des ménages maghrébins ont habité dans une H.L.M.50)51. Ces dernières apparaissent dès la seconde moitié du XIXe siècle où, avec le grandissement et l’industrialisation des villes, les classes populaires sont partis vers la périphérie des villes – dans les cités dortoirs. Or, une siècle plus tard, plus concrètement depuis les années quatre- vingt, on associe les banlieues françaises à la marginalité et à l’exclusion. Cette crise s’explique par la désindustrialisation et la disparition des sociétés ouvrières, par la mutation non maîtrisée des fonctions du logement social52. Aujourd’hui, les banlieues sont généralement des espaces multiethniques, les personnes vivant dans les banlieues françaises sont de la plupart issues de l’immigration, principalement maghrébine ou subsaharienne mais également portugaise, espagnole ou slave et les banlieues deviennent donc des lieux où se rencontrent diverses cultures, langues et parlers. Les immigrés sont venus en France pour trouver de meilleures conditions de vie. En réalité, ces populations sont souvent marginalisées suite à leurs difficultés socio-économiques. De plus, ils perdent une partie de leur identité culturelle. La position de leurs descendants peut être encore plus difficile. Selon les études sur les conditions sociales de ces jeunes, les jeunes immigrés sont encore plus défavorisés que les jeunes de souche française même s’ils appartiennent à la même couche sociale. Emmanuel Vaillant explique ce phénomène ainsi :

Quant à leurs enfants, français pour la plupart, ils se définissent souvent comme étant « entre deux cultures ». L’une, réelle et quotidienne est le résultat de leur participation à la société dont ils sont membres. L’autre, plus diffusé, exprime une sorte de fidélité à des origines familiales, connues ou inconnues, mais bien présentes dans les esprits par la façon de se désigner ou d’être désignés : « Beurs », « Blacks », etc.53.

50 Habitation à loyer modéré : immeuble construit par une collectivité et affecté aux foyers qui ont de faibles revenus. 51 Annie FOURCAUT, « Les banlieues populaires ont aussi une histoire », Ceras - revue Projet n°299, Juillet 2007. Disponible sur : http://www.ceras-projet.com/index.php?id=2384 [consulté le 2 décembre]. 52 Ibid. 53 Emmanuel VAILLANT, L’immigration, Toulouse, Éditions Milan, 1996, p. 54. 22

À l’adolescence, ils sont souvent au chômage, ils souffrent d’une certaine stigmatisation et du sentiment d’exclusion sociale et ils sont confrontés à une crise de l’identité à cause des valeurs culturelles. La tradition héritée est contradictoire aux valeurs du pays de résidence. Ainsi, on observe chez ces jeunes, des traits du racisme contre les Blancs, nommé « le racisme anti-Blanc » ou « le racisme à l’envers ». Ils refusent d’avoir un avenir identique à celui de leurs parents54. Cette population au marge de la société a donc besoin de se différencier et de se distancier de la culture dominante dans laquelle ils ne trouvent que l’échec. Cela les amène souvent à une différentiation linguistique et donne naissance à une nouveau langage. Le linguiste William Labov parle de le prestige latent (« covert prestige ») qui s’oppose à le prestige apparent (« overt prestige ») d’une langue/ d’un langage55. Le prestige latent consiste en emploi des formes non prestigieuses (s’opposant au bon usage) et il « confère à une variété linguistique un prestige différent du prestige légitime en lui prêtant des valeurs différentes de celles associées à la variété légitime56 ». Le langage employé par les jeunes des cités français est également le « porteur » de ce prestige latent. Les linguistes le dénomment différemment : Goudaillier « français contemporain des cités », Trimaille « parlers des jeunes urbains », Boyer « langue des cités ». Les personnes habitant dans ces quartiers sensibles le nomment eux-mêmes « verlan », d’autres « argot », voire « racaille- mot» (« mots de la racaille »).57 L’usage de ce langage reflète une solidarité, la reconnaissance parmi les jeunes et l’exclusion des autres. Goudaillier mentionne que pendant le XXe siècle « les argots de métiers cèdent progressivement la place aux argots sociologiques58 ». La fonctionne cryptique (crypto- ludique) est essentielle pour les argots de métiers, tandis que la fonction identitaire occupe la place secondaire. Par contre, c’est la fonction identitaire qui l’emporte dans les argots sociologiques (et donc également dans les parlers des jeunes urbains) sur la fonction crypto- ludique comme le montre le tableau suivant59. Sourdot se pose également la question sur la

54 Louise DABÈNE, Jacqueline BILLIEZ, : Le parler des jeunes issus de l’immigration, In : VERMÈS, Geneviève, BOUTET, Josiane (dirs.), France, pays multilingue, Paris, L’Harmattan, 1987, p. 63. 55 William LABOV, The social stratification of English in New York City, Washington, Center for Applied Linguistics, 1966. 56 Anne-Marie BROUSSEAU, « Identités linguistiques, langues identitaires : synthèse », Arborescences : revue d’études françaises, 2001, n° 1. p. 8. 57 Jean-Pierre GOUDAILLIER, « De l’argot traditionnel au français contemporain des cités », La linguistique, 1/2002, vol. 38, p. 9. 58 Ibid., p. 13. 59 J.-P. GOUDAILLIER, « De l’argot traditionnel…», art. cit, p. 13. 23

position de la fonctionne cryptique dans les argots. Il l’illustre à l’exemple de l’argot des petites trafiquants de drogue et celui d’école. Il dit que dans le premier cas, la fonction cryptique est centrale, même si elle est également accompagnée par le « renforcement du sentiment au même groupe social » et par le « plaisir ludique ». Cependant dans l’argot d’école « l’enjeu cryptique s’efface bien vite devant l’enjeu initiatique, puis ludique et connivenciel60».

Tableau nº 1 : Importance des fonctions linguistiques dans les argots de métiers/sociologiques selon J.-P. Goudaillier Argots de métiers Argots sociologiques 1. fonctions crypto-ludiques fonctions identitaires 2. fonctions identitaires fonctions crypto-ludiques

Le parlers des jeunes urbains renouvellent constamment : quand un mot (ou une expression) perd son expressivité, il est remplacé par un autre. Il est donc riche en synonymes et en polysèmes qui sont le résultat de création lexicale variée. Parmi ces procédés nous pouvons distinguer les procédés sémantiques (p. ex. l’emprunt à divers langues et parlers61, l’utilisation des mots issus du vieil argot français, la métaphore, la métonymie) et les procédés formels (p. ex. la déformation du type verlanesque, la troncation, la troncation avec ressufixation ou le redoublement hypocoristique)62.

1.6. Rôle des arabismes dans les parlers jeunes

Avant de commencer à décrire la situations concrète des arabismes dans les parlers jeunes, nous voudrions brièvement répondre à deux question : Comment définit-on les parlers jeunes? Et quelle est le rôle des banlieues? Catherine Miller et Dominique Caubet distinguent deux grands types des parlers des jeunes : a) le parler des jeunes en rupture avec la société mainstream associé aux ghettos ou quartiers défavorisés, b) le parler des jeunes « branchés » associés aux espaces créatifs et

60 Marc SOURDOT, « Argot, jargon, jargot », Langue française, 1991, n° 90, pp. 16 – 17. 61 Goudaillier y mentionne en particulier les mots d’origine arabe (littéral/maghrébin), mots d’origine tsigane, mots d’origine africaine, mots empruntés à l’argot anglo-américain et mots empruntés à parlers locaux de France. 62 J.-P. GOUDAILLIER, Comment tu tchatches ! Dictionnaire du français contemporain des cités, Maisonneuve & Larousse, Paris, 2001, p. 17. 24

médiatiques que s’inspire d’une culture de la rue.63 C’est donc le langage provenant des banlieues qui peut inspirer les parlers des jeunes en général. Alena Podhorná-Polická et Anne-Caroline Fièvet expliquent que la situation en français est complexe quant aux sociolectes générationnels. Elles utilisent le terme argot commun des jeunes, pour dénommer le sociolecte fondé sur l’opposition au mode d’expression des adultes, et le terme argot commun des jeunes des cités, pour désigner les micro-argots des quartiers sensibles64. Elles précisent, pareillement que Catherine Miller et Dominique Caubet, que :

[...] dans la France actuelle, on observe une certaine « scission » […] dans le cadre des sociolectes générationnels. Cette scission, qui distingue la jeunesse des milieux plutôt aisés et les locuteurs du « français contemporain des cités », est fondée sur le critère d’auto-identification avec la « culture des rues » de ces derniers65.

La particularité des parlers jeunes réside, à côté de quelques particularités phonétiques et syntaxiques, surtout dans son lexique. La professeure Françoise Gadet explique dans l’interview pour la revue Langues et cité que les différences par rapport à l’argot traditionnel résident principalement « dans l’intensification des emprunts et la diversification des sources66 ». Cyril Trimaille et Jacqueline Billiez parlent de la dynamique plurilingue qui est illustrée par le présence des emprunts (notamment à l’arabe) dans les parlers des jeunes urbains67. Nous observons déjà dans le vieil argot la présence des emprunts aux langues d’immigration (des mots gitans, manouches et également arabes). Mais aujourd’hui, ce sont les jeunes nés en France, issus de l’immigration maghrébine, qui les introduisent en français. Ces jeunes ne connaissent pas trop la culture de leurs parents, ils ont une connaissance plus ou moins passive de la langue arabe et sont considérés comme des Français par leurs cousins du

63 Dominique CAUBET, Catherine MILLER, « Parlers jeunes - entre street language et branchitude », Revue Economia, 2011, n° 12, p. 69. 64 Alena PODHORNÁ-POLICKÁ, Anne-Caroline FIÉVET, « Argot commun des jeunes et français contemporain des cités dans le cinéma français depuis 1995 : entre pratiques des jeunes et reprises cinématographiques », Glottopol, revue sociolinguistique en ligne, 2008, n° 12, p. 213. 65 Ibid. 66 Olivier BAUDE, « La langue des jeunes », entretien avec Françoise Gadet, Langues et cité, septembre 2003. n° 2, p. 2. 67 Jacqueline BILLIEZ, C. TRIMAILLE, « Pratiques langagières de jeunes urbains: peut-on parler de ‘parler’»?, GALAZZI, Enrica, MOLINARI, Chiara (éds.), Les Français en émergence, Berne, Peter Lang, 2007, p. 98. 25

« bled » mais aussi comme « Beurs » à travers le prisme français68. Pourtant ils emploient l’arabe au sein du français. On appelle cette variation des codes l’alternance de codes ou le code-swiching. Il s’agit d’une stratégie de communication dans laquelle un individu utilise dans le même échange deux langues différentes, « par l’alternance de compétence, le bilingue se met en représentation comme apte à utiliser les deux codes69 ». Cela fonctionne comme une marque identitaire qui aide les jeunes des quartiers à affirmer leur originalité dans le milieu social et culturel complexe. Nous nous permettons de mentionner également la citation d’une fille d’origine algérienne trouvée dans le dictionnaire Comment tu tchatches! 70 qui selon nous illustre bien la fonction identitaire des arabismes :

« … je suis musulmane et française d’origine algérienne. Je m’appelle Malika, ça parle de soi. Nous, les rebeus, quand on se réveille le matin, on ne se tape pas la tête contre les murs en regrettant d’être rebeus … Entre nous quand on parle français on dit toujours quelques expressions arabes, ça nous rapproche, c’est un signe d’affection et de complicité. En plus, comme ça énerve les gens autour de nous, on dit encore plus, on montre qu’on est différents… » (Malika, étudiante demeurant en banlieue parisienne, à Montfermeil, (Le Figaro, 24 janvier 1996)

Dans leur recherche, Louise Dabène et Jacqueline Billiez ont montré que même si les jeunes Algériens ont soit une certaine connaissance passive (ils arrivent à comprendre leurs parents) ou une connaissance presque nulle de l’arabe, ils attribuent, eux-aussi, une valeur symbolique très forte à l’arabe et ils l’emploient également dans les lieux publics (café, bus) pour montrer leur appartenance d’une façon provocante mais avec fierté71. En plus, les jeunes issus de l’immigration magrébine sont souvent des « leaders » des groupes ce qui également joue un rôle non négligeable dans la diffusion des emprunts à l’arabe72. Iryna Lehka- Lemarchand y ajoute :

68 Isabelle ANZORGUE, « Du bledos au toubab », Le français en Afrique, 2006, n° 21, p.62. 69 J. DUBOIS et al. : Grand dictionnaire…, op. cit., Paris, pp. 30-31. 70 J.-P. GOUDAILLIER, Comment tu tchatches…, op. cit., p. 8. 71 Louise DABÈNE, Jacqueline BILLIEZ, « Le parler des jeunes …», art. cit., , p. 67. 72 Alena PODHORNÁ-POLICKÁ, Anne-Caroline, FIÉVET, « Approximations perceptives des locuteurs et éclaircissements stylistiques des auteurs : les arabismes à la lumière de l’argot des jeunes (des cités) », In Intrangers. Post-migration et nouvelles frontières de la littérature beur. Bruxelles: Academia Bruylant, 2011. p. 78. 26

Leur culture, celle du rap et du hip-hop, leur manière de s’habiller et surtout leur langage dénotent la quête d’un statut particulier, d’une nouvelle identité, leur permettant d’affirmer leur spécificité propre, en revendiquant leur appartenance à deux milieux culturels disponibles : celui de leurs origines et celui de leur pays d’accueil73.

Or, ce ne sont pas seulement les jeunes issus de l’immigration qui prolongent les pratiques bilingues de leurs familles et qui utilisent les mots ou les expressions arabes. L’emploi des arabismes devient une marque identitaire des jeunes en général. Il peut donc marquer une appartenance géographique (département, quartier, cité), une représentation sociale (classe populaire), et/ou une appartenance ethnique (franco-maghrébin)74. À côté de la fonction identitaire qui occupe la première place dans les parlers des jeunes urbains (voir supra §1.5.), c’est également la fonction cryptique de ce parlers dans laquelle les arabismes jouent un certain rôle. Comme les procédés morphosémantiques traditionnels (le verlan, les métaphores etc.) de certains mots ou expressions sont parfois faciles à décoder, l’emploi des emprunts à l’arabe assure une certaine fonction cryptique parce qu’ils sont opaques pour ceux qui ne connaissent pas le langage. Louise Dabène et Jacqueline Billiez, qui se sont intéressées de l’emploi de la langue d’origine des immigrés dans le groupe de pairs, confirment que les jeunes Algériens (surtout des garçons) affirment utiliser l’arabe dialectal dans circonstances particulières comme un « code secret »75. De plus, comme le disent Alena Podhorná-Polická et Anne-Caroline Fièvet dans leur article Emprunts dans l’argot des jeunes Tchèques et Français, cette opacité sémantique des emprunts « a pour conséquence le renforcement identitaire des membres du réseau (endogroupe) vis-à-vis des non-initiés (exogroupe)76 ». Il ne faut pas non plus oublier la fonction ludique, la preuve d’une grande créativité individuelle qui également accompagne tous les parlers des jeunes. Voici un exemple pour tous : le terme de l’arabe lascar, verlanisé en scarla, puis par suffixation la forme féminine scarlette et enfin il y a le terme Scarlett O’Hara désignant une fille, une jeune femme (CTT).

73 Iryna LEHKA-LEMARCHAND, Accent de banlieue. Approche phonétique et sociolinguistique de la prosodie des jeunes d’une banlieue rouennaise, Thèse de doctorat sous la direction de Claude Caitucoli et David Le Gac, Rouen, Université de Rouen, 2007, p. 36. 74 Ibid. 75 Louise DABÈNE, Jacqueline BILLIEZ, « Le parler des jeunes…», art. cit., p. 67. 76 Alenea PODHORNÁ-POLICKÁ, Anne-Caroline FIÉVET, « Emprunts dans l’argot des Jeunes Tchèques et Français », In : KACPRZAK, Alicja, GOUDAILLIER, J.-P. (éds.), Standard et périphéries de la langue, Lodz - Lask : Oficyna Wydawnicza Leksem, 2009, p. 48. 27

Alors, même si les jeunes vivent en banlieue ou pas, même s’ils sont issus de l’immigration ou pas, ils s’inspirent aux « parlers des jeunes urbains », ils s’expriment comme les jeunes immigrés provenant des banlieues. Comme des relais de ces parlers fonctionnent souvent les médias et les vedettes populaires d’origine maghrébine. Dominique Caubet mentionne par exemple le rôle de Jamel Debbouze, un comédien d’origine marocaine, qui « permet une identification des jeunes, qu’ils soient d’origine maghrébine ou non, que sa façon de parler est en fait une caricature du parler jeune, des banlieues, mais aussi des villes77». Et c’est par là que les arabismes quittent les « quartiers défavorisés » et apparaissent dans les quartiers chics ou milieux intellectuels. C’est également la culture rap, dont nous allons parler dans le chapitre suivant, qui joue le rôle important dans ces « transmission » et « propagation » des arabismes et dans la valorisation des pratiques langagières des jeunes de banlieues.

1.6.1. Influence des arabismes sur le français

Les parlers des jeunes sont influencés par l’arabe (maghrébin en particulier) non seulement au niveau lexical mais également au niveau syntaxique, phonique ou prosodique. Or, l’influence des arabismes est le plus visible au niveau lexical. C’était déjà le vieil argot qui a emprunté à l’arabe et ces emprunts sont présents en français jusqu’à nos jours (p. ex. bled, toubab, clebs etc.). Or, aujourd’hui, l’ampleur est toute différente et il ne s’agit plus d’emprunt, mais d’une véritable imbrication78. Ce sont pour la plupart des « emprunts de luxe» qui ont un synonyme familier dans la langue française. C’est la riche synonymie dont nous avons parlé supra qui existe dans les parlers des jeunes et qui est un moyen de renouvellement incessant. Les mots et les expressions arabes sont adoptés non seulement par les parlers des jeunes urbains mais également par toute une classe d’âge des jeunes. Mentionnons quelques exemples – des substantifs : hala (fête), kahba (pute), hnouches (policiers), hogra (humiliation); des adjectifs : meskine (pauvre), kahlouch (noir). Ce sont également des verbes qui sont intégrés en français. Ils sont soit conjugués comme les verbes français : kiffer (apprécier), choufer (regarder), soit intégrés sous une forme figée et ne se conjuguent pas. On intègre également des interjections provenant de l’arabe dialectal : zarma

77 Dominique CAUBET, « Quelques aspects de la présence maghrébine dans la culture urbaine en France », Ethnologies, 2001, vol. 22, nº 1, p. 253. 78 Dominique CAUBET, « La "darja"…», art. cit., p. 43. 28

(ma parole!), hendek (attention!) ou wech (quoi ?)79. Il est intéressant de remarquer que dans notre corpus, nous avons pu observer un nombre assez élevé d’interjections - 10%, donc troisième groupe le plus large après les substantifs (67%) et les verbes (13%). Les emprunts à l’arabe s’accompagnent souvent d’un glissement de sens, comme par exemple dans le cas du mot seum qui signifie en français « la haine, la rage », tandis qu’à l’arabe « le poison » (voir infra §4.2.1.). Les arabismes concernent souvent les thématiques particulières, liées à la vie en banlieue, celle de la délinquance, des conflits avec la police et du désordre ou des relations filles-garçons. Ils indiquent ainsi que c’est une langue des jeunes, d’un groupe qui affirme sa contre-légitimité80. En ce qui concerne l’intégration des arabismes dans la structure syntaxique française, nous pouvons trouver un nombre élevé de syntagmes comprenant des termes arabes qui y sont déjà intégrés. Voici quelques exemples : faire la hala (faire la fête), mettre le/la dawa (foutre le bordel), kiffer des garos (fumer des cigarettes), avoir de la choune (avoir de la chance) etc. Selon Iryna Lehka-Lemarchand, ces termes témoignant de leur intégration en français et ils :

[…] laissent en effet penser à l’intégration de ceux qui les produisent : ils dénotent l’envie de ces jeunes de valoriser par le biais de cette « arabisation » du français leur identité culturelle mixte et leur appartenance au groupe de pairs, les emprunts à l’arabe ayant en effet acquis depuis longtemps une valeur de marque de l’identité « banlieusarde »81.

Dans les parlers jeunes, nous pouvons trouver également des calques de l’arabe. Voici quelques exemples : l’expression « vas-y » au sens « vas te faire foutre » qui vient de l’arabe populaire rûh takhra, « vas chier (ailleurs) »82; l’expression « j’suis pas venu du bled pour être maçon, j’vais passer ma vie à tenir les murs », un calque de l’arabe algérien ychedoû, « ils tiennent les murs », qui est utilisé pour parler des jeunes chômeurs qui passent les journées adossés au mur83; ou bien une autre « sur la tête de moi », grammaticalement incorrecte,

79 Dominque CAUBET, « Métissages linguistiques ici (en France) et là-bas (au Maghreb) », VEI-Enjeux, septembre 2002, n°130, p. 128. 80 Iryna LEHKA-LEMARCHAND, Accent de banlieue…, op. cit., p. 45. 81 Ibid. 82 Disponible sur : http://www.dilap.com/contributions/banlieue-beur/francais-arabe.htm [consulté le 4 juin 2012]. 83 Isabelle ANZORGUE, « Du bledos…», art. cit., p. 64. 29

provenant de l’arabe dialectal ar-râs ntâ’I où le terme ntâ’ signifie « propriété de » suivi d’un pronom affixe ntâ’I, « de moi, à moi »84. Dans son article Du baba (papa) à la mère, des emplois parallèles en arabe marocain et dans les parlures jeunes en France, Dominique Caubet présente également une hypothèse selon laquelle il est possible de voir un calque syntaxique dans les expressions construites avec sa mère ou sa/ta race. (emploi de baba, « papa », et rās, « tête », en arabe maghrébin, « mère », « race » en français). Même si l’origine de ces expressions dans l’arabe maghrébin n’est pas approuvée, il est probable qu’il y ait une influence parce qu’elles sont produites par les jeunes, familiers de l’arabe maghrébin, qui aiment mélanger des langues et dont la prononciation est, en plus, fortement influencée de l’arabe maghrébin. Elles sont utilisées dans les insultes obscènes (Enculé de ta mère ! Nique ta mère !), avec une appréciation négative (Je suis die, sa race !), mais également avec une appréciation positive (Je la kiffe, sa mère ! C’est un film qui déchire, sa mère)85. L’emploi de l’apostrophe (mon) frère, utilisé pour montrer l’amitié, la complicité est également un calque de l’arabe maghrébin où le terme khûya signifie à la fois « mon frère » au sens familial du terme mais également plus généralement « mon compatriote, mon ami, mon cher ». Il est intéressant de noter que cet apostrophe est également employé par des filles pour se saluer. Cela peut exprimer un certain désir d’être respectées dans un monde des hommes avec leurs valeurs machistes86. L’élément culturel maghrébin n’est pas représenté seulement par ce métissage lexicale et sémantique mais il en est, bien évidemment, également présent de même sur le plan phonique. Une des spéciosités segmentales est l’articulation spécifique de R, d’un R pharyngal qui se forme par un retrait plus important de la langue en arrière vers le pharynx et qui est accompagné d’un dévoiement, amenant ainsi à la perception d’un R constrictif, sourd et fort87. Certains linguistes le qualifient d’« arabisé », en le considérant « tantôt comme produisant un effet d’une consonne venant de l’arabe, tantôt comme une consonne venant effectivement de l’arabe88 », tandis que les autres, même s’ils ne nient pas l’influence arabe, le considèrent plutôt comme un emprunt au français populaire.

84 Disponible sur http://www.dilap.com/contributions/banlieue-beur/beur-vocabulaire.htm [consulté le 18 juillet 2012]. 85 Dominique CAUBET, « Du baba (papa)…», art. cit., pp. 735-748. 86 Isabelle ANZORGUE, « Du bledos…», art. cit., p. 63. 87 Iryna LEHKA-LEMARCHAND, Accent de banlieue…, op. cit., p. 53. 88 Ibid. 30

Nous pouvons voir une autre influence dans la palatalisation des /d/, /t/. Selon certains chercheurs, comme dans le cas précédent, ce phénomène vient de l’arabe, selon les autres, il est trop délicat de la prouver89. Puis, ce sont des emphatisations de consonnes françaises, notées surtout chez les garçons, en contexte vocalique a. Cette prononciation est réalisée non seulement par des jeunes maghrébins mais également par les jeunes qui n’ont aucun lien géographique ou familial avec le Maghreb90. Un autre trait spécifique est la disparition de l’opposition entre /è/ et /é/. Selon M. Sourdot, c’est également une influence véhiculée par les jeunes issus de l’immigration, des langues romanes et surtout de l’arabe où cette distinction n’est pas pertinente91. En ce qui concerne les éléments suprasegmentaux - l’accent et la prosodie – il y a également plusieurs traits que le français des jeunes urbains a recopié de la langue arabe. C’est l’accentuation des mots ou de la fin de phrase sur l’avant-dernière syllabe, l’usage répété des phrases exclamatives ou bien le claquement de langue marquant l’approbation d’un propos92. Ces spécificités segmentales et suprasegmentales sont prises soit pour novatrices, soit pour héréditaires du français populaire soit, le plus souvent, pour venant de l’arabe. En tout cas, elles influencent la langue de banlieue. Dominique Caubet l’explique ainsi :

Cette prononciation du français sert sans doute à marquer au départ une appartenance au groupe, un attachement aux racines, avec une fonction identitaire forte, mais elle est pratiquée par des jeunes qui n’ont pas de racines au Maghreb. Elle est donc passée de la marque d’une identité « maghrébine » à celle d’une identité « banlieue » ou « caillera » (racaille en verlan)93.

Nous pouvons appliquer ces mots de Dominique Caubet à la description de la situation des arabismes au sein des parlers des jeunes en général. Sur ces quelques exemples, nous avons tenté de démontrer jusqu’à quel point les arabismes sont présents en français (souvent

89 Iryna LEHKA-LEMARCHAND, Accent de banlieue…, op. cit., p. 53. 90 Dominique CAUBET, « Métissages linguistiques…», art. cit., p. 127. 91 M. SOURDOT, « La dynamique du langage des jeunes », Résonances, 2003, n° 10, p. 4. 92 Isabelle ANZORGUE, « Du bledos…», art. cit., p. 65. 93 Dominique CAUBET, « Métissages linguistiques…», art. cit., p. 127. 31

grâce aux jeunes issus de l’immigration qui mélangent des codes dans leurs familles aussi que parmi leurs amis) et comment ils influencent les niveaux différents de la langue, en particulier dans les parlers des jeunes urbains mais également, plus tard, dans les parlers des jeunes en général.

1.7. Rap, immigration et emprunts

Comme nous avons dit supra (cf. §1.6.), le rap, un mouvement musical et social né à la fin des années 1970 aux États-Unis, est un élément important dans la diffusion des arabismes qui y sont utilisés non seulement par des rappeurs d’origine arabe. Le rap, ainsi que les parlers jeunes, est lié au milieu urbain et subit la même influence. « Les rappeurs s’expriment dans leur art de la même manière que dans leur quotidien. Ce langage mêlant argot, langues étrangères et verlan, est employé dans la vie de tous les jours, lors d’interactions dans le quartier, entre jeunes et entre amis94 ». Les chansons de rap peuvent donc servir d’un indicateur de la fréquence des emprunts, dans notre cas des arabismes, dans les parlers jeunes. Le rap transmet des messages concernant la réalité quotidienne des banlieues, il touche des thèmes actuels comme la violence, la drogue, le racisme, le chômage ou des difficultés dans la famille où à l’école et « il donne une voix aux proscrits, leur permet de scander, de revendiquer, de communiquer sous la forme la plus minimale [...]95 ». Il est devenu un mode de vie des jeunes des cités et il permet de mieux connaître la vie dans les cités. Or, le rap n’est pas seulement l’affaire des jeunes des banlieue, « il touche aujourd’hui des jeunes de tous les milieux sociaux et permet une certaine mobilité sociale pour les rappeurs à succès, originaires – souvent, mais pas exclusivement – des quartiers populaires et de l’immigration96 ». Les jeunes issus de l’immigration jouent un rôle important dans l’invention du rap « à la française » : la recherche de l’identité, les questions sociopolitiques mais également la solidarité avec les pays et langues d’origine apparaissent souvent dans le rap français. Cyrile Trimaille parle également d’un phénomène lié avec les artistes issus de minorités : le

94 Sébastien BARRIO, Sociologie du rap français : État des lieux (2000/2006), Thèse de doctorat sous la direction de Rémy Ponton, Paris, Université Paris VIII, 2007, p. 185. 95 José-Louis BOCQUET, Philippe PIERRE-ADOLPHE, Rap ta France, Paris, Editions 84, 1999, p. 8. 96 Sami ZEGNANI, « Le rap comme activité scripturale : l’émergence d’un groupe illégitime de lettrés », Langage et société, 4/2004, n° 110, p. 66. 32

renversement du stigmate qui est très présent dans le rap et qui consiste « à utiliser, en le considérant comme positif, un trait perçu comme négatif par le groupe majoritaire97 ». Ce n’est pas seulement la thématique mais également le vocabulaire qui est influencé par les jeunes issus de l’immigration. À côté du verlan et d’autres procédés argotiques, ce sont des emprunts aux langues étrangères (soit aux langues d’immigration, soit à l’anglais) qui enrichissent les textes du rap. Dans sa thèse, Sébastien Bario dit à propos du vocabulaire du rap français : « Le rap, dans son vocabulaire et sa manière de parler, a bénéficié des différents flux migratoires de la France, incorporant dans son langage de rue un nombre très important de mots empruntés à différentes langues et dialectes. La culture rap mélange tout ce qu’elle touche98 ». Nous pouvons y donc trouver des mots du créole, de l’arabe, des langues africaines, du manouche, de l’anglais, de l’espagnol ou du portugais99. L’emploi des mots de(s) langue(s) d’origine a une valeur symbolique pour les jeunes issus de l’immigration et il (re)valorisent ainsi leurs appartenances ethnoculturelles. Nous concluons cette partie concernant le rap par la citation à propos du rôle des rappeurs par rapport à des immigrés :

[…] les rappeurs contribuent à créer une culture commune et une solidarité sociale entre groupes minorés. Ils les affirment dans l’espace public pour sortir du dilemme identitaire dans lequel les représentations dominantes ont tendance à les enfermer100.

Le rap français est donc fortement influencé par l’environnement social en ce qui concerne les thématiques aussi que le langage. Les rappeurs expriment ainsi la solidarité envers leurs quartiers, leurs communautés ou leurs familles et les rappeurs issus de l’immigration également envers leurs pays et leurs langues d’origine.

97 Cyril TRIMAILLE, « Rap français, humour et identité(s) », Écarts d’identité, 2001, n° 97, p. 53. 98 S. BARRIO, Sociologie du rap …, op. cit., p. 186. 99 Ibid. 100 C. TRIMAILLE, « Rap français…», art. cit., p. 54. 33

2. Méthodologie du travail

Ce chapitre sera consacré aux phases méthodologiques de notre recherche. En premier temps seront présentés les critères qui ont orienté notre choix de chansons. En deuxième lieu, nous allons décrire successivement des analyses faites à partir des arabismes trouvés dans le corpus.

Premièrement, notre recherche a porté sur la sélection représentative de chansons pour le corpus. Dans le souci de clarté, il a été décidé de baser notre recherche sur le corpus RapCor101, un corpus de chansons de rap français créé et constamment enrichi depuis l’année 2009. Ce corpus a été crée à l’Institut des Langues et Littératures romanes de la Faculté des Lettres de l’Université de Masaryk à Brno sous la direction d’Alena Polická et il représente un ensemble des informations complexes à provenance sûre ce qui s’avère être une tâche difficile dans le cas où les sources sont tirées directement de l’Internet. En établissant le corpus, deux conditions générales ont été fixées:

1. La moitié du corpus sera constituée des paroles des interprètes d’origine arabe et la deuxième moitié par les paroles des interprètes d’origine non arabe.

2. Les chansons choisies seront relativement récentes, c’est-à-dire parues après l’an 2000, la durée de la période sera fixée en fonction du corpus RapCor et nombre des titres susceptibles à être utilisés.

Le souci d’un certain équilibre parmi les interprètes d’origine arabe et non arabe fixé au départ s’est avéré impossible à maintenir, les protagonistes au sein du même groupe étant des origines diverses. Dans ce cas particuliers, il a fallu déterminer quel membre du groupe utilise l’arabisme102. Étant donné la richesse de la production rap en France, il a été indispensable de déterminer une période concrète. Le corpus de notre recherche se base sur les chansons parues entre 2003 et 2008.

101 https://is.muni.cz/auth/do/phil/Pracoviste/URJL/rapcor/index.html 102 Il s’agit des groupes de rap , Beni Snassen et La Rumeur. 34

Après avoir étudié la capacité du corpus RapCor, notre corpus de base a été défini comme un corpus de 80 chansons des années 2003 – 2008 de 8 interprètes (dix chansons de chacun). Or, après le premier repérage des arabismes, le corpus s’est avéré comme insuffisant. Nous avons donc élargi le corpus sur 126 chansons conformes aux deux critères mentionnées ci-dessus.

2.1. Choix des interprètes

Comme nous avons déjà mentionné, le critère d’origine ethnique des interprètes était au départ de la sélection, en vue d’une division de corpus en deux subcorpus distincts selon l’origine des rappeurs. Sera désigné comme l’interprète d’origine arabe celui qui provient du pays où l’arabe est la langue officielle ou dont un parent au moins provient d’un tel pays. Nous avons consulté différents sites sur Internet pour vérifier leur origine ce qui a été relativement simple en ce qui concerne les rappeurs. Voici les tableaux qui présentent l’origine ethnique des rappeurs :

Tableau nº 2 : Rappeurs d’origine arabe Rappeur Origine ethnique Origine du père Origine de la mère Ali marocaine ? ? Booba sénégalo-franco- sénégalaise française d’origine marocaine marocaine Rohff comorienne comorienne comorienne Légende : ? - L’origine des parents n’a pas été découverte

Tableau nº 3 : Rappeurs d’origine non arabe Rappeur Origine ethnique Origine du père Origine de la mère italienne italienne italienne

Diam’s franco-chypriote chypriote-grecque française Disiz la Peste franco-sénégalaise sénégalaise française

Ce critère s’est avéré dans certains cas difficile à déterminer. Au sein de même groupe, l’origine ethnique peut différer d’un membre du groupe à l’autre ou bien l’origine de tous les membres du groupe reste floue, comme le montre le tableau suivant. Dans ces cas-là, il est nécessaire de préciser de quel origine est le membre du groupe ayant utilisé l’arabisme en question, si cela est possible. .

35

Tableau nº 4 : Membres de Fonky Family et leur origine ethnique Fonky Family Origine ethnique Origine du père Origine de la mère l’Artificier algéro-corse algérienne corse (Karim Haddouche) Menzo comorienne ? ? (Mohamed Ali) Le Rat Luciano espagnol- espagnole martiniquaise (Christophe Carmona) martiniquaise Don Choa ? ? ? (François Dilhan) Fel ? ? ? (Karim Laoubi) DJ Djel ? ? ? Pone ? ? ? Légende : ? - L’origine du rappeur et/ou de ses parents n’a pas été découverte

Tableau nº 5 : Membres de La Rumeur et leur origine ethnique La Rumeur Origine ethnique Origine du père Origine de la mère Hamé algérienne algérienne algérienne (Mohamed Bourokba) Mourad algérienne ? ? Ekoué franco-togolais togolaise française (Ekoué Labitey) Philippe guadeloupéenne ? ? DJ Soul G malgache ? ? (Gérald Ramanantsoa) DJ Kool M ? ? ? Légende : ? - L’origine du rappeur et/ou de ses parents n’a pas été découverte

Tableau nº 6 : Membres de Beni Snassen et leur origine ethnique Beni Snassen Origine ethnique Origine du père Origine de la mère Abd Al Malik congolaise congolaise ? (Régis Fayette-Mikano) Wallen marocaine marocaine marocaine (Nawell Azzouz) Mattéo Falkone ? ? ? Hamcho ? ? ? Bil’in ? ? ? N.A.P. (Aissa, Bilal, ? ? ? Mustaaf, DJ Mohammed, Sulee B Wax) Légende : ? - L’origine du rappeur et/ou de ses parents n’a pas été découverte

36

Tableau nº 7 : Rappeurs des groupes classés selon leur origine Origine arabe Origine non-arabe ? Sat l’Artificier Le Rat Luciano Don Choa Menzo Ekoué Fel Hamé Philippe Mattéo Falkone Mourad Abd Al Malik Hamcho Wallen Bil’in N.A.P. Légende : ? - L’origine de ces rappeurs n’a pas été découvert

Suite au classement d’interprètes selon leur origine, il s’est imposé comme nécessaire de diviser notre corpus en trois subcorpus : subcorpus A comprenant les paroles des chansons de trois rappeurs d’origine arabe, - subcorpus B comprenant les paroles des chansons de trois rappeurs d’origine non arabe et finalement subcorpus C comprenant les paroles des chansons de trois groupes de rap dont l’origine est soit arabe, soit non arabe, soit de provenance inconnue, comme le montre le tableau nº 7. En analysant les arabismes du subcorpus C, l’origine du rappeur sera indiquée.

Tableau nº 8 : Albums et nombre de chansons analysées Subcorpus Interprète Album(s) Nombre de (année de publication) chansons analysées Subcorpus A Ali Chaos et Harmonie (2005) 14 Booba Panthéon (2004) 12 Ouest Side (2006) 2 Rohff Au Delà de mes Limites (2005) 7 Code de l’Horreur (2008) 7 Subcorpus B Akhenaton Soldats de Fortune (2006) 14 Diam’s Dans ma Bulle (2006) 13 Brut de Femme (2003) 1 Disiz la Peste Histoires Extraordinaires (2005) 10 Itinéraire d’un Enfant Bronzé (2004) 4 Subcorpus C Beni Snassen Spleen et Idéal (2008) 14 Fonky Family Marginale Musique 14 La Rumeur Regain de Tension (2004) 12 Du Cœur à l’Outrage (2007) 2

37

La liste complète de chansons est présente dans les tableaux no I, II, III (cf. Annexe n° 1). Le tableau contient les informations suivantes : 1. nom de l’interprète ; 2. titre de la chanson ; 3. nom de l’album ; 4. année de publication ; 5. nombre de couplets, refrains et d’autres parties ; 6. code de la chanson (repris du corpus RapCor).

2.2. Recherche des arabismes

La sélection de chansons une fois faite, la recherche des arabismes a pu être effectuée. Il était bien évidemment aisé de repérer les arabismes courants dont la forme graphique est stable comme kiffer, niquer, bled etc. Pour d’autres, nous avons pu observer que leurs formes graphiques diffèrent des formes dans les dictionnaires. Pour vérifier la signification et pour trouver des informations nécessaires pour notre analyse neuf dictionnaires ont été utilisés : trois dictionnaires généraux : Petit Robert 2009, Le Petit Larousse 2009, Le Trésor de la Langue Française informatisé, deux dictionnaires de l’argot : Dictionnaire de l’argot, Dictionnaire du français non-conventionnel et quatre dictionnaires de l’argot des cités : Comment tu tchatches!, Bien ou quoi ?, Lexik des cités, Dictionnaire de la zone (consulté en ligne). Cependant le corpus contient également les expressions où l’origine arabe éventuelle reste difficile à élucider et n’a pas pu être vérifié dans aucun de dictionnaires utilisés. Dans tel cas, il a été indispensable d’avoir le recours aux locuteurs natifs ou à des spécialistes. De même, un certain nombre d’informations a pu être trouvé sur l’Internet.

Tableau nº 9 : Dictionnaires utilisés Dictionnaire Abréviation utilisée Le Nouveau Petit Robert de la langue française, 2009. Version CD-ROM PR Le Petit Larousse 2009 - dictionnaire Multimédia CDROM LR Trésor de la langue française informatisé /en ligne/ TLF Dictionnaire de l’argot, 1990 DA Dictionnaire du français non-conventionnel, 1991 DFNC Comment tu tchatches ! Dictionnaire du français contemporain des cités, 2001 CTT Bien ou quoi ? La langue des jeunes à Ivry et Vitry-sur-Seine, 2004 BQ Lexik des Cités, 2007 LC Dictionnaire de la zone /en ligne/ DZ

38

Après avoir fait la liste complète d’arabismes substandard et après les avoir répertoriés dans le tableau (cf. Annexe no 2), avec des informations suivantes : 1. Arabisme (forme pochette)103, 2. Source, 3. Arabisme (forme dictionnaire), 4. Marque lexicographique, 5. Explication morphosémantique, 6. Signification(s), 7. Datation; une analyse plus approfondie a pu être effectuée.

2.3. Vers le partie analytique

La partie analytique a commencé par une analyse quantitative de notre corpus où le nombre total des arabismes a été déterminé, suivi d’une étude comparative de la fréquence de l’utilisation du tel ou tel arabisme, les arabismes récurrents, leurs formes graphiques, ainsi que le classement de rappeurs utilisant le plus souvent des arabismes dans les textes. Dans cette partie-là, la plateforme TXM a été utilisée. C’est une plateforme aidant les utilisateurs à construire et à analyser tout type de corpus textuel numérique. Un certain nombre des chansons du corpus RapCor est déjà préparé pour son emploi dans cette plateforme (en ce moment104 c’est 757 chansons). Nous avons téléchargé la partie de RapCor préparée pour TXM et sur sa base nous avons créé notre propre corpus comprenant les chansons choisies. Nous y avons pu travailler avec notre propre corpus et en même temps y comparer nos résultats avec les données dans le corpus RapCor entier. Les mots y sont déjà lemmatisés mais comme le logiciel ne reconnaît pas de nombreuses expressions substandard, il a été indispensable de compléter plusieurs emprunts à l’arabe par nous-mêmes. Le tableau qui présente tous les arabismes du corpus avec le nombre d’occurrences dans les chansons se trouve dans les Annexes no 3, le tableau no I.

Dans la deuxième partie de notre analyse, nous nous sommes concentrés sur l’analyse lexicographique et l’intégration des arabismes. Nous avons observé comment sont-ils acceptés par les dictionnaires employés (cf. infra) et ce que nous peut la présence dans les dictionnaires découvrir de leur intégration. Dans cette partie, nous avons également touché l’analyse de différentes formes graphiques, trouvées dans les dictionnaires et dans notre corpus, des arabismes traités. Cette analyse est abordée en détail dans le chapitre suivant.

103 Les noms et les adjectifs ont été mis au singlier, les verbes à l’infinitif. 104 En avril 2013. 39

La troisième partie de la partie analytique est une analyse phonique des arabismes de notre corpus. Nous nous concentrons à la réalisation phonique de nos emprunts en arabe, dans notre corpus et également dans les dictionnaires et nous observons comment les systèmes phoniques du français et de l’arabe influencent leur forme graphique en français. Sur la base de cette analyse, nous proposons des solutions pour la lemmatisation des arabismes du corpus RapCor de certains phonèmes « problématiques » dont les variantes graphiques varient et dont les formes graphiques présentes dans les dictionnaires ne correspondent pas aux mots arabes originels. Dans la partie finale de notre mémoire, nous allons, à l’aide de la méthode des filtres successifs (voir infra §6.) proposer des lemmes des emprunts à l’arabe de notre corpus qui pourront être appliqués pour tout le corpus RapCor.

Le recours aux locuteurs arabophones s’est révélé tout à fait indispensable, notamment au cours de l’analyse phonique, dont un certain nombre était également les spécialistes du domaine. Les personnes consultées sont récapitulées dans le tableau suivant.

Tableau nº 10 : Liste de nos consultants Nom, prénom Domaine de spécialisation BENTERARI, Midou professeur et responsable pédagogique à l’Institut français de Prague, originaire d’Algérie CAUBET, Dominique professeure d’arabe maghrébin à l’INALCO DOSTALÍK, Igor étudiant des études arabes à l’Université Charles de Prague DUBĚDA, Tomáš maître de conférences au département de translatologie à l’Université Charles de Prague LAFFITTE, Roland membre fondateur et secrétaire de la SELEFA (Société d’Études Lexicographiques et Étymologiques Françaises et Arabes)

40

3. Aspect fréquentiel

Dans la partie suivante, nous allons nous concentrer sur l’occurrence des emprunts à l’arabe dans les chansons de notre corpus et ensuite nous nous focaliserons sur les interprètes choisis et leur emploi des arabismes. Notre objectif principal est d’examiner quelle est la fréquence et la façon d’emploi des arabismes dans les chansons du rap. Nous allons examiner s’ils son utilisés en majeure partie par des locuteurs d’origine arabe ou bien si leur emploi n’est pas lié à l’origine de l’interprète. Il est nécessaire de noter que le corpus étudié n’est qu’un petit échantillon de la riche production du rap français donc les résultats obtenus n’auront pas de valeur générale. Le but de ce travail est plutôt de donner un aperçu sur les tendances et des bases méthodologiques pour le traitement des arabismes dans tout le corpus RapCor. Avant de commencer à analyser notre corpus d’un point de vue quantitatif, il faut rappeler les généralités du corpus analysé. Il se compose de 126 chansons de 9 interprètes (14 chansons de chaque interprète) dont 3 rappeurs sont d’origine arabe, 3 rappeurs d’origine non arabe et 3 sont des groupes de rap (voir supra §2.). Pour pouvoir comparer nos résultats plus clairement, le corpus étudié est divisé en trois subcorpus comme le montre le tableau suivant.

Tableau nº 11 : Répartition des chansons dans les subcorpus Subcorpus A : rappeurs d’origine arabe Ali 42 chansons Booba Rohff Subcorpus B : rappeurs d’origine non arabe Akhenaton 42 chansons Diam’s Disiz la Peste Subcorpus C : groupes de rap Beni Snassen 42 chansons Fonky Family La Rumeur

Nous pouvons observer que la répartition des chansons est proportionnée. Cependant il faut rappeler que le subcorpus C est formé de groupes de rap dont les membres ont les origines diverses. Dans ces cas spécifiques, il est nécessaire de mentionner quel rappeur utilise l’arabisme en question.

41

3.1. Arabismes dans les chansons du corpus

Dans notre corpus, il y a 79 chansons dans lesquelles nous avons trouvé au moins un arabisme. Dans le subcorpus A, c’est 33 chansons avec au moins un arabisme, 9 chansons sont sans arabisme, dans le subcorpus B, 22 chansons avec et 20 chansons sans arabismes et nous avons trouvé au moins un arabisme dans 24 chansons du subcorpus C, tandis que 18 chansons y sont sans aucun arabisme.

Graphique nº 1 : Chansons avec/sans arabismes dans le corpus entier

Légende : Arabisme + : chansons avec arabisme(s) Arabisme - : chansons sans arabisme(s)

Graphiques nº 2 et 3 et 4 : Chansons avec/sans arabismes dans les trois subcorpus

42

Les graphiques montrent que les chansons les plus riches en arabismes sont celles du subcorpus A, alors que les chansons moins nombreuses en arabismes se trouvent dans le subcorpus B. Dans le subcorpus C prédominent, même si pas considérablement, les chansons avec au moins un arabisme. Nous voyons donc que les arabismes sont assez souvent utilisés également par les rappeurs dont l’origine n’est pas arabe, même s’ils ne les emploient aussi souvent que les rappeurs d’origine arabe. Nous avons analysé 14 chansons de chaque interprète et dans le tableau suivant, nous pouvons observer l’emploi des arabismes dans les chansons de chacun d’entre eux.

Tableau nº 12 : Chansons avec arabisme(s) chez les interprètes étudiés Subcorpus A Subcorpus B Subcorpus C Interprète Nombre de Interprète Nombre de Interprète Nombre de chansons chansons chansons Ali 8 Akhenaton 8 Beni Snassen 8 Booba 14 Diam’s 6 Fonky Family 10 Rohff 11 Disiz la Peste 8 La Rumeur 6 En total A+ 33 22 24 En total A- 9 20 18 Légende : Arabisme + : chansons avec arabisme(s) Arabisme - : chansons sans arabisme(s)

Nous voyons que un seul rappeur, Booba utilise des arabismes dans toutes les quatorze chansons analysées. Il est suivi d’onze chansons du rappeur Rohff du même subcorpus et du groupe de rap Fonky Family qui utilise des arabismes dans dix chansons sur quatorze analysées. De l’autre côté, c’est la rappeuse Diam’s qui a utilisé des arabismes seulement dans six chansons. Il en est de même pour le groupe La Rumeur. Ceci peut paraître un peu surprenant, comme deux membres du groupe sont d’origine algérienne ce qui laisserait à présupposer une utilisation accrue des arabismes. Or, sauf les trois premiers interprètes (Booba, Rohff, Fonky Family), nous observons que les autres ont utilisé des arabismes dans 6 – 8 chansons, peu importe leur origine. En fin de compte, il n’y a pas de grands écarts d’utilisation des arabismes entre les subcorpus A et B. Il est encore intéressant de noter que la chanson la plus riche en arabismes, est la chanson Testament (ROH13) du Rohff où nous avons trouvé six arabismes différents : arbiya, caïd, din, hakdin, haram (et une variante graphique harami) et hnine.

43

3.2. Arabismes dans les subcorpus

Pendant notre recherche, nous avons trouvé dans notre corpus 48 arabismes différents. Le tableau suivant montre quels arabismes ont été trouvés dans les subcorpus. Des variantes graphiques se trouvent entre parenthèses, des emprunts communs à tous les trois subcorpus sont marqués en gras.

Tableau nº 13 : Liste des arabismes dans les trois subcorpus Subcorpus Arabismes recueillis Total Subcorpus A arbiya, bled, blédard, bsartkoum, caïd, clébard, crouille,, din 30 (var. graph. dîn), fissa, foolek, hachek, hakdin, hagar, handek, hass, hecheun, hmara, hnine, hnouch, haram (var. graph. hram, harami, halam), kiffer, kho, lascar, mesquine, niquer, seum, timinik, wesh (var. graph. ouech), zarma, zbèb Subcorpus B ahchouma, babtou, barda, belek, bled, clebs, gourbi, hagra, ken, 18 kiffer, maboul, misquine, niquer, ouaich, scarla, sem, zarma, zouz Subcorpus C arbouche, bled, caïd, chekem, clébard (var. graph. klébard), dîn 17 hagar, hanout, kho, khnona, niquer, ouech, (var. graph. whèsh),whèsh-whèsh, nouss nouss, seum (var. graph. sum), t’miniquer, zarma

En observant l’occurrence des arabismes différents dans les subcorpus, c’est le subcorpus A, formé par les rappeurs d’origine arabe, qui est le plus riche en arabismes du point de vue fréquentiel. Même s’il semblerait opportun de faire un lien directe entre l’utilisation des arabismes et l’origine de l’interprète, l’analyse nous a démontré qu’une telle conclusion serait trop hâtive. Dans le subcorpus B (formé par des chanteurs d’origine non arabe) s’est démontré plus riche en arabismes que le subcorpus C (formé par des groupes de rap dont les membres sont également d’origine arabe). Il y a cinq arabismes (en caractère gras) qui se répètent dans tous les trois subcorpus. Ce sont les noms bled et seum (var. graphiques sem, sum), le verbe niquer et également deux interjections wech (var. graphiques wesh, ouech, ouaich, whèsh) et zarma. Or, il faut noter que même s’il se trouvent dans tous les subcorpus, ils ne sont pas utilisés par tous les rappeurs. Le tableau suivant montre l’occurrence de ces arabismes également avec des variantes graphiques.

44

Tableau nº 14 : Arabismes communs à tous les trois subcorpus avec leurs variantes graphiques Lemme Subcorpus A Subcorpus B Subcorpus C ALI BOO ROH AKH DIA DLP BES FFA LAR bled bled bled bled bled bled bled bled bled - niquer - niquer niquer niquer niquer - niquer niquer niquer seum seum seum - sem - - seum sum - wech - wesh - - - ouaich whèsh ouech - zarma - - zarma zarma - zarma zarma - -

3.3. Arabismes aux fréquences élevées

Maintenant, nous allons observer des arabismes utilisés le plus souvent de différents points de vue:

1. arabismes aux fréquences élevées dans le corpus entier

2. arabismes aux fréquences élevées dans les subcorpus A, B, C

3. arabismes aux fréquences élevées utilisés par les rappeurs d’origine arabe et par ceux d’origine non arabe

Au début, il faut remarquer que nous avons trouvé dans notre corpus quelques structures qui se répètent plusieurs fois dans la même chanson dans les refrains, mais également dans les couplets ou dans les intros ou outros. Pendant notre analyse quantitative, nous les allons compter seulement une fois. Ces structures sont récapitulées dans le tableau suivant avec le nombre exact de répétitions.

45

Tableau nº 15 : Structures répétitives dans le corpus entier Structure répétitive Interprète Subcorpus Chanson Répétition Moi et mon kho Nessbeal. Booba A BON01 7 (7x1 refr .) Kho j’te préviens Booba A BOO05 5 (3x1 refr., 1x intro, 1x outro) Soldats d’fortune, barda de Akhenaton B AKH15 4 (4x1 refr.) tordu (Je veux) juste kiffer Disiz la Peste B DLH01 9 (3x2 refr., 2x couplet, 1x outro) J’t’ai ken Disiz la Peste B DLP17 8 (3x2 refr., 2x outro) Y’a comme un goût de foolek Diam’s B DIA07 3 (2x couplet, 1x outro) Y’a comme un goût de foolek, Diam’s B DIA07 2 (2x couplet) foolek chez les mômes La haine te nique Beni Snassen C BES08 6 (3x2 refr.) Nique Chirac Fonky Family C FFA05 3 (3x1 refr.) Nique sa mère Fonky Family C FFA01 3 (3x1 refr.) Nique le show business Fonky Family C FFA01 3 (3x1 refr.)

Après avoir examiné notre corpus comme un ensemble, nous pouvons constater que parmi les arabismes aux fréquences plus élevées appartiennent les verbes niquer et kiffer, les substantifs bled et kho et également l’interjection wech.

Tableau nº 16 : Arabismes aux fréquences élevées dans notre corpus Lemme niquer kho bled kiffer wech Fréquence 45 41 15 14 10

Pour voir si nous pourrions éventuellement parler d’une récurrence plus généralisée, nous avions étendu dans ce cas-là l’analyse quantitative sur le corpus RapCor entier105. Il sera intéressant de voir si l’ordre de ces cinq arabismes récurrents restera le même.

Tableau nº 17 : Occurrences des arabismes aux fréquences élevées (dans notre corpus) dans 757 chansons Lemme niquer kiffer kho bled wech Fréquence 173 105 61 53 30

105 Nous avons recherché les arabismes préférés de notre corpus dans 757 chansons qui sont actuellement prêtes pour l’emploi dans le plateforme TXM. Il faut ajouter que cette fois-ci, nous n’avons pas soustrait les structures répétitives vu l’amplitude du corpus RapCor. Les nombres peuvent donc être un peu plus hauts.

46

Le verbe niquer garde la première position, tandis que sur les positions suivantes la situation est différente. A la différence de notre corpus, le verbe kiffer est beaucoup plus utilisé que les noms kho et bled. Il est également intéressant de remarquer que dans notre corpus, il y a 41 occurrences du mot kho, tandis que dans les 757 chansons (les chansons de notre corpus y inclues), le mot revient à 61 reprises. Or, il faut mentionner que l’arabisme kho, souvent utilisé comme l’apostrophe, a obtenu la position parmi les arabismes les plus utilisés dans notre corpus surtout grâce au rappeur Booba qui l’emploie abondamment comme nous allons voir plus loin. Nous le pouvons déjà deviner en observant les arabismes récurrents dans les subcorpus.

Tableau nº 18 : Arabismes aux fréquences élevées dans les subcorpus A, B, C SUBCORPUS A Lemme kho niquer kiffer bled wech Fréquence 39 19 7 5 5 SUBCORPUS B Lemme kiffer bled ken niquer wech Fréquence 7 8 4 3 3 SUBCORPUS C Lemme niquer bled wech seum kho Fréquence 23 2 2 2 2

L’emploi des arabismes par les rappeurs du subcorpus A influencent fortement les résultats finals. Les arabismes préférés dans le corpus entier correspondent à ceux du subcorpus A, même leur ordre est (presque) le même. La situation assez différente se produit dans les subcorpus B et C. Le subcorpus B est beaucoup plus pauvre quant à la fréquence des arabismes. Le verbe kiffer et le substantif bled y sont prédominants, alors que le verbe niquer très récurrent dans le corpus entier s’y trouve seulement trois fois et le substantif kho est absent. Dans subcorpus C prédomine fortement le verbe niquer qui a 23 occurrences, tandis que l’occurrence d’autres arabismes est plutôt basse. Maintenant, nous allons comparer cinq arabismes récurrents chez les rappeurs d’origine arabe et chez ceux d’origine non arabe. Afin d’avoir les résultats les plus exacts, il a été nécessaire non seulement de désigner quel rappeur utilise l’arabisme dans les groupes de rap mais aussi de prendre en compte l’origine des rappeurs qui utilisent les arabismes dans les featurings. Malheureusement, il faut admettre que, dans certains cas, il a été impossible de

47

déterminer définitivement l’interprète utilisant tel ou tel arabisme ou son origine. Les données où l’interprète reste inconnu seront présentées dans le tableau suivant.

Tableau nº 19 : Arabismes dont l’utilisateur (ou son origine) nous reste inconnu Lemme Rappeur Fréquence Chanson bled ?? 1 BES05 kho Hamcho 1 BES13 kho ?? 1 BES13 niquer Mattéo Falkone 1 BES04 1 BES08 ?? 1 BES08 Don Choa 1 FFA05 2 FFA10 2 FFA14 ?? 1 FFA05 wech Mattéo Falkone 1 BES08 Légende : ?? – Le rappeur n’a pas été reconnu

Tableau nº 20 : Arabismes utilisés dans les featurings Lemme Rappeur Origine Fréquence Chanson kiffer Nessbeal marocaine 1 BON01 Sako italienne 1 AIS01 kho Bram’s guinéenne 2 BIB01 Mala sénégalaise 3 BOM01 IS2 ? 2 BIB01 niquer Kalash l’Afro tunisienne 2 FFK01 wech Mala sénégalaise 2 BOM01 Légende : ? – L’origine du rappeur n’a pas été retrouvée

Après avoir recherché les arabismes dans les subcorpus, nous pouvons constater la fréquence diffère surtout en ce qui concerne l’emploi du substantif kho et du verbe niquer qui sont sur utilisés par les rappeurs d’origine arabe. Il est intéressant de remarquer que même si dans les subcorpus B le substantif kho ne se trouve pas, il a été utilisé dans les chansons de Booba par rappeurs Mala (d’origine sénégalaise) et Bram’s (d’origine guinéenne). Tous ces arabismes récurrents employés dans les featurings se trouvent supra (dans le tableau nº 20). Le verbe kiffer apparaît sept fois dans les deux groupes. Par contre, les mots bled et wech sont utilisés plusieurs fois par les rappeurs d’origine non arabe (huit et cinq occurrences en comparaison avec six et quatre répétitions chez les rappeurs arabes).

48

Tableau nº 21 : Arabismes aux fréquences élevées (rappeurs d’origine arabe) Lemme kho niquer kiffer bled wech Fréquence 32 27 7 6 4

Tableau nº 22 : Arabismes aux fréquences élevées (rappeurs d’origine non arabe) Lemme niquer bled kiffer kho wech Fréquence 9 8 7 5 5

3.4. Arabismes aux basses fréquences

Nous voyons que les arabismes récurrents sont plus ou moins similaires pour chaque groupe de rappeurs et que c’est plutôt la fréquence et leur ordre qui changent. Or, pendant la recherche, nous avons également trouvé dans notre corpus 32 arabismes avec une seule occurrence (sur le nombre total 48 arabismes différents). Il a été impossible de déterminer quel membre du collectif Beni Snassen a utilisé l’arabisme khnona et l’origine du rappeur Mattéo Falkone, qui a également utilisé l’arabisme avec une seule occurrence (whèsh-whèsh), nous reste inconnue. C’est pourquoi ces deux arabismes ne figurent pas dans le tableau récapitulatif ci-dessous.

Tableau nº 23 : Fréquence des arabismes avec une seule occurrence Fréquence Dictionnaire +/- Rappeurs d’origine arabe 19 10 dictionnaire(s) + 9 dictionnaire - Rappeurs d’origine non arabe 11 9 dictionnaire(s) + 2 dictionnaire - Légende : dictionnaire(s) + : les mots sont présents dans le(s) dictionnaire(s) dictionnaire - : les mots ne sont présents dans aucun dictionnaire

Nous pouvons constater que les rappeurs d’origine arabe ont utilisé plus souvent les arabismes qui ne sont pas présents dans les dictionnaires, nous supposons que c’est grâce à leur connaissance de la langue arabe. Parmi les rappeurs d’origine non arabe, c’était seulement le rappeur de Fonky Family, le Rat Luciano (d’origine espagnol-martiniquaise), qui a utilisé deux arabismes qui ne sont pas dans les dictionnaires (hanout et nouss nouss).

49

3.5. Variantes graphiques

Même si l’analyse lexicographique du départ laissait présupposer un nombre élevé des variantes graphiques, la plupart des arabismes du corpus ne sont apparus qu’une seule fois. Ceci n’était pas le cas uniquement pour les mots haram, wech (4 variantes graphiques), seum avec 3 variantes et din, mesquine et clébard avec deux variantes graphiques. Les arabismes et leurs variantes graphiques trouvées dans notre corpus se trouvent dans le tableau ci-dessous.

Tableau nº 24 : Arabismes avec plusieurs variantes graphiques Lemme Subcorpus A Subcorpus B Subcorpus C ALI BOO ROH AKH DIA DLP BES FFA LAR din dîn din din - - - dîn - - clébard - clébard - - - clébard klébard haram hram halam haram, ------harami mesquine - - mesquine - misquine - - - - seum seum seum - sem - - seum sum - wech - wesh - - - ouaich whèsh ouech - ouech* Légende : * utilisé dans le featuring par le rappeur Mala (BOM01)

3.6. Rappeurs et les arabismes

Nous avons déjà mentionné les arabismes récurrents chez les rappeurs d’origine arabe et chez ceux d’origine non arabe, ainsi que les arabismes avec une seule occurrence. Pour conclure cette partie comparant l’emploi des arabismes par ces deux groupes de rappeurs, il est nécessaire de mentionner la répartition des tous les 197 arabismes trouvés dans notre corpus (sans compter les structures répétitives; voir le tableau nº 15) entre les rappeurs d’origine arabe et les rappeurs d’origine non arabe. L’origine des rappeurs dans les featuring sera également prise en compte.

50

Graphique nº 5 : Répartition de tous les arabismes du corpus selon l’origine des rappeurs

De 197 arabismes de notre corpus, 59% (117 items) ont été utilisés par rappeurs d’origine arabe, 31% (61 mots) par rappeurs dont l’origine n’est pas arabe (ce qui pourtant n’exclut pas la connaissance de la langue arabe). Dans 7% (13 mots) l’origine du rappeur nous reste inconnu et dans 3% (6 items106) nous ne sommes pas arrivée à désigner qui est le rappeur utilisant le mot concret. Dans le tableau nº 25, nous observons la répartition de 191 arabismes (il y en a 197 en total, mais nous n’avons pas désigné les utilisateurs de six arabismes) parmi les rappeurs de notre corpus. La fréquence des arabismes n’est pas dans la plupart de cas très élevée, elle oscille entre 10 et 20 arabismes chez les rappeurs indépendants. Avant de commencer à analyser l’emploi des arabismes chez deux rappeurs qui en utilisent le plus, nous voudrions encore remarquer quelques données intéressantes. Le rappeur Disiz la Peste, dont l’origine n’est pas arabe, utilise (dans les chansons de notre corpus) des arabismes plus souvent que le rappeur Ali qui est d’origine marocaine. Le rappeur de Fonky Family Rat Luciano (d’origine espagnol-martiniquaise) utilise les arabismes plus souvent que ses collègues du groupe d’origine arabe. Par contre, les rappeurs du groupe La Rumeur n’utilisent les arabismes que rarement et le rappeur Mourad de ce groupe, qui est d’origine algérienne, n’a pas utilisé un seul arabisme dans les chansons analysées aussi que la rappeuse Wallen (de Beni Snassen) qui

106 Il s’agit des mots suivants : bled (dans la chanson BES005), khnona (dans BES09), dîn (dans BES01), kho (dans BES13), niquer (dans les chansons BES08 et FFA05).

51

est d’origine marocaine. Nous voyons, donc, que ce n’est pas toujours la règle que les rappeurs d’origine arabe utilisent plus d’arabismes que les autres. Il faut probablement prendre en considération également d’autres facteurs comme l’environnement sociale ou la religion. D’un autre côté, les rappeurs les plus productifs en ce qui concerne des arabismes sont d’origine arabe, ce sont les rappeurs Booba, d’origine sénégalo-franco-marocaine et Rohff, originaire des îles Comores où l’arabe est une des langues officielles.

Tableau nº 25 : Nombre d’arabismes utilisés par les rappeurs étudiés Subcorpus A Rappeur N. d’arabismes Ali 15 Booba 49 Rohff 35 Subcorpus B Rappeur N. d’arabismes Akhenaton 13 Diam’s 10 Disiz la Peste 19 Subcorpus C Rappeur (A/N) Groupe de rap N. d’arab. Don Choa (?) Fonky Family 5 Menzo (A) Fonky Family 5 Rat Luciano (N) Fonky Family 7 Sat l’Artificier (A) Fonky Family 5 Ekoué (N) La Rumeur 3 Hamé (A) La Rumeur 3 Abd Al Malik (N) Beni Snassen 1 Bil’in (?) Beni Snassen 1 Hamcho (?) Beni Snassen 1 Mattéo Falkone (?) Beni Snassen 4 Featurings Rappeur Chanson N. d’arab. Bram’s (N) BIB01 2 IS2 (?) BIB01 2 Kalash l’Afro FFK01 3 Mala (N) BOM01 5 Nessbeal (A) BON01 2 Sako (N) AIS01 1 Légende : A – rappeur d’origine arabe N - rappeur d’origine non arabe ? – origine du rappeur n’a pas été retrouvée

52

3.6.1. Les plus grands utilisateurs des arabismes

Ce sont donc Booba et Rohff qui utilisent les emprunts à l’arabe dans leurs chansons le plus souvent de tous les rappeurs de notre corpus. Or, chacun d’entre eux est un peu différent. Booba a le plus grand nombre d’occurrences : 49. Il a la tendance de répéter les arabismes. Dans les 14 chansons analysées, il a employé seulement 14 arabismes différents. Ses textes sont caractérisés par l’emploi abondant du substantif kho, « frère, ami », (24 occurrences + 7 occurrences employés par autres rappeurs dans les featurings) qu’il utilise surtout comme un apostrophe :

Mon son il est mieux qu’le tien kho c’est prouvé (BOO06)

La routine cro-ma du cro-mi, crois-moi, crois-y kho (BIB01)

Au dessus des lois, violent à ma guise kho Que Marianne me suce la bite qu’elle ne me fasse pas la bise kho (BOM01)

Par contre dans les textes du rappeur Rohff, les arabismes ne se répètent pas autant. Nous y avons trouvé 35 occurrences, mais il a employé le plus grand nombre d’arabismes différents : 20. Dans sa chanson Testament, il a utilisé six arabismes différents. La plupart d’arabismes utilisés par Rohff ont seulement une occurrence dans le corpus entier. Il faut remarquer qu’ils sont souvent liés avec sa religion qui est l’Islam (din, « religion », haram, « péché » ou hakdin « la vrai religion (Islam) »).

Le meilleur des refuges, et dans le din ça te donne une bonne mine Les ablutions te purifient les mains tachées d’hémoglobine […] Pour ceux qui boivent la tasse dans la hrra, blam blam J’envoie des signaux pour les naufragés dans la haram […] Certains ont l’air de se faire chier quand un frère est en train de prêcher Rien que ça jure hakdin Islam, bourré ou perché (ROH13)

53

La religion joue le rôle également dans les textes de Booba et Ali i où nous aussi trouvons des arabismes liés avec la religion :

Original, mélange de bien et d’mal passe un Salaam A ceux dans l’din, ceux dans l’halam (BLM01)

Moi j’suis d’ceux dans l’dîn, ce qu’on espère est autre part. Trop d’illusions dans c’monde du scintillement des étoiles au sentiment d’être star. (ALI09)

Nous supposons que la confession musulmane pourrait expliquer également l’emploi plus fréquent des arabismes (et donc une certaine connaissance de l’arabe) de certains rappeurs qui ne sont pas d’origine arabe mais qui sont des musulmanes comme Akhenaton, Disiz la Peste ou Rat Luciano. Or, ce n’est pas toujours le cas, parce que dans notre corpus sont d’autres rappeurs de confession musulmane qui n’utilisent les arabismes (presque) jamais (p. ex. Abd Al Malik ou Wallen). Ce qui nous encore paraît intéressant est l’emploi abondant du verbe niquer par les rappeurs du groupe Fonky Family. Dans les chansons analysées, nous avons trouvé 18 occurrences (dont deux ont été utilisés dans le featuring par le rappeur Kalash l’Afro), alors que tous les autres arabismes employé par Fonky Family n’ont qu’une seule occurrence.

54

4. Analyse lexicographique

Dans cette partie, nous allons analyser la présence et la fréquence des emprunts à l’arabe de notre corpus dans les dictionnaires généraux aussi bien que dans ceux spécialisés. Nous allons comparer le niveau de perception de nos emprunts par les auteurs des dictionnaires différents, nous allons observer la variabilité des définitions lexicographiques, les synonymes et l’étymologie proposés par les dictionnaires utilisés. Comme les systèmes phonétiques et graphiques de deux langues (française et arabe) diffèrent, les formes graphiques des arabismes proposées par les dictionnaires seront explorées et comparées avec les formes graphiques trouvées dans notre corpus.

À la fin de cette partie, nous voulons surtout répondre aux questions suivantes : Quelle est la fréquence des emprunts à l’arabe du corpus dans les dictionnaires particuliers ? À quel point les emprunts à l’arabe sont-ils intégrés en français? Quel est le niveau de fixation des formes graphiques des emprunts de notre corpus dans les dictionnaires ?

4. 1. Typologie des dictionnaires

Pour observer la perception des arabismes en français, nous allons utiliser la méthode des filtres successifs qui consiste dans la consultation des arabismes dans les dictionnaires, des dictionnaires standards aux ceux moins standards. Pour pouvoir appliquer cette méthode, nous avons divisé neuf dictionnaires employés en trois groupes selon le type des dictionnaires. Chaque groupe de dictionnaires va représenter un des filtres successifs. Nous allons utiliser cette méthode également pour la lemmatisation des arabismes du corpus (voir infra §6.).

4.1.1. Dictionnaires généraux de langue

Le premier filtre permet de rechercher les arabismes de notre corpus dans les dictionnaires généraux. Nous les recherchons d’abord dans Le nouveau Petit Robert de la langue française 2009 (abrégé désormais PR) qui est un des dictionnaires français les plus connus. Nous avons utilisé la version électronique de ce dictionnaire. Un autre dictionnaire utilisé est Le Petit Larousse 2009 - dictionnaire Multimédia CDROM (abrégé désormais LR). 55

Ce dictionnaire comporte les noms communs ainsi que les noms propres. Le dernier dictionnaire de ce groupe est Le Trésor de la Langue Française informatisé (abrégé désormais TLF) consulté en ligne en 2012 et 2013.

4.1.2. Dictionnaires de l’argot

Comme le deuxième filtre fonctionnent deux dictionnaires de l’argot. Le premier dictionnaire que nous avons utilisé est le Dictionnaire de l’argot, 2010 (abrégé désormais en DA) de Larousse des auteurs Jean-Paul Colin et Jean-Pierre Mevél et le deuxième le Dictionnaire du français non-conventionnel, 1991 (abrégé désormais en DFNC) de Hachette Éducation des auteurs Alain Rey et Jacques Cellard (réédition de l’œuvre de 1980).

4.1.3. Dictionnaires spécialisés en argot contemporain des cités

Étant donné le sujet de ce travail, le troisième filtre utilisé représente le plus grand groupe des dictionnaires utilisés: les dictionnaires spécialisés en argot contemporain des cités. Ce groupe de dictionnaires spécialisés en argot contemporain des cités comporte le dictionnaire de Jean-Pierre Goudaillier Comment tu tchatches ! Dictionnaire du français contemporain des cités, 3e édition de 2001 (désormais abrégé en CTT), le dictionnaire Bien ou quoi ? La langue des jeunes à Ivry et Vitry-sur-Seine, 2004 (nommé ci-après BQ) édité par Roland Laffitte et Karima Younsi et le dictionnaire Lexik des Cités, 2007 (désormais abrégé en LC), un ouvrage collectif des jeunes originaires d’Évry. Nous nous sommes également permis d’ajouter dans ce groupe le Dictionnaire de la zone (désormais abrégé en DZ), avec un sous-titre « tout l’argot des banlieues », rédigé par Cobra le Cynique. C’est un dictionnaire qui est formé surtout sous l’impulsion de ses lecteurs et il n’est pas sous la tutelle des linguistes comme les ouvrages précédents. Nous l’avons consulté en ligne en 2012 et 2013 et il nous a été très utile en ce qui concerne des mots argotiques.

4.1.4. Autres sources

Les arabismes que nous n’avons trouvé dans aucun de dictionnaires sont vérifiés dans les autres sources qui fonctionnent comme le quatrième filtre (nommé ci-après AC). C’était surtout Roland Laffitte à qui nous nous sommes adressée avec les arabismes inconnus et qui

56

nous a fourni des informations détaillées. Dans trois cas, nous avons également utilisé comme la source des informations l’Internet.

4.2. Résultats de la recherche lexicographique

4.2.1. Présence des arabismes dans les dictionnaires

Après avoir recherché tous les termes dans tous les dictionnaires, nous avons créé un tableau contenant les résultats de notre recherche. Les termes dans le tableau sont triés tout simplement par ordre alphabétique et ils sont présentés sous la forme graphique/les formes graphiques trouvée(s) dans notre corpus (seulement les substantifs ont été mis au singulier et les verbes à l’infinitif). Le signe de petit croix signifie la présence du mot dans le dictionnaire. Pour simplifier l’orientation dans le tableau, nous avons distingué quatre groupes de filtres (cf. supra) par quatre couleurs différentes :

Tableau nº 26 : Présence des arabismes dans les dictionnaires

Arabismes Dictionnaires (formes du corpus) PR LR TLF DA DFNC CTT BQ LC DZ AS ahchouna x x arbiya x arbouche x babtou x x x x barda x x x x belek x x x bled x x x x x x x x blédard x x x x x x bsartkoum x chekem x caïd x x x x x clebs x x x x x x clébard x x x x klébard crouille x x x x x din x dîn fissa x x x x foolek x x x gourbi x x x x x hachek x hagar x hagoun x 57

hagra x x hakdin handek x hanout x haram x harami halam hram hass x hecheun x hmara x hnine x hnouch x x x x ken x x x khnona x kho x x kiffer x x x x x x maboul x x x x x x mesquine x x x x x x x x misquine niquer x x x x x x x x x nouss nouss x scarla x x x seum x x x sem sum t’miniquer x timinik x wesh x x x x whèsh ouech ouaich whèsh-whèsh x zarma x x zbèb x x x x x x zouz x PR LR TLF DA DFNC CTT BQ LC DZ AS

La présence dans les dictionnaires est déjà assez révélateur concernant une éventuelle intégration et l’origine d’un emprunt. Nous pouvons constater que dans les dictionnaires de l’argot se trouvent les emprunts appartenant plutôt au vieil argot. Au contraire, dans dictionnaires spécialisés en argot contemporain des cités dominent des emprunts récents, nous n’y trouvons de vieux emprunts que rarement. Les dictionnaires généraux sont un « passage » entre ces deux groupes, car nous y trouvons des emprunt anciens et également récents (mais c’est toujours plutôt rare). En fait, dans notre corpus nous n’avons pas trouvé un seul emprunt 58

qui serait présent seulement dans les dictionnaires de l’argot et pas dans les dictionnaires généraux. Pendant notre recherche, nous avons rencontré un nombre de mots qui appartiennent au vieil argot et qui sont toujours utilisé dans l’argot des cités (parfois avec une nouvelle acception) et qui sont donc présents dans tous les trois groupes des dictionnaires. Nous avons, donc, divisé également les emprunts dans quatre groupes selon leur présence dans les dictionnaires :

1. les emprunts qui se trouvent dans tous les trois groupes de dictionnaires (bled, blédard, clebs, crouille, fissa, kiffer, maboul, mesquine/misquine, niquer, wesh/ouech/ouaich/whèsh, zbèb)

2. les emprunts qui se trouvent seulement dans les dictionnaires généraux et dans les dictionnaires de l’argot (barda, caïd, clébard/klébard, gourbi)

3. les emprunts qui se trouvent seulement dans les dictionnaires spécialisés en argot contemporain des cités (ahchouna, arbouche, babtou, belek, bsartkoum, foolek, hagoun, haram/halam/harami/hram, hmara, hnouchs, ken, khnona, hagra, handek, hass, kho, scarla, seum/sem/sum, timinik, whèsh-whèsh, zouz, zarma)

4. les emprunts qui ne se trouvent pas dans les dictionnaires (arbiya, chekem, din/dîn, hachek, hagar, hakdin, hanout, hecheun, hnine, nouss nouss, t’miniquer)

Le graphique suivant montre la répartition des arabismes dans ces quatre groupes exprimée en chiffres :

Graphique nº 6 : Répartition des arabismes selon leur présence dans les différents types de dictionnaires

59

4.2.1.1. Arabismes présents dans tous les trois groupes de dictionnaires

Le premier groupe est formé par des arabismes qui sont bien intégrés et qui font partie du français familier aussi que des argots des cités et occupe 23% de la quantité totale d’arabismes. Dans ce groupe appartiennent les emprunts niquer, bled, sa dérivation blédard, les formes graphiques du nom zbèb, le verbe kiffer (il faut remarquer que dans les dictionnaires de l’argot ne se trouve pas le verbe mais seulement le nom kif et l’adverbe kif-kif dont la dérivation kiffer), l’interjection wech (qui ne se trouve non plus dans les dictionnaires de l’argot; même dans PR, elle ne se trouve qu’à partir de 2009) et enfin le mot mesquine.

D’abord, nous voulons présenter les arabismes de ce groupe classés selon leurs premières attestations en français. Nous avons travaillé seulement avec quatre dictionnaires (PR, TLF, DA, DFNC) dans lesquels nous trouvons ces datations. Les termes sont classés selon l’ordre chronologique dès l’emprunt le plus vieux jusqu’à l’emprunt le plus récent selon le dictionnaire PR où nous avons trouvé tous les termes traités. Si les dictionnaires mentionnent quand les différentes significations ont été acceptées, nous le mentionnons, ainsi que les acceptions de différentes formes graphiques.

Tableau nº 27 : Arabismes et leurs attestations (groupe nº 1) Arabisme Dictionnaires (formes du PR TLF DA DFNC corpus) mesquine 1604 « jeune 1604 « qui manque de 1855 « petit, chétif» - misquine homme, fille » grandeur»; 1645 «chiche, ladre» maboul 1860; 1860 subst.; 1860 vers 1860 dans la 1830 argot de 1879 adj. langue familière; l’armée d’Afrique vers 1830 chez les soldats d’Afrique du Nord niquer 1890 1890 arg. milit. 1890 « posséder 1890 en Afrique « posséder sexuellement »; du Nord charnellement »; 1918 «attraper qqn» 1918 «attraper, punir» 1988 «endomma- ger, détériorer » zbèb 1894 1867 zeb; 1864 vers 1880 1899 zèbre; 1897 zébi; 1900 zob, zobi; 1901 zébi 60

bled fin XIXe siècle fin XIXe siècle arg. 1866 « pays, après 1900 arg.milit. milit. « terrain, pays »; localité »; « intérieur des 1905 « territoire »; 1919 terres en Afrique 1916 « rase campagne, «compatriote»; du Nord » terrain (inhabité) entre 1923 « milieu les lignes » ; apache » 1917 « endroit, cantonnement » ; 1934 « petit village isolé, sans ressources» fissa 1909 vers 1870 courant avant 1870 - parmi les soldats français en Afrique du Nord crouille 1917 1918 crouďa; 1917 crouya; 1917 1935 crouillat 1935 crouillat; 1953 crouille clebs 1920 1914 « caporal »; 1895 cleb; 1835 kelb 1863 cleb 1863 cleb 1901 clebs blédard 1926 « soldat qui 1926 « soldat qui sert 1926 « soldat »; 1926 « soldat qui sert en Afrique du en Afrique du Nord » 1929 « paysan » sert en Afrique du Nord »; Nord » 1950 (au Maghreb, relatif au bled) wesh, 1983 - - - whèsh, ouech, ouaich kiffer 1990 - - -

Nous observons qu’il y a une vaste gamme en ce qui concerne les premières attestations des arabismes de notre corpus. Nous y trouvons des emprunts qui font partie du français plus que cent ans aussi que les emprunts qui ont été attestés il y a quelques décennies. Il est visible que la plupart des mots proviennent de la fin du XIXe siècle et du début du XXe siècle, donc, de l’époque des interventions militaires en Afrique du Nord. Ces termes ont pénétré en français courant par l’intermédiaire de l’argot militaire. Nous voyons que les dates parfois diffèrent d’un dictionnaire à l’autre. Dans le PR sont habituellement mentionnées seulement les premières attestations des mots, alors que les autres dictionnaires mentionnent également les dates concernant « l’évolution » des significations ou des formes graphiques. Il est également intéressant d’observer comment varient les marques lexicographiques dans trois dictionnaires généraux (PR, LR, TLF). Dans le tableau suivant, sont traités seulement les significations substandard de chaque emprunt de ce groupe. Nous y

61

mentionnons la marque lexicographique et la signification du mot en français. (Le mot mesquin ne se trouve pas dans les dictionnaires généraux sous le sens substandard, c’est pourquoi nous n’avons pas mentionné ses marques lexicographiques).

Tableau nº 28 : Marques lexicographiques dans les dictionnaires généraux (groupe nº 1) Arabisme Dictionnaires (formes du PR LR TLF corpus) bled FAM. FAM. PÉJ. « lieu, village éloigné, « village, localité isolés » « contrée reculée ou petit isolé, offrant peu de village isolé, sans ressources » commodités ni distractions » FAM., AFFECTIF. « lieu où une personne habite, où elle est née » blédard FAM. et PÉJ. - - « Rustre, grossier » clebs FAM. FAM. ARG. « chien » « chien » « chien » crouille POP. et PÉJ. - FAM. et INJURIEUX « Maghrébin » « Arabe d’Afrique du Nord» fissa ARG. « vite » - ARG. « vite » kiffer FAM. FAM. - « prendre du plaisir, « apprécier, aimer, apprécier, aimer bien (qqn, prendre du plaisir à » qqch.) » maboul FAM. FAM. POP. et FAM. « fou » « fou » « qui a perdu la raison, fou » mesquine - - - misquine niquer ARG. VULG. ARG. et POP. « posséder sexuellement » « avoir des relations « posséder (quelqu’un) sexuelles avec charnellement, Attraper TRÈS FAM. quelqu’un (ou quelque « tromper, duper » chose), surprendre, prendre, duper » wesh, whèsh, POP. - - ouech, ouaich « Comment? Quoi? » zbèb VULG. - TRIVIAL « pénis » « membre viril »

62

Jusqu’à ce moment, nous avons mentionné seulement les dictionnaires généraux et les dictionnaires de l’argot. Or, il faut noter que le fait que les arabismes de ce groupe se trouvent également dans les dictionnaires spécialisés en argot contemporain des cités est assez important : nous y observons parfois des nouvelles acceptions. Le mot mesquin, e est considéré dans les grands dictionnaires comme le terme du français standard et il y apparaît, aussi que dans les dictionnaires de l’argot, seulement comme l’adjectif, avec la signification « petit, chétif » (DA) ou bien « qui est attaché à ce qui est petit, médiocre; qui manque de générosité », « qui est le fait d’une personne mesquine », « qui témoigne d’avarice, de parcimonie » (PR). Tandis que dans les dictionnaires spécialisés en argot des cités, il y apparaît comme le substantif, avec la signification « pauvre type » (CTT), « personne inspirant de la pitié ou de la peine, malheureux » (DZ) ou « pauvre » (BQ).

Dans notre corpus, cet emprunt est utilisé seulement comme le nom : Je patine avec une maison de disques qui veut que ses artistes tapinent Ne clippe pas les singles en faisant les mesquines Passe du rock au rap, je sais même pas si c’était pas des skins (ROJ01)

Tu fais le misquine mais tu viens de briser mon amie oh ! T’es pas un homme t’es qu’une victime (DIV01)

Tableau nº 29 : Sens du mot mesquin(e) Dictionnaire Sens Sens 1 Sens 2 Sens 3 Sens 4 Sens 5 PR adj. adj. adj. médiocre; qui est attaché à ce qui témoigne sans qui est petit, d’avarice, de importance médiocre; qui parcimonie ni valeur manque de générosité Qui est le fait d’une personne mesquine. LR adj. adj. médiocre, qui manque de petit grandeur, de générosité TLF adj. adj. adj. qui s’attache à ce qui fait preuve pauvre qui est petit, d’une parcimonie d’apparence, médiocre excessive, compte restreint de tenu de ses proportions, moyens, de sa de faibles qualité; qui dimensions s’attache bassement aux intérêts matériels DA adj. petit, chétif 63

CTT adj. nom pauvre, pauvre type minable, nul BQ nom. m., f. pauvre LC nom le pauvre, la pauvre DZ nom personne inspirant de la pitié ou de la peine, malheureux

Les dictionnaires spécialisés en argot contemporain des cités nous apportent également un autre sens de l’emprunt bled que nous ne trouvons ni dans les dictionnaires généraux, ni dans les dictionnaires de l’argot et c’est « pays d’origine » (DZ, BQ, CTT). Dans notre corpus, cet emprunt se trouve le plus souvent dans le sens de ville/village/pays d’origine dans le sens négatif aussi que positif :

Je suis venu du bled le ventre ballonné par malnutrition J’ai dû apprendre à parler devant la télévision (ROH09)

J’ai le verset qui bouleverse, ma diction est malédiction Le poids du bled sur les épaules (BOO01)

Quelque soit le problème ici on en revient toujours au blé même si on parle d’aller finir nos jours au bled, des rêves pleins la tête mais les pieds sur terre (FFA12)

Et mon bled recharge mes batteries Pour affronter la vie (DLH01)

64

Tableau nº 30 : Sens du mot bled Dictionnaire Sens Sens 1 Sens 2 Sens 3 Sens 4 Sens 5 Sens 6 Sens 7 Sens 8 PR en Afrique fam. du Nord, lieu, village l’intérieur éloigné, isolé, des terres, la offrant peu de campagne ressources LR l’intérieur fam. des terres, la village, campagne, localité isolés en Afrique du Nord TLF région. p. ext., arg. p. ext. péj. fam. (Afrique du et fam. terrain contrée affectif. Nord). terrain sans reculée ou lieu où Région vague cultures petit village une située à séparant ni isolé, sans personne l’intérieur deux habitatio commodités habite, où des terres, tranchées ns ni distractions elle est campagne. ennemies née DA pays, localité milieu compatriote le plus apache souvent isolés DFNC intérieur des village ou village terres en petite ville, d’où l’on Afrique du opposés à est Nord Paris ou à une originaire très grande ville, ville lointaine, étrangère, que l’on situe mal, Toute agglomération provinciale ou tenue pour rurale CTT village, p. ext., ville pays d’origine d’origine BQ pays d’origine DZ village, coin pays natal, isolé ou d’origine

C’est également le lexème dérivé de bled - blédard, dont le sens a glissé. D’abord, c’était un « soldat français qui servait dans le bled, en Afrique du Nord » (PR, TLF, DFNC), puis « originaire du bled, qui habite bled » (PR, BQ, LC, DZ) et ensuite « sans-papier, ringard, décalé » (LC).

Qui suis-je ? Un banlieusard parmi des millions Un p’tit blédard moderne qui approuve la loi du talion (ROJ01)

65

C’est aussi le verbe niquer qui a subi des glissements sémantiques. Les dictionnaires spécialisés en argot contemporain des cités (et DA) apportent une nouvelle acception de ce mot et c’est le sens « casser, abîmer, détériorer » (DZ, BQ, LC, DA). Seul le DZ apporte également le sens de « battre quelqu’un, mettre quelqu’un K.O. ». Dans notre corpus c’est un des emprunts à l’arabe les plus employés. Nous l’avons trouvé dans le sens « avoir des relations sexuelles » : Déteste-moi, mon fric, les blondes que je nique, les ondes que je pollue, le shit que je brûle (FFA14)

Plus souvent ce verbe a été utilisé dans le sens « abîmer » : Ils voulaient kidnapper mon art, pirater mon navire, m’empêcher de bâtir, prendre ma place et niquer mon avenir, niquer mon business, mon hanout, mon destin (FFA01)

Là où Johnny Walker nique la vue d’certains (AKH19)

Or, le plus souvent, nous l’avons trouvé dans les locutions verbales différentes (cf. §1.6.1.) : On te renseigne, prends à droite, le feu à gauche et va niquer ta mère (ROH11)

On criz ”Nique la Police” quand il passent on les caillasse (BES04) Si ça paie, nique sa race je me mets bien je fais pété le XS (FFA07) Nique l’État qui fait du bénef sur la misère du peuple (ROJ01)

Tableau nº 31 : Sens du mot niquer Dictionnaire Sens Sens 1 Sens 2 Sens 3 Sens 4 PR posséder sexuellement LR avoir des relations tromper, duper sexuelles TLF posséder (quelqu’un) attraper quelqu’un charnellement (ou quelque chose) Surprendre, prendre, duper DA posséder sexuellement attraper, tromper endommager, qqn détériorer DFNC posséder sexuellement tromper CTT posséder sexuellement tromper BQ posséder charnellement abîmer, détériorer LC amocher, abîmer DZ avoir des rapports tromper qqn, gruger abîmer, battre qqn, mettre sexuels avec quelqu’un qqn détériorer K-O qqn

66

En ce qui concerne le verbe kiffer, nous y également trouvons plusieurs sens (voir le tableau ci-dessus). Dans les dictionnaires de l’argot et dans le TLF, nous n’avons trouvé que le lexème kif « occupation favorite, plaisir, loisir préféré », « joie, euphorie », et par extension « sorte de haschisch dont la fumée procure cette euphorie » (DFNC). Dans notre corpus, le verbe kiffer apparaît assez souvent (c’est le quatrième arabisme préféré après niquer, kho et bled). Il est le plus souvent suivi d’un complément objet direct et employé donc dans le sens d’ « aimer, apprécier » :

Kiffe le son reste tranquille, fait pas le fan mythomane (BOO01) L’étalon noir kiffe les chiennes en string, talons (BOO03)

Il peut également être suivi de l’infinitif :

J’ai toujours kiffé être invitée par des rappeurs (DIA18)

Tableau nº 32 : Sens du mot kiffer Dictionnaire Sens Sens 1 Sens 2 Sens 3 Sens 4 PR apprécier, aimer bien prendre du plaisir LR apprécier, aimer prendre du plaisir à CTT aimer BQ aimer, prendre son pied aimer, être attiré par, prendre du plaisir dans LC apprécier, aimer DZ apprécier, aimer aimer à la folie perdre son sang froid, avoir une réaction démesurée face à une situation

Et enfin, les arabismes clebs, crouille, fissa et maboul qui font un « passage » entre le premier et le deuxième groupe, parce qu’ils se trouvent seulement dans un des dictionnaires spécialisés en argot contemporain des cités (clebs, crouille, fissa dans le DZ, maboul dans CTT). Leur sens est le même dans les dictionnaires généraux ainsi que dans les dictionnaires de l’argot.

67

4.2.1.2. Arabismes présents dans les dictionnaires généraux et dans les dictionnaires de l’argot

Le deuxième groupe est créé par les emprunts qui se trouvent dans les dictionnaires généraux et dans les dictionnaires de l’argot mais qui ne sont présents dans aucun des dictionnaires de l’argot des cités. Ce groupe forme seulement 8% de tous arabismes de notre corpus. Dans ce groupe appartiennent seulement quatre items : barda, caïd, clébard, gourbi. Nous pouvons dire que ces termes sont encore mieux intégrés en français. Il s’agit des emprunts qui existent en français depuis longtemps, ils faisaient partie déjà du vieil argot. Ces arabismes (comme la plupart de ceux du groupe précédent) proviennent de l’époque de colonisation d’Afrique du Nord (sauf le mot caïd qui apparaît en français déjà à la fin du XVIIe siècle) et nous supposons que leur sens a glissé vers le sens plus général (puisque il s’agit des arabismes utilisés par les soldats en Afrique du Nord) juste après et qu’ils n’ont plus considérablement modifié leur sens. Probablement, c’est pourquoi ils ne sont pas présents dans les dictionnaires spécialisés en argot des cités. Comme dans le groupe d’arabismes précédent, nous apportons le tableau des premières attestations classées selon l’ordre chronologique où nous pouvons déjà observer quelques glissements du sens.

Tableau nº 33 : Arabismes et leurs attestations (groupe nº 2) Arabisme Dictionnaires (formes du PR TLF DA DFNC corpus) caïd 1694 (en Afrique 1694 (en Afrique 1921 « personnage vers 1920 du Nord) du Nord) « notable important dans le «personnage « fonctionnaire qui cumule des milieu » socialement musulman qui fonctions 1977 « personnage important, cumule les administratives, remarquable dans individu qui attributions de judiciaires, un domaine dispose de juge, financières; chef de quelconque (parfois l’argent» d’administrateur, tribu(s ) » employé de chef de police» 1903 « personnage ironiquement) » important » 1935 « mauvais garçon, chef de bande » gourbi 1841 1855 arg. milit. ; 1841 « habitation »; 1879 « son « habitation 1878-79 «habitation 1943 « faire gourbi, son chez rudimentaire en misérable » gourbi» soi » Afrique du Nord »

68

barda 1848 «équipement 1863 arg. mil. 1848 « équipement du soldat » 1883 fam. du soldat »; 1952 « billet de 1953 « billet de mille francs » mille francs anciens» clébard 1934 - 1934 1934 klébard

En comparant le tableau des premières attestations (tableau nº 33) et le tableau des apparitions substandard (tableau nº 34), nous voyons comment le sens de ces quatre emprunts à l’arabe a glissé.

Tableau nº 34 : Marques lexicographiques dans les dictionnaires généraux (groupe nº 2) Arabisme Dictionnaires (formes du PR LR TLF corpus) barda A ARG. MILIT. (puis FAM.) FAM. FAM. « l’équipement du soldat » « bagage, équipement « équipement porté à dos FAM. encombrant qu’on par le soldat en « chargement encombrant, emporte avec soi » campagne», p. ext. « bagage » bagage, chargement » ARG. « billet de mille francs » caïd FAM. FAM. ARG. « chef de bande » « chef, chef de bande » « chef » POP. ou FAM. « homme qui s’impose avec dureté » clébard, FAM. FAM. - klébard « chien » « chien » gourbi FAM. FAM. - « habitation misérable et « habitation misérable sale» mal entretenue »

4.2.1.3. Arabismes présents seulement dans les dictionnaires spécialisés en argot contemporain des cités

Le groupe suivant est formé, au contraire, par des emprunts qui sont présents seulement dans les dictionnaires spécialisés en argot contemporain des cités. C’est le groupe le plus nombreux dans lequel appartiennent 46% du corpus. Les mots suivants se trouvent dans la plupart des dictionnaires de l’argot des cités : babtou, belek, foolek, hnouchs, ken, scarla, seum et zarma. Dans ce groupe appartiennent 69

également les emprunts qui ne se trouvent que dans un (exceptionnellement dans deux) dictionnaire de ce groupe. Ils s’agit de treize items suivants : ahchouna, arbouche, bsartkoum, hagoun, haram (variantes graphiques harami, hram, halam), hmara, khnona, hagra, handek, hass, kho, timinik, whèsh-whèsh, zouz. Certains lexèmes de ce groupe ont également subi des glissements sémantiques. Le mot kho est présent dans les dictionnaires dans le sens de « frère » et également d’ « ami, pote ». Le lexème seum se trouve dans la plupart des dictionnaires dans le sens de « rage, haine, colère » et dans le BQ également avec un glissement de sens « variété de hachisch ». Nous pouvons trouver un glissement du sens également dans les mots toubab et lascar avant d’être verlanisés (voir infra). Dans notre corpus, nous avons trouvé seulement trois arabismes verlanisés (babtou, ken, scarla) qui font tous les trois partie de ce groupe. Le mot babtou « personne de race blanche européenne, occidental » est un verlan de toubab (à l’origine « médecin ») : [tubab] > [babtu] (> [bab] par apocope) (CTT). Le verbe ken, « posséder sexuellement », est un verlan de niquer : [nike] > [keni] > [kɛn] (CTT) et nous le trouvons dans les dictionnaires sous les formes graphiques différentes : ken, kène, kéner ou quène. Le troisième mot verlanisé est le nom scarla « vaurien, gars (de la cité) », qui est un verlan de lascar (à l’origine « homme brave », puis « homme malin », « jeune de banlieue »). Or, il faut remarquer que les lexèmes babtou et scarla ne sont (probablement) pas de véritables arabismes. Le mot babtou est un emprunt au wolof tubaab et au mandingue tubabu, « blanc », qui sont les deux emprunts à l’arabe toubib, « le médecin » (BQ). En ce qui concerne l’origine du mot lascar, les dictionnaires diffèrent. Nous pouvons constater que la langue arabe a joué probablement seulement le rôle de l’intermédiaire du persan : le mot lascar vient de l’arabe l’-asker, « soldat », celui-ci du persan lachkar « armée » (BQ). Les dictionnaires PR et TLF mentionnent encore le rôle du portugais comme l’intermédiaire. Dans ce groupe appartient également le mot foolek dont l’étymologie est opaque. Il est présent dans les dictionnaires spécialisés en argot contemporain des cités mais il y est considéré comme la ressufixation de l’adjectif « fou ». Or, nous nous appuyons sur une hypothèse de Roland Laffitte qu’il s’agit de la ressufixation du terme arabe fulan / fulān, « un(e) tel(le), machin, truc ». Cette hypothèse nous a été confirmé également par notre locuteur algérien qui n’était pas d’accord avec la signification dans les dictionnaires et qui a mentionné, indépendamment de Laffitte, le sens « un individu pas défini ».

70

Nous pouvons, donc, dire que notre corpus, en ce qui concerne des arabismes, est formé principalement par des emprunts récents qui n’ont encore atteint ni les dictionnaires généraux, ni les dictionnaires de l’argot. Pour conclure cette partie, notons encore que dans ce groupe, nous avons trouvé un nombre d’arabismes dont les formes graphiques du corpus ne s’accordent pas (ni une seule fois) avec celles dans les dictionnaires Il s’agit des lexèmes foolek (CTT, BQ : foulek, DZ : fouleck), hagoun (BQ : agoun), hnouchs (CTT : arhnouch, BQ : hnouches, DZ, LC : rnouch), khnona (BQ : rnouna), handek (LC : hendek) et whèsh-whèsh (DZ : wesh-wesh) (voir infra §4.2.3.). Nous voyons que ce sont souvent des arabismes présents dans un seul dictionnaire.

4.2.1.4. Arabismes qui ne sont présents dans aucun dictionnaire

Le dernier groupe se compose des arabismes absents dans tous les groupes de dictionnaires. Ils représentent 23% de notre corpus. Ce sont des lexèmes suivants : arbiya, chekem, din (dîn), hachek, hagar, hakdin, hanout, hecheun, hnine, nouss nouss, t’miniquer. Dans la partie suivante, nous allons les étudier cas par cas. Nous allons présenter chaque mot en contexte et déterminer sa signification. En ce qui concerne les sources auxquels nous avons puisé, notre « source » principal a été Roland Laffitte (cité comme RL) avec qui nous avons consulté la plupart des arabismes (et également d’autres des mots où l’origine arabe restait incertaine). Quelques items ont été également trouvé sur l’Internet (cité comme I).

71

Tableau nº 35 : Arabismes qui ne se trouvent pas dans les dictionnaires Arabisme Signification Source Rappeur Origine Chanson (formes du corpus) A/N arbiya, n.f. arabe RL Rohff A ROH13 chekem, n.m. balance, souteneur RL Kalash l’Afro A FFK01 din, dîn, n.m. ce qui est bien et qui I Ali A ALI08 suit les principes de la Booba A BLM01 religion musulmane Rohff A ROH13 ? ? BES01 hachek, loc. pardon, désolé RL Rohff A ROH05 hagar, v./n. commettre une I Sat l’Artificier A FFA11 injustice Rohff A ROH10 faire violence à quelqu’un hakdin, n. la vraie religion RL Rohff A ROH13 hanout, n.m. magasin, épicerie RL Rat Luciano N FFA01 hecheun, loc. verb. être gêné, avoir honte RL Booba A BOO08 hnine, adj. doux, gentil, I Rohff A ROH13 attentionné, tendre, pur nouss nouss, loc. moitié-moitié RL Rat Luciano N FFA01 t’miniquer, v. faire un mauvais tour RL Menzo A FFA10 Légende : ? Ni rappeur ni son origine n’ont été désignés

Maintenant, nous allons procéder à la présentation détaillée des arabismes que nous n’avons trouvé dans aucun dictionnaire. En tête de chaque « article » se trouve le mot traité toujours sous la forme graphique du corpus avec la catégorie grammaticale. Ensuite, le mot est présenté dans son contexte de chanson du rap et il est toujours en caractères gras. Si dans le corpus existent plusieurs variantes graphiques ou plusieurs sens ou locutions d’un terme, elles seront mentionnées dans leur contexte.

ARBIYA, n. f. Comment plaider contre l’un de ses fils quand l’aîné risque le placard La proc’ une arbiya rachetée par l’état Maître Haik n’y peut rien et je suis pas le frère de Rachida

Selon les informations de Roland Laffitte le mot arbiya peut être considéré soit comme adjectif, soit comme nom. Il s’agit de la forme féminine de arbi, de l’arabe ᶜarabī, ‒iyya, « arabe ». Dans notre corpus, il est employé un seul fois par Rohff, le rappeur d’origine comorienne où l’arabe est la langue officielle. 72

CHEKEM, n. Les putes chekem croient que le crew est divisé parce que l’on a sorti les solos de chacun

Il s’agit du nom masculin qui signifie « une balance, un délateur ». Le mot provient de l’arabe šakkām, qui est en argot un « souteneur » avant d’être une « balance ». Dans le contexte de la chanson de notre corpus, nous ne sommes pas sûre quelle de deux significations l’auteur a eu l’intention d’utiliser. Il est également possible qu’il (le rappeur Kalash l’Afro) ne connaît ce mot que vaguement, il l’a lié avec la prostitution.

DIN, DÎN, n.m. Moi j’suis d’ceux dans l’dîn, ce qu’on espère est autre part (ALI08) Original, mélange de bien et d’mal passe un Salaam A ceux dans l’din, ceux dans l’halam (BLM01) Le meilleur des refuges, et dans le din ça te donne une bonne mine (ROH13) Clean, la cause de notre force vient du Dîn. (BES01)

Nous avons trouvé le nom dîn sur l’Internet. C’est un terme lié avec l’Islam et nous voyons qu’il est utilisé par les rappeurs de la confession musulmane107. Nous ne savons pas quel membre de Beni Snassen l’utilise. Or, nous pouvons supposer qu’il est également de la confession musulmane, car il l’utilise même avec la majuscule ce qui, selon nous, reflète l’importance qu’il attribue au terme. Nous avons trouvé que ce mot est traduit confusément en français par « religion ». Nous y avons une signification plus précise : « l’obéissance, l’adoration et la moralité108 ». Il s’agit d’un mot arabe qui n’a pas d’équivalent en français. Ce mot désigne la nature de l’Islam non comme une religion, mais plus comme un système tout à la fois politique, religieux, militaire, économique, social, juridique, tout autant qu’un mode de vie tourné vers la soumission de l’individu à une divinité (Allah) et son prophète ou messager (Mahomet)109. Nous avons également trouvé l’explication suivante : « ce qui est bien et qui suit les principes de la religion musulmane110 ».

107 Ali, Booba, Rohff. 108 Disponible sur : http://monotheisme.over-blog.com/article-la-definition-du-mot-din-62566752.html [consulté le 20 février 2013]. 109 Wikipédia, l’encyclopédie libre [en ligne]. Dîn [consulté le 20 février 2013]. Disponible sur : http://fr.wikipedia.org/wiki/Dîn 110 Disponible sur : http://rapgenius.com/Rohff-testament-lyrics#note-465390, [consulté le 20 février 2013]. 73

HACHEK, loc. Hachek, nous on bouffe pas les strings nous on fait des castings pour les clips et les djihads en Palestine

Selon Roland Laffitte le mot hachek est une locution de la signification « désolé, pardon, excuse(z)-moi » provenant de l’arabe ḥāšāk ou ḥāšā lak, littéralement « loin de toi/telle ou telle chose ». Il se dit après avoir exprimé une chose déplaisante. C’est de nouveau le rappeur Rohff qui a utilisé cet arabisme.

HAGAR, v./n. J’ai jamais hagar un mec, à part s’il le méritait bien (ROH10)

Mais on reste sur nos gardes, merde, y’a trop de coups d’hagar J’ouvre l’œil et le bon, Évacue tout mon stress dans une feuille parsemé de shit et de tabac blond (FFA11)

Nous avons trouvé l’explication du mot hagar sur l’Internet111 dans l’article concernant les expressions courant dans « le parler beur ». En arabe littéral, ce verbe signifie « mépriser ». En arabe algérien il a pris pour sens « commettre une injustice », dans le sens d’abus de pouvoir, de force, mais aussi « faire violence à quelqu’un » . Ainsi, on entend chez les jeunes : tu t’es fait hagar et aussi : tu t’es fais hagar ton portable. Dans le premier extrait de Rohff, nous voyons le mot employé au sens « faire violence à quelqu’un ». Dans le deuxième extrait de Sat l’Artificier, ce mot, que nous avons trouvé seulement comme le verbe, est employé comme le substantif. Nous supposons qu’il y est utilisé au sens de « injustice ». Il est possible que dans ce cas, le mot a été confondu avec un autre arabisme, hagra, qui a le sens « misère, injustice » et dont la forme graphique est similaire.

111 Disponible sur : http://www.dilap.com/contributions/banlieue-beur/beur-arabe-francais.htm [consulté le 21 février 2013]. 74

HAKDIN, loc. Certains ont l’air de se faire chier quand un frère est en train de prêcher Rien que ça jure hakdin Islam, bourré ou perché Génération sacrifiée à dévierger ton rap conscient, engagé J’en ai perdu mon sang pendant que les autres se cachaient

Le mot hakdin est également un terme du domaine religieux. Dans notre corpus, il est utilisé par Rohff qui est de la confession musulmane. Selon Laffitte le mot provient de la locution arabe [bi-]ḥaqq al-dīn et signifie « [par] la vraie religion, c’est-à-dire l’Islam ». Par ailleurs, dans le texte de la chanson, la religion est encore précisée : Rien que ça jure hakdin Islam.

HANOUT, n.m. Et si les cœurs sensibles se retire, prêt à mourir dedans ils voulaient kidnapper mon art, pirater mon navire, m’empêcher de bâtir, prendre ma place et niquer mon avenir, niquer mon business, mon hanout, mon destin inévitable comme ma rencontre avec Malek El Mout

Selon les renseignements de Roland Laffitte, le mot hanout signifie « épicerie, boutique, magasin » et provient de l’arabe ḥānūt, de même signification. Dans le français courant le ras el hanout, littéralement « tête d’épicerie », est un mélange d’épices utilisé pour le couscous. Dans notre corpus, il a été utilisé par le rappeur Rat Luciano qui est d’origine espagnol-martiniquaise. Il nous semble probable que le terme y est utilisé plutôt comme synonyme de « business » que dans le sens du « magasin ». En plus, nous supposons qu’il a été également employé pour créer un rime : mon hanout – Malek El Mout.

HECHEUN, v. Ici c’est Dakar, banlieue Ouest Side, wesh Afrique de l’ouest, I2S, rap de tess, vient pas teste tu vas hecheun A cause de nous beaucoup de MCs chôment

Il s’agit probablement de hecheum, forme verbale figée de l’arabe classique ḥašama, prononcé au Maghreb [ḥašɛm] / [ḥašəm], de signification « être gêné, avoir honte ». On rencontre en français également le nom hchouma (variantes graphiques larchouma, lahchouma, hahchouma, ahchouma), « honte », de l’arabe al-ḥašūma.

75

HNINE, adj. Fier d’être Muslim, que Dieu me guide si j’en suis pas digne Avec ou sans la tâche au front on est des gens bien, ou fond on est hnine

La définition de l’adjectif hnine a été trouvée sur les forums d’Internet. Les utilisateurs l’ont défini comme « gentil doux, tendre112 », comme « affectif, attentionné113 » ou encore comme « pur114 ». Nous y avons trouvé également des variantes graphiques hnin, hnina. Dans le texte, Rohff utilise deux phrases dont la première peut éclaircir la deuxième avec cet arabisme (1. on est des gens bien, 2. au fond on est hnine).

NOUSS NOUSS, loc. Mais c’est mort, ils ont oublié que j’avais que ça Tu respectes, je te respecte, c’est nouss nouss papa

Cette locution signifie « moitié-moitié » provient de l’arabe dialectal nuṣ nuṣ, de même signification, de l’arabe classique niṣf, « moitié ». Nous voyons que la définition correspond à l’emploi dans le texte de Rat Luciano.

T’MINIQUER, v. On vient pas pour tchatcher, pour t’miniquer Y’a qu’en étant soudé, qu’on pourra tout niquer N’écoute pas ceux qui disent que pour réussir faut tous se niquer Sans les miens, je me serais peut-être écroulé ça pas toujours été drôle durant tout ce temps écoulé

Le verbe t’miniquer « faire un mauvais tour », est, selon Roland Laffitte, formé sur le substantif arabe maghrébin populaire et grossier tmenik, « mauvais tout, mauvaise blague », dérivé de nāka, « copuler, baiser », d’où niquer. Le rappeur Menzo en a profité pour faire le rime t’miniquer – tout niquer.

Pour conclure cette partie concernant les arabismes qui ne sont pas présents dans les dictionnaires, nous pouvons constater qu’il s’agit plutôt des mots utilisés par des arabophones

112 Disponible sur : http://forumislam.com/showthread.php/12586-Qui-pourrait-Me-Dire-Ce-Veut-Dire-Hnine, [consulté le 21 février 2013]. 113 Disponible sur : http://www.yabiladi.com/forum/hnine-68-3520425.html, [consulté le 21 février 2013]. 114 Disponible sur : http://rapgenius.com/Rohff-testament-lyrics#note-981231, [consulté le 21 février 2013].

76

(seulement deux arabismes de ce groupe, nouss nouss et hanout, ont été employés par le rappeur Rat Luciano d’origine espagnol-martiniquaise) et il est question si nous pouvons prendre ces items pour l’argot ou bien si ce sont seulement des mots arabes utilisés par des locuteurs (arabophones) comme la marque identitaire dont le sens reste opaque même pour les membres du groupe.

4.2.2. Fréquence des arabismes dans les dictionnaires

En ce qui concerne la présence des arabismes du corpus (contenant 48 arabismes en total, dont 11 absents de tous les dictionnaires) dans les dictionnaires, nous pouvons constater que le plus grand nombre des termes se trouve dans le Dictionnaire de la zone (23 mots), suivi du dictionnaire Bien ou quoi? (20 items) et du Petit Robert (15 mots) comme le montre le graphique suivant. Quant au PR, il faut mentionner que dans l’édition 2009, il y apparaît un nombre considérable d’arabismes nouveaux (de notre corpus il s’agit par exemple du mot wech qui n’y était pas présent jusqu’à cette année) et le Club d’orthographe de Grenoble même observe que : « l’ouverture au français parlé au Maghreb est très sensible (plus de 30 articles nouveaux) [...]115 ». Dans les autres dictionnaires, la présence des emprunts est plus ou moins pareille (entre 10 et 13 mots). Parmi les dictionnaires où nous avons trouvé le moins d’arabismes appartiennent le dictionnaire de l’argot DFNC (10 items) et également un dictionnaire général - LR (10 items).

Graphique nº 7 : Présence des arabismes dans les dictionnaires

115 Disponible sur : http://www.orthogrenoble.net/camille/entrees-Petit-Robert-2009.html [consulté le 2 novembre 2012]. 77

Comme nous avons dit au début, nous avons divisé les dictionnaires utilisés en trois groupes principales :

1. dictionnaires généraux (PR, LR, TLF) 2. dictionnaires spécialisés en argot contemporain des cités (DZ, BQ, CTT, LC) 3. dictionnaires de l’argot (DA, DFNC) (+ 4. Autre sources, AS)

Si nous considérons les trois groupes de dictionnaires comme un ensemble, nous constatons que dans les dictionnaires généraux nous avons trouvé 15 mots, dans les dictionnaires spécialisés en argot des cités 33 items et dans les dictionnaires de l’argot seulement 12 mots de la quantité totale 48 items (dont 11 ne se trouvent dans aucun dictionnaire).

Graphique nº 8 : Présence des arabismes dans les différents types de dictionnaires

Vu les résultats dans les dictionnaires étudiés, nous observons que le PR inclut tous les emprunts trouvés dans les dictionnaires généraux aussi que le DA inclut tous les emprunts trouvés dans les dictionnaires de l’argot. La situation plus intéressante se produit parmi les dictionnaires spécialisés en argot des cités dans lesquels nous avons trouvé 33 mots de 48. Or, le dictionnaire le plus « productif » de ce groupe (DZ) ne contient que 23 items et ces dictionnaires sont donc plus divers et contiennent des informations complémentaires. Il faut pourtant remarquer que le groupe le plus productif a été également le plus nombreux (4 dictionnaires), tandis que le groupe le moins productif a été le moins nombreux (2 dictionnaires). Nous pouvons constater que dans les dictionnaires généraux, ainsi que dans

78

les dictionnaires de l’argot se trouvent surtout des emprunts qui font partie du vieil argot, tandis que notre corpus est formé plutôt par des emprunts récents qui se trouvent souvent dans les dictionnaires spécialisés en argot contemporain des cités. D’un autre côté, nous devons admettre que ces dictionnaires n’apportent pas toujours beaucoup d’informations concernant l’étymologie ou la prononciation à la différence des dictionnaires généraux ou des dictionnaires de l’argot qui apportent des informations plus riches. En ce qui concerne la fréquence des arabismes dans les dictionnaires, les résultats sont bien visibles dans le graphique nº 9. Nous y voyons qu’il y a des arabismes qui se trouvent dans (presque) tous les dictionnaires aussi que des arabismes qui ne sont mentionnés dans aucun d’entre eux. Le groupe le plus nombreux est celui des arabismes qui se trouvent dans 1 – 3 dictionnaires. Cela correspond à notre théorie que notre corpus est créé plutôt par des arabismes récents qui sont présents dans les dictionnaires spécialisés en argot contemporain des cités.

79

Graphique nº 9 : Fréquence des arabismes dans les dictionnaires

80

4.2.3. Variantes graphiques des arabismes dans les dictionnaires

Tandis que le sens des emprunts à l’arabe est plus ou moins consolidé, nous ne le pouvons pas dire de la forme graphique. Nous allons introduire cette partie par un tableau dans lequel nous pouvons trouver toutes les variantes graphiques mentionnées (qui se trouvent comme des entrées dans les dictionnaires employés). À part quelques cas dont la forme graphique est déjà consolidée, la forme graphique de la plupart d’entre eux varie, parfois seulement parmi les dictionnaires, parfois également entre les dictionnaires et le corpus.

Tableau nº 36 : Tableau récapitulatif des variantes graphiques

Arabisme Dictionnaires (formes du PR LR TLF DA DFNC CTT BQ LC DZ corpus) ahchouma ahchouma lahchouma lahchouma larchouma arbouche arbouche babtou babtou babtou babtou babtou barda barda barda barda barda belek balek bellek belek bled bled bled bled bled bled bled bled bled blédard blédard blédard blédard blédard blédard blédard bsartkoum bsahtek caïd caïd caïd caïd caïd caïd clebs clebs clebs clebs clebs clebs clebs cleb klebs clébard clébard clébard clébard clébard klébard crouille crouille crouillat crouille crouillat crouille crouillat crouillat crouilla crouya fissa fissa fissa fissa fissa fiça foolek foulek foulek fouleck gourbi gourbi gourbi gourbi gourbi gourbi hagoun agoun hagra hagra hagra handek hendek haram haram harami halam hram hass hass hmara hmar,a hnouchs arhnouch hnouches rnouch rnouch

81

ken quène ken kène kéner khnona rnouna kho kho kho kiffer kiffer kiffer kiffer kiffer kiffer kiffer kifer kifer maboul maboul maboul maboul maboul maboul maboul mesquine mesquin, mesquin, mesquin, mesquin, mesquin mesquine mesquina mesquine misquine e e e e meskina niquer niquer niquer niquer niquer niquer niquer niquer niquer niquer scarla scarla scarla scarla seum sem seum sème sem seume sum timinik timinik t’minik t’manik wesh wech ouech wesh ouèche whèsh wèche wesh ouech ouaich whèsh-whèsh wesh- wesh zarma zarma zarma zerma zbèb zob zob, zobi zob zob zeub zboub zobbi zobi zouz zouz PR LR TLF DA DFNC CTT BQ LC DZ

Pendant notre recherche lexicographique116, nous avons remarqué le nombre élevé de variantes graphiques des arabismes du corpus. Nous avons observé que parmi les mots avec un nombre le plus élevé de variantes graphiques, nous pouvons inclure des arabismes suivants: hnouchs et ses variantes hnouches, rnouch, arhnouch, le verbe verlanisé ken et les variantes kéner, kène, quène, le nom seum et ses variantes seume, sem, sème et sum, wesh avec les variantes ouech, ouaich, whèsh, wech, wèche, ouèche et finalement le nom zbèb et ses variantes zob, zobi, zobbi, zboub, zeub. Or, il y a également des arabismes, appartenant plutôt au vieil argot, dont la forme graphique est bien stable comme : barda, bled, caïd, maboul, niquer etc. Pour parler en chiffres, nous constatons que 22 sur 37 termes (soit 59%) ont plus qu’une forme graphique comme le montre le graphique suivant.

116 Nous n’allons donc pas parler dans cette partie de 11 mots que nous n’avons trouvé dans aucun dictionnaire et qui – sauf le mot din/dîn – se trouvent seulement une fois dans notre corpus et ont, donc, seulement une variante graphique. 82

Graphique nº 10 : Répartition selon le nombre de formes graphiques

Plus précisément, 9 items ont deux variantes graphiques, 13 items ont plus que deux formes graphiques. Il faut remarquer qu’il y a même un certain nombre d’arabismes du corpus présents dans les dictionnaires, mais sous la forme graphique différente. Cette forme graphique a été compté comme une variante graphique à part. C’est par exemple le cas du mot rnouna présent sous cette forme dans le dictionnaire et sous la forme khnona dans notre corpus. Nous avons trouvé 9 arabismes dont la variante graphique de notre corpus n’a pas été trouvée dans le dictionnaire.

Graphique nº 11 : Répartition des arabismes avec plusieurs formes graphiques

Nous pouvons également constater que les mots avec plusieurs variantes graphiques sont souvent des emprunts récents qui ne sont, donc, pas encore très bien fixés et couramment utilisés dans la langue française. Il s’agit surtout des items présents seulement dans les dictionnaires spécialisés en argot des cités. Les termes qui sont présents dans les grands dictionnaires (PR, LR, TLF) et également dans les dictionnaires de l’argot (DA, DFNC) ont 83

habituellement leur forme graphique déjà fixée et elle ne varie pas souvent. Ce sont surtout des emprunts qui font partie de l’argot français depuis plus longtemps, comme barda, bled, caïd, gourbi, maboul, niquer etc. De 22 arabismes avec plusieurs variantes graphiques seulement huit (36%) sont présents également dans les grands dictionnaires et dans les dictionnaires de l’argot. Or, même dans ce cas-là, ce sont principalement les dictionnaires de l’argot des cités qui nous apportent des variantes graphiques différentes. Mentionnons comme exemple le mot mesquin,e qui se trouve sous cette forme dans les grands dictionnaires et dans un des dictionnaires de l’argot, tandis que les dictionnaires spécialisés en argot contemporain des cités apportent encore les formes suivantes : misquin(e), meskin(e), miskin(e), meskine, miskinette. Les exceptions sont les mots crouille, wesh, zbèb où nous trouvons plusieurs variantes graphiques également dans les dictionnaires généraux. 14 arabismes (64%) avec plusieurs variantes graphiques ont été trouvés seulement dans les dictionnaires spécialisés en argot des cités.

Graphique nº 12 : Répartition des variantes graphiques selon les types des dictionnaires

Dans la liste ci-dessous, nous pouvons encore une fois observer la récapitulation des emprunts à l’arabe avec leurs variantes graphiques. Les lexèmes en caractères gras sont ceux dont la variante graphique n’a pas été trouvée dans les dictionnaires et entre parenthèses sont les formes qui sont mentionnées dans les dictionnaires comme les variantes, mais pas comme une entrée.

84

Tableau nº 37 : Arabismes avec plusieurs formes graphiques présents dans les dictionnaires généraux Formes graphiques - corpus Formes graphiques – dictionnaires clébard, klébard clébard clebs clebs, cleb, klebs, kleps crouille crouille, crouillat, crouilla, crouya fissa fissa, fiça kiffer kiffer, kifer mesquine, misquine mesquin,e, mesquine, meskina, (miskine, meskine, miskinette) wesh, ouech, ouaich, whèsh wesh, ouech, wech, ouèche, wèche zbèb zob, zobi, zobbi, zboub, zeub

Tableau nº 38 : Arabismes avec plusieurs formes graphiques présents seulement dans les dictionnaires spécialisés en argot des cités Formes graphiques - corpus Formes graphiques – dictionnaires belek belek, balek, bellek bsartkoum bsahtek foolek fouleck, foulek (foulec) hagoun agoun handek hendek haram, harami, hram, halam haram ahchouma ahchouma, hahchouma, lahchouma (larchouma) hnouchs hnouches, rnouch, arhnouch ken ken, kène, kéner, quène khnona rnouna seum, sem, sum seum, seume, sem, sème timinik timinik, t’minik, t’manik whèsh- whèsh wesh-wesh (ouèche-ouèche) zarma zarma, zerma

Cette instabilité graphique peut être le résultat des deux systèmes différents de langue, du français et de l’arabe. Nous supposons que les arabophones n’emploient pas systématiquement l’orthographe française et ils tentent de garder des traits propres à l’arabe et, d’un autre côté, que la prononciation des mots arabes soit difficile pour les non- arabophones ce qui également influence les formes écrites de ces items. Nous pouvons observer que les sons les plus difficiles à translittérer (et donc avec plusieurs variantes graphiques) sont les mots contenant les phonèmes [h], [ħ] (ex. hnouchs et les variantes hnouches, rnouch, rnoucha, arhnouch) ou le phonème [x] (ex. khnona – rhouna etc.). Ces exemples montrent les efforts de conserver les traits propres à l’arabe et la difficulté de la prononciation des sons inconnus en français. Or, se sont également les systèmes vocaliques qui diffèrent déjà parmi les dialectes arabes et ensuite entre le français et l’arabe. Ceci pourrait nous amener à penser que les différences entre les systèmes vocaliques sont également la raison du nombre élevé de variantes graphiques au niveau des voyelles. 85

C’est pourquoi nous avons décidé de traiter en détail les phonèmes « problématiques » à adapter en français (voir infra §5.2.). Nous allons y proposer également la réalisation graphique de certaines consonnes sur la base de l’analyse du système phonique arabe, de la comparaison de la prononciation des arabismes du corpus en arabe et par les rappeurs dans le corpus et également sur la base des prononciations proposées par les dictionnaires employés.

86

5. Adaptation phonique

Un emprunt s’introduit dans la langue emprunteuse sous une forme graphique et phonique nouvelle, parfois inhabituelle à son système. Dans le cas des emprunts à l’arabe, c’est parfois assez marquant parce que les deux langues, le français et l’arabe, diffèrent considérablement et l’adaptation des emprunts à l’arabe au contexte français soulève quelques difficultés, surtout en ce qui concerne l’intégration phonétique et graphique. En arabe, il y a une quantité considérable de phonèmes arabes qui sont propres à la langue arabe et n’ont pas d’équivalent dans la langue française. D’où une certaine incertitude chez les locuteurs et pour cela les arabismes gardent souvent le caractère « étranger » surtout en ce qui concerne les emprunts récents. En plus, la langue arabe est une langue de deux registres. Cette diglossie oppose les dialectes (oral, dit bas) utilisés pour la communication orale et l’arabe standard (écrit, dit haut) qui n’est la langue maternelle de personne, mais qui est la langue officielle de 22 pays et sert à la communication écrite. Les dialectes parfois diffèrent par la prononciation. Dans ce chapitre, nous présentons les grands traits du système phonétique de l’arabe standard et nous nous concentrons principalement sur les phonèmes qui ne sont propres qu’à l’arabe. Or, comme nous l’avons mentionné supra, l’arabe n’est pas prononcé uniformément d’un pays à l’autre et comme un bon nombre d’emprunts de notre corpus provient des dialectes maghrébins, nous allons également décrire quelques différences entre l’arabe standard et ces dialectes. Ensuite nous allons analyser des arabismes de notre corpus du point de vue phonique, comparer comment leur prononciation varie en arabe et en français (dans notre corpus et également dans les dictionnaires) et résumer les changements les plus marquants qui influencent l’adaptation phonique des emprunts à l’arabe. Enfin, nous allons proposer une réalisation graphique des consonnes « problématiques » et nous allons essayer d’expliquer notre proposition.

87

5.1. Phonétique arabe

En général, nous pouvons constater que la langue arabe est une langue riche en consonnes et pauvre en voyelles. En arabe standard existent 26 consonnes, deux semi- voyelles (semi-consonnes) et seulement trois voyelles (brèves ou longues). Au contraire, le français est moins riche en consonnes et beaucoup plus riche en voyelles. Il y a également un bon nombre des phonèmes qui sont communs au français et à l’arabe : Tableau nº 39 : Consonnes communes à l’arabe et au français117 Lettre en Son Remarques sur la réalisation arabe dans les dialectes maghrébins [b] ب [ʃ] ش [d] د [f] ف ʒ] réalisé dj (affriquée sonore) en] ج Algérie [k] ك [l] ل [m] م [n] ن [s] س [t] ت [z] ز

Tableau nº 40 : Voyelles et semi-voyelles communes à l’arabe et au français

Son Nom de la lettre

[a] fatha [a:] fatha + alif [i] kasra [i:] kasra + ya [u] damma [u:] damma + waw waw , و [w] ya ,ي [j]

117 Romdhana GODEAU et al., « La problématique des interférences langagières entre l’arabe et le français », document proposé par le Lycée Français de Jérusalem (AEFE zone Europe du Sud-Est) et validé par Michel NEYRENEUF, IA-IPR d’arabe, le 15 juin 2010. Disponible sur: http://www.youscribe.com/catalogue/ressources-pedagogiques/education/cours/la- problematique-des-interferences-langagieres-entre-l-arabe-et-1415994 [consulté le 10 décembre 2013].

88

5.1.1. Système vocalique

Comme le montre le tableau supra, en arabe existent trois voyelles brèves (a, i, u) et trois voyelles longues (a:, i:, u:). Or, leur réalisation peut être variable. Elle dépend de l’environnement consonantique et de la place de voyelle, de la place de l’accent de mot ainsi que de l’origine géographique des locuteurs. Karel Petráček décrit le système vocalique de l’arabe standard dans son ouvrage Základy gramatického systému spisovné arabštiny ainsi118 : La voyelle a est réalisé, à proximité d’une emphatique ou d’une vélaire, vers o, tandis que à proximité des consonnes alvéolaires et uvulaires elle est prononcée vers e. La réalisation de la voyelle i est fortement influencée par les consonnes emphatiques, vélaires et pharyngales, la prononciation est après réalisée vers u. La réalisation de la voyelle u n’est pas trop influencée par les consonnes postérieures voisines. Comme nous observons, même si l’arabe standard n’a que trois voyelles brèves et trois voyelles longues correspondantes, il y existe un nombre d’allophones, dépendant souvent du contexte consonantique.

En ce qui concerne les dialectes, il y a généralement cinq ou six voyelles (brèves et longues). Ce sont les dialectes orientaux qui sont plus riches en voyelles, tandis que les dialectes maghrébins se caractérisent surtout par la grande occurrence de la voyelle neutre ultra-brève (le e muet du français). Pour mieux illustrer la situation dans les dialectes maghrébins, nous voudrions brièvement décrire le système vocalique à l’aide des informations qui nous ont été fournies par Dominique Caubet. Dans les dialectes maghrébins existent 4 ou 5 voyelles selon les parlers. Dans les parlers citadins, il y a trois voyelles longues (a:, u:, i:) et deux voyelles brèves e (schwa) et u, tandis que dans les parlers nomades, il y a trois voyelles longues (a:, u:, i:) et deux voyelles brèves e (schwa) et a. Or, il y a également certains parlers, surtout au Maroc, qui ont seulement une voyelle brève neutre e où l’opposition de longueur n’est donc plus pertinente. En plus, certains parlers tunisiens ont plus de voyelles brèves (a, i) mais cela est plutôt rare. Il y a également des parlers (par exemple à Marrakech) où la voyelle u n’est pas phonologique, mais elle est, sous l’influence berbère, conditionnée par certaines consonnes voisines. En ce qui concerne la voyelle neutre e, que nous allons rencontrer en analysant des changements vocaliques dans les arabismes de notre corpus, elle a plusieurs colorations, elle peut être

118 Karel PETRÁČEK, Základy gramatického systému spisovné arabštiny, Praha, Státní pedagogické nakladatelství, 1991, pp. 25 – 28. 89

réalisée comme a, è, é, i, o, u, en fonction de son environnement consonantique. Dans les dialectes maghrébins, nous pouvons également rencontrer les voyelles longues /e:/, /o:/ qui sont soit des allophones de /i:/ et /u:/ en contexte emphatique, soit des diphtongues semi- réduites. Nous y voyons que le système vocalique des dialectes maghrébins est assez riche et varie d’une région à l’autre. La réalisation des voyelles, comme en arabe standard, y est influencée par leur environnement consonantique.

En ce qui concerne la durée des voyelles, en général, les voyelles longues sont deux fois plus longues que les brèves. Or, la durée peut également varier en dépendant de la position de la syllabe dans le mot et de l’accent. Dans les parlers du Maroc et de l’ouest d’Algérie, la distinction entre les voyelles longues et brèves est atténuée. Les voyelles brèves y peuvent être réalisées comme longues et au contraire119.

Pour conclure, nous ajoutons encore une remarque concernant l’écriture des voyelles en arabe. Ce sont les voyelles longues qui sont toujours écrites, tandis que les voyelles brèves ne sont écrit que rarement et au moyen de petits signes au-dessus ou au-dessous de la consonne. Leur importance dans la forme écrite des mots d’un texte arabe est donc très petite120. À propos du rôle des voyelles Henriette Walter dit : « En conséquence, puisque la voyelle n’est que le mouvement qui anime la consonne, on ne peut jamais trouver en arabe, ni une voyelle seule, ni un mot commençant par une voyelle121 ».

5.1.2. Consonnes propres à l’arabe

Comme nous avons déjà mentionné supra, l’arabe est une langue riche en consonnes. En effet, en arabe standard, il y a 14 consonnes qui n’ont aucun équivalent dans le français standard et qui peuvent donc être problématiques en les adaptant en français. Comme les sources parfois diffèrent en ce qui concerne la description de certaines consonnes, nous avons puisé dans Handbook of the International Phonetic Association et dans l’œuvre d’Henriette Walter et de Bassam Baraké Arabesques, l’Aventure de la langue arabe en Occident pour la description de base de ces consonnes.

119 Disponible sur : http://www.dilap.com/phonetique-arabe/voyelles-02.htm [consulté le 12 décembre 2012]. 120 Henriette WALTER, B. BARAKÉ, Arabesques…, op. cit., p. 260. 121 Ibid., p. 245. 90

x] diffère d’un] خ Il est intéressant de remarquer que la description de la consonne source à l’autre. Certains mentionnent qu’il s’agit d’une consonne vélaire, tandis que les autres la considèrent comme une consonne uvulaire. Après l’avoir consulté avec Dominique Caubet, nous avons décidé de suivre la description dans le Handbook of the International Phonetic Association et de la décrire comme vélaire. Or, dans la partie concernant cette consonne (§5.2.1.), nous allons également rencontrer sa description comme uvulaire [χ] qui a été utilisé par Roland Laffitte qui nous a aidé avec la translittération et la transcription phonétique des mots arabes originels.

Tableau nº 41 : Consonnes propres à l’arabe Lettre Nom Type de Translittération Son Remarques sur la de la consonne (A.P.I.) réalisation dans les lettre dialectes maghrébins hamza occlusive ‘ ʔ ء glottale sourde thâ’ fricative th θ t en Algérie et au Maroc ث interdentale sourde ḥâ’ fricative ḥ ħ ح pharyngale sourde khâ’ fricative vélaire kh x خ sourde dhâl fricative dentale dh ð t en Algérie et au Maroc ر sonore râ’ vibrante r r ر alvéolaire sonore ṣâd fricative ṣ sˁ ص emphatique sourde ḍâd occlusive ḍ dˁ Au Maghreb souvent ض à l’oral et à ظ emphatique confondu avec sonore l’écrit ṭâ’ occlusive ṭ tˁ ط emphatique sourde zâ’ fricative ẓ zˁ Au Maghreb souvent ظ à l’oral et à ض emphatique confondu avec sonore l’écrit ayn fricative ᶜ ʕ° ع pharyngale sonore ghayn fricative vélaire ġ ɣ غ sonore qâf occlusive q q au Maghreb souvent réalisé ق uvulaire sourde comme le g hâ’ fricative glottale h h ي sourde

91

5.1.2.1. Consonnes postérieures

particulières des langues sémitiques, sont en ,ص ض ط ظ)) Les consonnes emphatiques arabe des variantes des consonnes simples (t, d, z, s). Elles « [...] se caractérisent par une forte tension des organes vocaux et [...] mettent en jeu à la fois la pointe de la langue et la racine de la langue, cette dernière se trouvant simultanément repoussée vers l’arrière de la bouche [...]122 ». La présence d’une consonne emphatique souvent influence son environnement et toute la syllabe peut être emphatisée. Elles influencent également la prononciation des voyelles (voir supra §5.1.1.). En arabe, à la différence du français, il y a des consonnes articulées au niveau du pharynx et au niveau du larynx : les consonnes ḥ [ħ], ᶜ [ʕ] sont des fricatives pharyngales : elles résultent d’un frottement de l’air au niveau du pharynx. La consonne q [q], articulée au niveau de la luette, résulte d’une fermeture totale du canal vocal. La consonne ‘ [ʔ], qui se réalise au niveau de la glotte, est nommée un coup de glotte ou une occlusive glottale. La consonne h [h], réalisée également au niveau de la glotte, laisse une ouverture suffisante qui permet à l’air de produire un bruit de frottement en passant entre les cordes vocales. Elle est donc appelée une fricative glottale ou une fricative laryngale123.

5.1.3. Accentuation des syllabes

Chaque mot en arabe possède un accent de mot, la syllabe accentuée est prononcée plus intensivement et un peu plus haut. L’accentuation en arabe est prédictible : L’accent tonique tombe sur la dernière syllabe longue du mot, sachant qu’une syllabe longue peut être composée de : consonne + voyelle longue; consonne + voyelle brève + consonne. S’il y a seulement des syllabes courtes et aucune consonne double, l’accent tonique est sur l’avant-dernière syllabe mais qui ne peut pas être brève. Sinon il remonte jusqu’à l’antépénultième syllabe124. Ces règles sont, en général, les mêmes dans les dialectes. Mais dans les dialectes de l’ouest maghrébin, au Maroc, la dernière syllabe est souvent accentuée même si elle n’est pas longue125.

122 Henriette WALTER, B. BARAKÉ, Arabesques…, op. cit., p. 239 123 Ibid., pp. 238 – 239. 124 Disponible sur : http://www.dilap.com/phonetique-arabe/syllabes-01.htm, [consulté le 30 décembre 2012]. 125 Disponible sur : http://www.dilap.com/phonetique-arabe/syllabes-02.htm, [consulté le 30 décembre 2012]. 92

5.2. Analyse phonique

Nous avons déjà mentionné qu’en arabe, il y a 14 consonnes qui n’ont pas d’équivalent en français. Logiquement, nous supposons que ce sont ces consonnes qui seront les plus difficiles à adapter au système de prononciation française et que ce sera surtout dans la position initiale où nous trouverons des difficultés dans leur adaptation. À côté des consonnes inconnus en français, nous nous concentrons également sur les voyelles et leur adaptation en français qui a le système vocalique plus riche que l’arabe. Nous avons décidé de ne pas analyser tous les arabismes de notre corpus d’un point de vue phonique. Nous le ferons seulement dans les cas où la prononciation n’est pas toujours claire, si elle diffère d’un dictionnaire à l’autre ou si elle n’est pas du tout retenue par les dictionnaires. Nous avons également traité des mots ayant plusieurs formes graphiques, ce qui reflète une prononciation incertaine. Nous les avons divisés en cinq groupes (un mot peut faire partie de plusieurs groupes) selon l’apparition de différents phonèmes dans les mots originels pour pouvoir ainsi mieux observer et comparer les changements dans la prononciation : nous y mentionnons la prononciation arabe, la prononciation du dictionnaire/des dictionnaires (s’il y en a) avec référence entre parenthèses et, enfin, la prononciation dans la chanson de rap (nous devons admettre certaines difficultés quand nous avons réécouté les arabismes, surtout dans la réalisation et dans la distinction parmi les consonnes [h], [ħ], [ʕ], mais avec l’aide des locuteurs arabophones nous avons fait de notre mieux pour que les transcriptions soient les plus précises possibles).

5.2.1. Consonne kh [x]

x], est une fricative uvulaire sourde. Elle peut être translittérée] ,خ ,’La lettre khâ comme kh126, ce qui est une adaptation plus compréhensible même pour les non-spécialistes, ou ḫ / ẖ127 qui est souvent utilisé dans le domaine des études arabes (et qui a été également utilisé par Roland Laffitte qui nous a aidé avec la translittération et la prononciation des mots arabes originels) mais qui apporte un élément exotique qui pourrait être difficile à déchiffrer.

126 La norme de translittération adoptée par l’Encyclopædia of Islam. 127 La translittération DIN-31635. 93

Dans notre corpus, nous avons trouvé seulement trois items qui comportent cette lettre dans le mot originel arabe : crouilles, kho (et le pluriel khos) et khnona.

Tableau nº 42 : Arabismes comprenant la consonne kh [x] Mot arabe Translitté- Prononciation Forme et Arabisme Pronon- Sens du Rappeur originel ration arabe prononciation (corpus) ciation mot et code maghrébin (dictionnaire) française de la (chanson de chanson rap) (A/N/ ??) (ḫuyya [χuja] crouille crouille [kʁuj] Maghré- Ali (A ا خىي يا [kʁuj], bin (terme ALI02 crouillat raciste) [kʁuja] (PR) ?? ḫanūna [χˑnuːna] - khnona [xona] morve خ ىىن BES09 (ḫu [χɔː] kho [χo] (LC) kho [xo] ami, frère Booba (A خى BOW01 kho [xo] Hamcho (?) BES13 kho [xu] Ali (A) ALI08 kho [xo] Bram’s (N) BIB01* kho [xo] I2S ( ?) BIB01* kho [xo] Mala (N) BOM01* Légende : ?? rappeur n’a pas été reconnu * featuring A – rappeur d’origine arabe N – rappeur d’origine non arabe ? – origine du rappeur n’a pas été retrouvée

En ce qui concerne le mot kho, il apparaît assez souvent dans notre corpus (en comparaison avec d’autres emprunts à l’arabe) et il est utilisé par plusieurs rappeurs d’origine arabe aussi que d’origine non arabe. Cet emprunt est prononcé de la même manière qu’en arabe et sa translittération est également correcte dans tous les cas. Or, il existe en français également des variantes graphiques différentes : rho, ro. Nous supposons que c’est le résultat de l’ « incapacité » de prononcer correctement la consonne [x] qui est donc rendue en français par la consonne [ʁ] (cf. l’analyse du mot khnona ou hnouch), écrit simplement /r/ ou /rh/ pour garder, au moins partiellement, le caractère étranger de l’emprunt. Le mot crouille, qui existe en français également sous la forme graphique crouillat, est daté dans l’argot français à partir de 1917 (PR). Nous pouvons observer que la forme graphique ainsi que la réalisation phonique ont été adaptées au système français. Pareillement

94

que dans le mot ro, rho le son initial [x] a été remplacé, dans ce cas par [kʁ], pour éviter la difficulté dans la réalisation phonique ou juste de l’incapacité des locuteurs français de le réaliser correctement. Selon le DFNC il s’agit d’une « gutturale (mal) traduite par un r en français ». La prononciation de la consonne /kh/ dans le mot khnona est réalisée dans notre corpus correctement comme [x] et la forme graphique est également bien adaptée. Or, il existe une autre variante graphique rnouna (BQ). La prononciation n’est pas mentionnée dans le dictionnaire, mais nous pouvons supposer une réalisation [ʁ] comme dans les cas précédents et pour les même raisons. Or, il faut mentionner que le r présent dans la forme graphique n’exclut même pas la réalisation [x] comme nous le pouvons observer par exemple dans le mot hnouch (voir infra) qui se trouve dans quelques dictionnaires sous la forme rnouch mais avec la prononciation [xnuʃ].

5.2.1.1. Proposition de la réalisation graphique du [x]

Après avoir analysé ces trois emprunts comprenant la lettre khâ’, nous avons découvert que le phonème [x] dans un mot arabe peut être réalisé dans la forme graphique en français comme : kh, r, rh ou cr (quand on prend en considération également les formes graphiques présentes dans les dictionnaires). Cette instabilité de la forme graphique ainsi que de la réalisation phonétique peut représenter une tâche pour les utilisateurs de la langue et cela s’avère problématique en recherchant un emprunt comprenant la consonne kh dans le corpus (ou également dans un dictionnaire). Dans notre corpus, nous rencontrons dans deux cas la translittération de cette consonne comme kh. Nous proposons, donc, de respecter cet usage, qui correspond au système de translittération de cette consonne, et d’utiliser la translittération kh (nous parlons plutôt des emprunts récents avec plusieurs formes graphiques dans les dictionnaires aussi que dans le RapCor, parce que dans les cas des emprunts qui sont déjà intégrés en français - même si sous la forme qui ne correspond pas à la forme du mot en arabe - il faut plutôt respecter la forme présentée par les dictionnaires généraux).

95

5.2.2. Consonnes ḥ [ħ], h [h]

La consonne /h/, [h] arabe, et surtout la consonne /ḥ/, [ħ] arabe, qui apparaissent dans les mots arabes (souvent dans la position initiale) représentent des sons étrangers au système français et ont une vaste gamme de réalisation phonique et graphique en français. En plus, nous pouvons les entendre même dans les mots dans lesquels ils n’apparaissent pas en arabe comme nous allons l’observer dans la partie suivante. Ces consonnes ont probablement également une fonction identitaire et participent à marquer l’appartenance au groupe.

Tableau nº 43 : Arabismes comprenant les consonnes ḥ [ħ], h [h] Mot arabe Translitté- Prononciation Forme et Arabisme Pronon- Sens Interprète originel ration arabe prononciation forme ciation du mot et code maghrébin (dictionnaire) pochette française de la (chanson de chanson rap) (A/N/ ?) (b-ṣeḥtkum [bsˁaːħkum] - bsartkoum [bsaħtkum] bravo Rohff (A ت صحث ROH04 ك ىم

ḥāšik [ħɑːʃɛk] - hachek [aʃɛk] se dit Rohff (A) après avoir ROH05 exprimé une chose déplai- sante (ḥaqar / [ħagar] - hagar [ħagar] commettre Rohff (A ح غر ḥagar une ROH10 [ħagar] injustice, Sat faire l’Artificier violence à (A)FFA11 quelqu’un ḥaqra [ħagra] hagra hagra [hagra] misère, Akhenaton ح قر prononcer injustice (N) [ħɔgra] hagra avec le AKH22 h guttural et le r roulé (LC) ḥaqq al-dīn [ħaqqəddiːn] - hakdin [ħagidin] (par) la Rohff (A) vrai ROH13 religion, c’est-à- dire l’Islam ḥanūṭ [ħanuːtˁ] - hanout [ħanut] épicerie Rat ح ىىت Luciano (N)FFA01 (ḥass [ħass] / [ħɛss] - hass [he:s] ennui, Rohff (A ح سس difficulté, ROH09 problème

96

(ḥarām [ħaraːm] haram hram [ħram] péché Ali (A حرام [aʁam] (CTT) ALE01 halam [ħalam] Booba (A) BLM01 haram [ħaram] Rohff (A) ROH13 harami [harami] Rohff (A) ROH13 ḥchouma [ħʃu:mæ] ahchouma, ahchouma [aʃuma] Diam’s حخىم hahchouma (N) [haxʃuma]/ DIJ01 [haxʃma] (CTT) (ḥāšam [ħaʃɛm] / - hecheun [heʃœn] avoir Booba (A حا ضم [ħaʃəm] honte BOO08 (ḥimāra/ [ħˑmaːra] - hmara [ħmara] âne, Rohff (A ح يمآرا ḥmāra ânesse ROH09 (ḥanīn / ḥnīn [ħanin] - hnine [ħnin] gentil, Rohff (A ح ى يه doux ROH13 (ḥanūš [ħnuːʃ] rnouch hnouchs [hnuʃ] policiers Ali (A ح ىص prononcer ALI08 khnouch, avec le kh comme la jota espagnole (LC) rnouch [xnuʃ] (DZ) arhnouch [axnuʃ] (CTT) mahbūl [mahbul] maboul maboul [mabul] fou Disiz la م ه بول [mabul] (PR) Peste (N) DLP15 Légende : A – rappeur d’origine arabe N – rappeur d’origine non arabe

La consonne /h/, une fricative glottale, n’est présente que dans un seul mot originel arabe du corpus et elle ne se trouve pas dans la position initiale où nous attendons plus de problèmes dans l’adaptation et l’intégration. En plus, c’est dans le mot maboul [mabul], mahbūl [mahbul] en arabe, qui n’est pas un emprunt récent, mais qui est déjà assez bien intégré au système français. Il est donc difficile de déduire une conclusion générale concernant l’adaptation de cette consonne. Nous pouvons pourtant observer que dans ce cas là, la consonne h est omise dans la forme graphique, ainsi que dans la forme phonique en français. La deuxième consonne /ḥ/, [ħ] arabe, nous apporte une tâche plus variée en ce qui concerne l’analyse de son adaptation en français. Laffitte dit que cette consonne est, en général, transformée en français dans toute une gamme allant des glottales [h] ou [ɦ] à 97

l’uvulaire [ʁ]. Or, dans notre corpus, où la moitié d’interprètes est arabophone, nous rencontrons également sa réalisation arabe [ħ]. Quant à la forme graphique, dans notre corpus, c’est dans la plupart de cas la consonne /h/ qui y apparaît. Juste une seule fois nous y voyons la consonne /r/ dans le mot bsartkoum [bsaħtkum]. Même si le plus souvent le /ḥ/ est transcrit simplement comme /h/, nous pouvons parfois rencontrer la consonne /r/ ou même /khr/ ce qui est expliqué dans le bulletin de la SELEFA dans l’article expliquant les formes de l’emprunt à l’arabe hmar : « [...] la présence du /r/ ou de /khr/ initial dans l’emprunt du terme arabe traduit ḥa’/. Ce son tend à être rendu en/ /ح/ la difficulté à rendre la fricative laryngale sourde français par la consonne roulée uvulaire voisée [ʁ] qui s’écrit effectivement /r/128 ». En ce qui concerne la réalisation phonique dans le corpus, nous admettons quelques difficultés en distinguant les nuances surtout dans la distinction des phonèmes [ħ]/ [h]. Pourtant, nous observons que la réalisation de la consonne /ḥ/, prononcée [ħ] dans les mots originels arabes, est parfois assez variée en français, même par les arabophones. Nous avons déjà mentionné l’emprunt bsartkoum où /ḥ/ a été remplacé par /r/, mais avec la réalisation [bsaħtkum] ce qui peut être expliqué par son emploi par l’interprète arabophone. Dans le BQ, nous trouvons encore la forme bsahtek qui conserve la consonne h (pour expliquer des suffixes différents : bi-ṣāḥatkum signifie en arabe littéralement « à votre santé », bi-ṣāḥtek « à ta santé »). Il est intéressant que dans le mot hachek, utilisé par l’interprète d’origine arabe, nous n’entendons aucun effort de prononcer [ħ] ou [h] ou même pas l’uvulaire [ʁ] et le mot est réalisé simplement comme [aʃɛk]. Dans les emprunts hagar, hakdin, hanout, hass, haram, hecheun, hmara, hnine, hnouchs nous pouvons entendre soit [ħ], soit [h] probablement selon la compétence des locuteurs sans égard pour leur origine. Nous entendons donc par exemple la prononciation [ħanut] de l’interprète dont l’origine n’est pas arabe et, au contraire, [he:s] ou [heʃœn] des interprètes d’origine arabe. Il sera intéressant de mentionner encore la prononciation de quelques de ces items dans les dictionnaires même si c’est plutôt rare parce que les dictionnaires spécialisés en argot contemporain des cités, où nous trouvons ces termes, ne mentionnent pas toujours leur prononciation. La prononciation de l’emprunt hagra dans le dictionnaire LC est décrit ainsi : prononcer avec le h guttural et le r roulé. Cette description approche la prononciation arabe aux non-arabophones d’une manière qui est probablement plus claire que serait dans ce cas par exemple la transcription en A.P.I. qui peut être incompréhensible pour ceux qui ne la

128 Roland LAFFITTE, « Deux termes de la langue des jeunes, hallouf et hmar », Bulletin de la SELEFA, 1er semestre 2009, n° 13, p. 42. 98

connaissent pas. Contrairement aux efforts du LC d’une prononciation arabe est décrite la prononciation du mot haram dans le dictionnaire CTT où nous trouvons la prononciation proposée [aʁam]. Comme nous pouvons observer, elle est déjà adaptée au système français. En ce qui concerne le mot hnouch, nous trouvons sa prononciation dans trois dictionnaires. Dans le LC, il y a la forme rnouch avec la description suivante : prononcer khnouch, avec le kh comme la jota espagnole. Le [ħ] dans la position initiale y est donc transformé en [x]. Nous observons une transformation pareille dans le DZ où nous trouvons les formes rnouch [xnuʃ] et également dans le CTT où il y a la forme arhnouch prononcée comme [axnuʃ]. Le seul dictionnaire qui conserve le h au moins dans la forme graphique est le BQ (hnouches) mais il ne mentionne pas la prononciation. Alena Podhorná-Polická et Anna-Caroline Fièvet constatent à ce propos : « Toutes les consonnes arabes qui posent des difficultés de prononciation pour les « Français de souche » (la pharyngale [ħ], la glottale [ʔ], la vélaire [ɣ] et l’uvulaire [χ]) tendent à se transformer en /r/, réalisé le plus souvent comme la vélaire [x]129». En ce qui concerne la prononciation du mot ahchouna, la situation est également assez intéressante. Dans notre corpus, nous rencontrons la prononciation [aʃuma] de la rappeuse Diam’s dont l’origine n’est pas arabe, dans le CTT [haxʃuma] ou [haxʃma] et dans le BQ, où nous ne trouvons pas la prononciation, nous supposons également la prononciation un peu différente vu les formes graphiques y mentionnées : lahchouma ou larchouma. Dans le bulletin de la SELEFA130, nous trouvons d’autre formes de ce mot : hachma, hachouma, archouma, ahchouma, hach, hache, larchouma, hechma, hchoum avec la précision que actuellement probablement gagnent du terrain la forme hachma et l’apocope hach. Cette variété des formes y est expliquée par la variété des formes en arabe : l’arabe dialectal connaît le verbe « avoir honte, rougir » prononcé [ħʃəm] (qui est également présent dans notre corpus), le substantif « humiliation » prononcé [ħʃu:mæ] est également hašma, « timidité, honte ». Dans le BQ nous trouvons encore l’information que dans certaines formes (lahchouma, larchouma etc.) est intégré l’article ce qui également explique la variété des formes de cet emprunt (BQ).

129 Alena PODHORNÁ-POLICKÁ, Anne-Caroline FIÉVET, « Emprunts dans l’argot…», srt. cit., p. 53. 130 R. LAFFITTE, « Deux mots familiers de la langue des jeunes, hachma et hala », Bulletin de la SELEFA, 2ème semestre 2006, n° 8, p. 27. 99

5.2.2.1. Proposition de la réalisation graphique des ḥ [ħ], h [h]

Nous voyons que la réalisation phonique des consonnes h [h] et ḥ [ħ] n’est pas du tout unifiée dans les arabismes de notre corpus. En ce qui concerne la forme graphique, les emprunts de notre corpus sont dans la plupart de cas des emprunts récents et leurs formes graphiques ne sont pas encore transformées suite à la prononciation assez variée. Comme la plupart d’entre eux y est utilisée par des arabophones, nous proposerions de respecter la forme graphique proposée par des interprètes, c’est-à-dire h, pour les deux consonnes. Nous nous rendons compte que la différence entre la consonne ḥ et h est ainsi effacée dans la forme graphique, mais nous supposons que la translittération ḥ n’aurait pas une valeur énonciative pour les locuteurs non arabophones. Nous supposons que leur réalisation phonique dépendra, comme aujourd’hui, des compétences linguistiques des locuteurs. Vu le fait que la consonne h ne se prononce pas en français, il y a la possibilité qu’elle sera par la suite « effacée » dans la forme graphique et dans la réalisation phonique comme nous l’observons dans le mot maboul ou seulement dans la réalisation phonique comme dans le cas de l’emprunt haram où le dictionnaire CTT mentionne déjà la prononciation [aʁam]. Or, nous pensons que cette réalisation graphique sera la plus claire et que nous pourrions ainsi simplifier la recherche dans le RapCor surtout quant aux mots avec le nombre élevé de variantes graphiques que nous observons par exemple dans les mots hnouchs et ces variantes rnouch ou arhnouch ou dans le mot ahchouna avec des variantes lahchouna, larchouna, hahchouna.

5.2.3. Consonnes ‘ [ʔ], ᶜ [ʕ]

En général, le hamza, c’est-à-dire une occlusive glottale sourde et le ayn, c’est-à-dire une fricative pharyngale sonore, sont négligés par les Européens131. Dans notre corpus, dans lequel la moitié d’interprètes est arabophone, la situation est un peu différente même si un bon nombre de ces consonnes est également négligé.

131 André LANLY, Le français d’Afrique du Nord, Paris, PUF, 1962, p. 114. 100

Tableau nº 44 : Arabismes comprenant les consonnes ‘[ʔ] et ᶜ [ʕ] Mot arabe Translitté- Prononciation Forme et Arabisme Pronon- Sens Interprète originel ration arabe prononciation forme ciation du mot et code maghrébin (dictionnaire) pochette française de la (chanson de chanson rap) (A/N) (ᶜarbiyya [ʕarˑbiyya] - arbiya [arbi:ja] arabe Rohff (A عرت ية ROH13 (ᶜarbūš [ˑʕarbuʃ] - arbouche [ʕarbuʃ] arabe Hamé (A عرت ىش LAR02 bardᶜa [ˑbardʕa] barda [baʁda] barda [baRda] bagage Akhenaton ال ثردح (PR) (N) AKH15 (qā’id [kɑːʔid] caïd [kaid] caïd [kaid] chef de Ekoué (N ق اي ذ (PR) bande LAR01 caïds Rohff (A) ROH13 (fi-sāᶜa [fiˑsɑːʕa] fissa [fisa] fissa [fisa] vite Booba (A ف ال ساعة (PR) BOO05 (ᶜaguːn [ʕaˑguːn] - hagoun [ħagun] idiot, Rohff (A ف ال ساعة bête ROH05 (ᶜandik [ʕænˑdɛk] - handek [ħandek] atten- Rohff (A ع ىذك tion ! ROH11 zaᶜma [ˑzaʕma] - zarma [za ma] Ma Abd Al زءمي parole! Malik (N) Tu BES02 [za ma] parles! Rohff (A) ROH05 [zaʁma] Akhenaton (N) AKH19 [za ma] Disiz la Peste (N) DLP11 Légénde : A – rappeur d’origine arabe N – rappeur d’origine non arabe

Le hamza et l’ayn sont négligés dans les emprunts qui se datent dans l’époque de la colonisation de l’Afrique et qui sont donc déjà intégrés en français (p. ex. : barda, fissa, caïd. La situation plus variée se produit dans les emprunts récents avec les consonnes traitées dans la position initiale. Dans les formes graphiques nous pouvons observer le développement d’une nouvelle consonne : h (hagoun, en arabe ᶜaguːn, handek, en arabe ᶜandik) ou r (zarma, en arabe zaᶜma). En ce qui concerne leur prononciation, dans les mots hagoun et handek, nous observons la prononciation de la consonne [ħ] : [ħagun] et [ħandek]. Cette prononciation imprécise probablement reflète la nouvelle consonne développée au lieu du ᶜ [ʕ] dans la position initiale. Le mot zarma apparaît dans notre corpus cinq fois dans les chansons de quatre rappeurs différents dont deux sont arabophones et deux ne le sont pas. Il faut constater que nous entendons clairement le [ʁ], présent dans les formes graphiques, seulement dans une des variantes. Dans les autres variantes, nous pouvons observer la prononciation de /r/ à la fin 101

de syllabe qui est de plus en plus courant en français contemporain (dans la prononciation familière). Il s’agit d’un /r/ uvulaire qui n’est ni fricative, ni vibrante. Il s’agit d’une spirante dont la prononciation s’approche à des voyelles (nous pouvons même parler du début de la vocalisation). C’est pourquoi il est possible de l’entendre parfois comme /a:/. Pour indiquer la prononciation plus ouverte, on utilise le signe [ ]132. Nous pouvons observer que la consonne r au lieu de l’ayn est bien intégrée dans la forme graphique. Nous n’avons pas trouvé des variantes graphiques du mot zarma dans le corpus et même les dictionnaires s’accordent (seulement dans le BQ, il y a, à côté de la forme zarma, également la variante zerma). Nous voulons encore mentionner deux emprunts dans lesquels l’ayn dans la position initiale a été simplement omis et aucune autre consonne n’a pas été développée (dans la forme écrite). Il s’agit des mots arbiya et arbouche (ᶜarbiyya et ᶜarbūš en arabe). La prononciation du mot arbiya [arbi:ja] correspond à la forme écrite, il n’y a donc aucune consonne au début et le mot commence directement par la voyelle, tandis que dans le mot arbouche nous entendons la prononciation [ʕarbuʃ], c’est donc la prononciation arabe du mot (les deux mots sont utilisés par les rappeurs d’origine arabe).

5.2.3.1. Proposition de la réalisation graphique des ‘ [ʔ], ᶜ [ʕ]

En ce qui concerne la réalisation du hamza et de l’ayn la situation est plus compliquée, car les symboles utilisés pour leur translittération n’existent pas en français et même leur réalisation phonique y est assez étrangère. Après avoir analysé les emprunts dans notre corpus, nous observons que, dans la plupart de cas, ils ne se réalisent pas en français. Ils ont disparu surtout dans les emprunts provenant déjà de l’époque de la colonisation d’Afrique. Or, nous avons observé également le développement d’une nouvelle consonne comme h ou r dans la forme graphique ou bien la réalisation phonique de l’ayn sans avoir appui dans la forme écrite (arbouche). Nous proposerions donc de respecter la tendance française d’omettre ces consonnes dans la forme écrite, au moins dans la position finale. La situation différente se produit dans les mots où ces consonnes, surtout l’ayn, se trouve dans la position initiale. Deux emprunts (hagoun, handek) dans lesquels s’est développée la consonne h dans la position initiale sont retenus par les dictionnaires ainsi : agoun (BQ), hendek (LC). Même si nous comprenons que le h dans la forme écrite veut signaliser un son qui précède encore la voyelle,

132 Nous voudrions remercier pour cette précision aussi que pour la transcription du mot à M. Tomáš Duběda, maître de conférences au département de translatologie à l’Université Charles de Prague. 102

nous nous penchons pour la solution proposée par le dictionnaire BQ qui ne réalise aucune consonne même au début du mot. Nous imaginons que la consonne h dans la position initiale pourrait être plutôt un « élément perturbateur » dans certains mots, comme par exemple harbouche, harbiya où nous pouvons déjà attendre, sans la consonne h dans la position initiale, la relation avec le mot arabe. Nous proposons de garder la « nouvelle » consonne dans les cas où elle semble être déjà intégrée, les utilisateurs et les dictionnaires s’accordent nous n’avons donc pas trouvé d’autres variantes graphiques (hendek, zarma).

5.2.4. Consonnes emphatiques

Même si nous n’avons trouvé que trois mots comprenant des consonnes emphatiques, nous pouvons constater que les consonnes emphatiques ne sont pas négligées en français, mais qu’elles sont remplacées par leurs variantes non-emphatiques (ça veut dire que ṣ est remplacé par s, ḍ par d, ṭ par t et ẓ par z). Ce sont même les rappeurs arabophones (dans notre corpus) qui les remplacent ainsi.

Tableau nº 45 : Arabismes comprenant les consonnes emphatiques Mot arabe Translitté- Prononciation Forme et Arabisme Pronon- Sens Interprète originel ration arabe prononciation forme ciation du mot et code maghrébin (dictionnaire) pochette française de la (chanson de chanson rap) (b-ṣaḥtkum [bsˁaːħkum] - bsartkoum [bsaħtkum] bravo Rohff (A ت صحث ROH04 ك ىم ḥanūṭ [ħanuːtˁ] - hanout [ħanut] épice- Rat Luciano ح ىىت rie (N) FFA01 nuṣ nuṣ [nusˁnusˁ] - nouss nouss [nusnus] moitié- Rat Luciano و ىس moitié (N) FFA01 و ىس Légende : A – rappeur d’origine arabe N – rappeur d’origine non arabe

5.2.4.1. Proposition de la réalisation graphique des consonnes emphatiques

Dans ce cas, la proposition de la réalisation graphique des consonnes emphatiques sera assez simple. Nous proposons de garder l’usage actuel, donc de remplacer les consonnes emphatiques par celles non-emphatiques de la même manière que nous pouvons l’observer dans notre corpus: bsartkoum prononcé [bsaħtkum] dans le corpus, [bsˁaːħkum] en arabe, hanout, [ħanut] dans le corpus, [ħanuːtˁ] en arabe et nouss nouss, [nusnus] dans le corpus, [nusˁnusˁ] en arabe. 103

5.2.5. Voyelles

Comme nous avons dit dans la partie théorique à propos des voyelles, en arabe standard n’existent que trois voyelles brèves (a, i, u) et trois voyelles longues (a:, i:, u:). Le système vocalique dans les dialectes est plus riche qu’en arabe standard et il est, comme en arabe standard, influencé par l’environnement consonantique. Les dialectes maghrébins, qui sont moins riches en voyelles que les dialectes orientaux, sont caractérisés par la grande occurrence de la voyelle neutre e. Il n’est pas donc surprenant que les arabismes dans notre corpus ne contiennent pas seulement les trois voyelles de l’arabe standard ce qui est dû d’une part à la prononciation dialectale, d’autre part au transfert d’une langue (l’arabe) à l’autre (le français) qui est plus riche en voyelles.

Tableau nº 46 : Voyelles Mot arabe Translitté- Prononciation Forme et Arabisme Pronon- Sens du Interprète originel ration arabe prononciation forme ciation mot et code maghrébin (dictionnaire) pochette française de la (chanson chanson de rap) bālik [bɑ:lɛk] alg. belek [belek] Disiz la ت آل يك Peste (N) DLP11 (ḥass [ħass] / [ħɛss] hass [he:s] Rohff (A ارحس ROH09 (ḥāšam [ħaʃɛm] / hecheun [heʃœn] Booba (A ا ضمح [ħaʃəm] BOO08 ?? [ḫanūna [χnuːna] khnona [xona خ ىىن BES09 (miskīn [məskiːn] mesquin,e mesquine [mɛskin] pauvre Rohff (A م س ک يه [mɛsk , in] type ROJ01 (PR) mesquin misquine [miskin] Diam’s (N) [meskin]/ DIV01 [miskin] (CTT) (samm [səmm] - seum [sœm] colère, Ali (A ال سم rage ALI08 sem [sœm] Akhenaton (N) AKH15 sum [sœm] Rat Luciano (N) FFA11 seum [sœm] Booba (A) BOO07 seum [sœm] Bil’in (?) BES06 seum [sœm] Nessbeal (A) BON01 104

(waš [waʃ] / [wɛʃ] wech [wɛʃ] wesh [wɛʃ] comment? Booba (A واش (PR) quoi ? BOO05 ouech [wɛʃ] Menzo (A) FFA10 ouaich [wɛʃ] Disiz la Peste (N) DLP15 whèsh [wɛʃ] Mattéo Falkone (?) BES08 (zubb, pl. [zɛb] [zɔb] PR zbèb [sbɛp] pénis Booba (A زت هة zbūb [zbɛb] [zœb] CTT BOO08 Légende : ?? – rappeur n’a pas été reconnu A – rappeur d’origine arabe N – rappeur d’origine non arabe ? – origine du rappeur n’a pas été retrouvée

En analysant les arabismes du corpus, nous avons observé plusieurs phénomènes intéressants en ce qui concerne l’adaptation et la transformation des voyelles pendant leur passage de l’arabe au français. D’abord, c’est l’influence de la consonne sur la voyelle. Comme nous avons dit supra, ce sont souvent des consonnes d’arrière (laryngales, pharyngales, vélaires ou emphatiques) qui influencent la prononciation des voyelles en arabe. Nous supposons que la présence de ces consonnes, qui sont difficiles à réaliser pour les non arabophones, puisse avoir également une influence sur la réalisation des voyelles en français. Nous pouvons l’observer dans les mots khnona, hecheun et hass. La présence de la vélaire [x] dans la position initiale a probablement un influence sur la prononciation de la voyelle suivante également dans le mot khnona qui est prononcé [χnuːna] en arabe, tandis que [xona] dans notre corpus. Nous rencontrons dans le dictionnaire BQ également la variante rnouna. Dans ce cas, la prononciation de la voyelle originale est conservée mais c’est la prononciation de la consonne initiale qui est transformée en [R]. Nous supposons que la transformation de la première voyelle dans la forme verbale hecheun, prononcé ([ħaʃɛm] / [ħaʃəm] en arabe, [ħeʃœn] dans notre corpus, est également causée par la pharyngale qui la précède et qui influence sa prononciation (a en arabe, e en français). La pharyngale ḥ influence la prononciation de la voyelle suivante a déjà en arabe ([ħass] / [ħɛss]) et cette double prononciation a été reprise en français où nous pouvons entendre soit [has], soit [hes]/[hɛs] (la consonne initiale peut varier, cf. supra), tandis que la forme graphique reste la même dans notre corpus ainsi que dans le seul dictionnaire (DZ) où nous avons trouvé ce mot : hass. Ensuite, nous avons remarqué qu’un nombre de voyelles a la tendance d’être prononcé vers [ɛ] en arabe dialectal ce qui influence naturellement la prononciation française comme 105

dans les mots belek, hass, wesh ou zbèb de notre corpus. La prononciation algérienne du mot arabe bālik [bɑːlɛk] peut expliquer le e présent dans la forme (écrite et orale) de ce mot en français : belek, tandis que le premier e dans le mot reste un peu opaque, car il existe en français également la variante balek. Or, nous supposons qu’il s’agit de la même tendance de prononcer la voyelle a vers e comme nous l’observons dans d’autres arabismes de notre corpus, par exemple dans le mot hass dont nous avons parlé supra et qui a deux prononciations de la voyelle en arabe [ħass] / [ħɛss] ainsi qu’en français. Le mot arabe waš est, comme le mot précédent, prononcé de deux façons en arabe [waʃ] / [wɛʃ] et il existe en français sous plusieurs variantes graphiques (wech, wesh, wèche, ouèche, ouech, ouaich etc.) qui correspondent à la réalisation phonétique [wɛʃ]. Il est intéressant de mentionner encore le nombre assez élevé des variantes graphiques mais avec une seule réalisation phonétique : le son [w] peut être enregistré en français comme w ou comme ou, [ɛ] comme e, è, ai ou ê et le son [ʃ] comme sh ou ch. Nous pouvons considérer toutes les formes graphiques comme correctes même si les graphèmes /w/ ou /sh/ font allusion à l’origine étrangère du mot ce qui peut expliquer l’emploi de leurs variantes /ou/, /ch/ dont l’emploi est plus habituel en français. Nous pouvons observer la tendance à prononcer la voyelle a comme [ɛ] en arabe également dans deux emprunts qui sont déjà bien intégrés en français du point du vue graphique ainsi que phonique. Ce sont des emprunts bled [blɛd] et clebs [klɛps], en arabe bilād prononcé soit [bilɑːd], soit [bilɛːd] et kalb prononcé soit [kalb], soit [kɛlb]. Finalement, nous allons parler du mot zbèb (dans notre corpus), zubb, zbūb (en arabe) qui a plusieurs variantes graphiques dans les dictionnaires français (zob, zobi, zobbi, zboub, zeub) et qui sont parfois assez différentes. Ce mot fait partie de l’argot français à partir de 1894 (PR) et nous supposons que les formes trouvés dans les grands dictionnaires (PR : zob, TLF zob, zobi, zobbi) et dans les dictionnaires de l’argot (DA : zob, zobi, DFNC : zob) reflètent une prononciation « francisée » des variantes déjà adaptées en français, tandis que les formes dans les dictionnaires spécialisés en argot des cités (DZ : zboub, CTT : zeub) ainsi que dans le corpus (zbèb) sont plus proches à la prononciation en arabe maghrébin [zɛb]/[zbɛb] ou nous observons de nouveau la tendance à prononcer une voyelle, u dans ce cas là, vers [ɛ]. Nous pouvons y supposer un récent emprunt de ce mot à l’arabe dialectal. Le troisième phénomène qui a attiré notre attention en analysant les voyelles est la grande occurrence de la voyelle neutre ultra-brève ə en arabe maghrébin ce qui provoque le développement d’un nouveau son vocalique là où le rencontre de deux consonnes est inhabituel en français. Nous pouvons l’observer dans trois emprunts : hecheun, seum (sem,

106

sum) et mesquine/misquine. En ce qui concerne la forme verbale hecheun [ħeʃœn], elle est prononcée de deux façons en arabe ([ħaʃɛm] / [ħaʃəm]). Nous pensons que c’est à cause du rencontre inhabituel de deux consonnes dans la variante [ħaʃəm] qu’un nouveau son a été développé. Dans le mot mesquine/misquine, qui est en arabe prononcé [məskiːn], nous pouvons également observer un nouveau son vocalique entre deux consonnes (m et s) dont la rencontre n’est pas habituelle en français. En plus, on trouve deux variantes de ce son vocalique qui est soit [e]/[ɛ] soit [i]. Le son [i] provient probablement de la translittération du mot arabe : miskīn, et comme cette forme n’est pas présente dans les dictionnaires, il est probable qu’il s’agit d’un remprunt récent. Nous supposons que dans le mot seum [sœm], prononcé [səmm] en arabe, il s’agisse du même cas de figure. Il n’est pas habituel en français que le mot serait formé seulement par deux consonnes (et e caduc). Nous supposons que cela serve, comme dans les cas précédents, juste à simplifier la prononciation d’une combinaison inhabituelle des consonnes. Il est intéressant de remarquer que toutes les trois variantes graphiques (seum, sem, sum) de notre corpus se prononcent de la même façon par les rappeurs d’origine arabe aussi que par ceux d’origine non arabe. Nous pensons que ceci est le résultat de la diffusion orale du mot, tandis que la forme écrite n’est pas très connue par ses utilisateurs.

5.2.5.1. Proposition de la réalisation graphique des voyelles

Comme le système vocalique arabe est assez varié et compliqué, il diffère d’un dialecte à l’autre, il y a un grand nombre d’allophones et une forte influence par l’environnement consonantique, nous n’allons pas proposer une réalisation graphique dans ce cas là. En plus, en analysant les changements des voyelles dans les arabismes, nous n’avons pas trouvé la présence d’une voyelle qui serait fortement inexplicable. En créant les lemmes de ces emprunts, nous allons prendre en considération les formes graphiques dans les dictionnaires et également (dans les cas moins clairs) leur fréquence dans le corpus RapCor.

107

6. Lemmatisation des arabismes

En analysant les arabismes de notre corpus du point de vue fréquentiel, lexicographique ou phonique, nous avons toujours rencontré un nombre élevé de variantes graphiques de ces lexèmes ce qui peut poser des difficultés dans l’analyse. C’est pourquoi nous voudrions dans ce chapitre définir leurs lemmes unifiés. Tout d’abord, nous allons procéder à une analyse comparative entre les entrées dans les dictionnaires (qui varient assez souvent) et les formes graphiques de notre corpus (et parfois aussi dans le corpus RapCor entier). Nous allons également prendre en considération les observations faites pendant l’analyse phonique de nos arabismes parce que il s’avère que dans certains cas les translittérations des lexèmes de l’arabe au français ne sont pas précises et qu’il y apparaissent des consonnes qui n’ont aucune justification. Trop de variantes différentes d’un lexème peut mener à la confusion.

6.1. Variabilité graphique des arabismes dans les dictionnaires et dans le corpus

Avant de procéder à la lemmatisation des arabismes, nous voulons résumer les variantes graphiques trouvées pendant notre recherche. D’abord, nous allons présenter les formes qui ne sont pas unifiées dans les dictionnaires et ensuite celles qui ont été trouvées dans le corpus mais leur forme n’a pas été retenue dans les dictionnaires employés. Les deux tableaux montrent le nécessité d’unifier les variantes graphiques pour améliorer le travail dans le RapCor et pour y simplifier la recherche des emprunts à l’arabe. Tableau nº 47 : Formes graphiques dans les dictionnaires Forme 1 Forme 2 Forme 3 Forme 4 Forme 5 ahchouma (CTT) hahchouma (CTT) lahchouma (BQ) larchouma (BQ) balek (BQ) bellek (LC) belek (DZ) clebs (PR, LR, TLF, DA, cleb (DA) klebs (DZ) DFNC, DZ) crouille (PR, DA, DZ) crouillat (PR, TLF, crouya (DA) crouilla (DA) DA, DFNC) fissa (PR, TLF, DA, DZ) fiça (DA) foulek (BQ, CTT) fouleck (DZ) arhnouch (CTT) hnouches (BQ) rnouch (LC, DZ) quène (CTT) ken (BQ) kéner (DZ) kène (DZ) kiffer (PR, LR, CTT, BQ, kifer (PR, LR) LC, DZ)

108

mesquin (PR, LR, TLF, DA, mesquine (BQ, DZ) meskina (BQ) mesquina (LC) CTT) sem (BQ) seum (LC) seume (DZ) sème (DZ) timinik (DZ) t’minik (DZ) t’manik (DZ) wech (PR) ouech (BQ) wesh (LC, DZ) ouèche (DZ) wèche (DZ) zarma (BQ, DZ) zerma (BQ) zob (PR, TLF, DA, DFNC) zobi (TLF, DA) zobbi (TLF) zeub (CTT) zboub (DZ)

Tableau nº 48 : Formes graphiques du corpus vs formes graphiques des dictionnaires Forme(s) corpus Forme(s) dictionnaires bsartkoum bsahtek (BQ) klébard clébard (PR, LR, DA, DFNC) foolek foulek (CTT, BQ), fouleck (DZ) hagoun agoun (BQ) handek hendek (LC) harami, hram, halam haram (CTT) hnouchs arhnouch (CTT), hnouches (BQ), rnouch (LC, DZ) khnona rnouna (BQ) misquine mesquin (PR, LR, TLF, DA, CTT), mesquine (BQ, DZ), meskina (BQ), mesquine (LC) sum sem (BQ), seum (LC), seume (DZ), sème (DZ) ouaich, whèsh wech (PR), ouech (BQ), wesh (LC, DZ), wèche (DZ), ouèche (DZ) whèsh-whèsh wesh-wesh (DZ) zbèb zob (PR, TLF, DA, DFNC), zobi (TLF, DA), zobbi (TLF), zeub (CTT), zboub (DZ)

6.2. Méthode des filtres successifs

Comme nous avons déjà indiqué dans le chapitre Analyse lexicographique, nous allons utiliser le méthode des filtres successifs pour établir des lemmes des emprunts à l’arabe de notre corpus133. La méthode consiste à chercher les mots traités dans plusieurs dictionnaires que nous avons divisé en trois groupes selon leur type (voir §4.1. Typologie des dictionnaires). Tableau nº 49 : Répartition des dictionnaires selon leur type Filtre 1 Dictionnaires généraux PR, LR, TLF Filtre 2 Dictionnaires de l’argot DA, DFNC Filtre 3 Dictionnaires spécialisés en argot des cités CTT, BQ, LC, DZ

Les lemmes des dictionnaires vont passer selon le schéma suivant :

Filtre 1 → Filtre 2 → Filtre 3 → Filtre 4

133 Cette méthode a été également utilisée par Tereza Sekaninová dans sa mémoire pour établir des lemmes des mots verlanisés dans le RapCor. 109

L’ordre des dictionnaires (PR – LR – TLF – DA – DFNC – CTT – BQ – LC – DZ) a été établi au début et nous l’avons respecté (sauf quelques cas problématiques, voir infra). Or, comme le signale Tereza Sekaninová dans son mémoire Stéréotypes liés au verlan: variation diatopique dans le rap français, le lemme peut être déterminé déjà par le premier filtre et il n’est pas donc indispensable que tous les mots passent par tout le processus134. Ce processus du filtrage va être expliqué dans les parties suivantes.

6.2.1. Filtre 1

Le premier filtre consiste à obtenir les lemmes des arabismes qui se trouvent dans le premier groupe de dictionnaires (PR, LR, TLF). Si tous les trois dictionnaires sont en accord en ce qui concerne le lemme (ou si le mot est présent seulement dans un dictionnaire de ce groupe), nous l’utilisons comme le lemme.

ex. niquer niquer (PR) – niquer (LR) - niquer (TLF) → lemme : niquer ex. wesh, whèsh, ouech, ouaich wech (PR) – x (LR) – x (TLF) → lemme : wech

Si, après avoir recherché le mot donné dans les trois dictionnaires, il s’avère qu’il existe deux ou plus variantes graphiques d’un mot, d’autres dictionnaires seront consultés et sera établi comme notre lemme le lemme le plus fréquent.

ex. crouille crouille, crouillat (PR) – x (LR) – crouillat (TLF) (nous avons deux variantes graphiques différentes, il faut donc vérifier les formes dans d’autres dictionnaires) crouille, crouya, crouilla, crouillat (DA) – crouillat (DFNC) – x (CTT) – x (BQ) – x (LC) - crouille (DZ) (nous avons maintenant les variantes : crouille (3x), crouillat (4x), crouya (1x), crouilla (1x) → lemme : crouillat

Si le nombre de variantes graphiques des dictionnaires est égal, c’est le lemme du dictionnaire consulté en premier lieu que l’on utilise.

134 Tereza SEKANINOVÁ, Stéréotypes liés au verlan : variation diatopique dans le rap français, Mémoire de master sous la direction d’Alena Polická, Brno, Masarykova univerzita, Filozofická fakulta, 2013, p. 75. 110

6.2.1.1. Cas problématiques relevant du filtre 1

Il est nécessaire de mentionner deux mots où l’analyse par filtre s’est démontré comme plus compliqué. Commençons avec le lexème mesquin,e qui a été trouvé dans les dictionnaires généraux et dans un dictionnaire de l’argot mais comme l’adjectif, tandis que dans notre corpus, il y a présenté comme le nom. Pour cette raison, nous n’avons pas accepté le lemme proposé par ces deux groupes de dictionnaires et afin de déterminer le lemme de ce mot en fonction du nom un troisième filtre a été utilisé pour trouver le lemme de ce mot. Deuxième lexème problématique a été l’emprunt wech dont le lemme a été déterminé déjà à l’aide du premier filtre. Comme cette forme graphique n’a été trouvé pas une seule fois dans notre corpus, il a été intéressant d’étudier sa présence dans le corpus RapCor. De 757 chansons préparées pour l’emploi dans la plateforme TXM, il n’y a aucune occurrence de la forme graphique wech, 4 occurrences de ouech, 3 occurrences de ouaich et une occurrence de whèsh. Par contre, nous y avons trouvé 22 occurrences de la variante wesh. Comme la forme graphique wech n’est pas incorrecte, nous allons utiliser le lemme du PR, mais la variante graphique wesh qui semble être plus utilisée, sera également proposée.

6.2.2. Filtre 2

Le deuxième filtre devrait consister à obtenir les lemmes des arabismes qui se trouvent dans le deuxième groupe de dictionnaires (DA, DFNC), mais pas dans la première. Or, il y a aucun mot qui ne serait pas présent également dans le premier groupe de dictionnaires, nous ce filtre n’a pas été employé.

6.2.3. Filtre 3

Le troisième filtre consiste à obtenir les lemmes des arabismes qui se trouvent seulement dans le troisième groupe de dictionnaires (CTT, BQ, LC, DZ ).

ex. zarma x (PR) – x (LR) – x (TLF) – x (DA) – x (DFNC) – x (CTT) – zarma, zerma (BQ) – x (LC) – zarma (DZ) → lemme : zarma

111

Si le nombre de variantes graphiques des dictionnaires est égal, c’est le lemme du dictionnaire consulté en premier lieu qui est utilisé.

ex. belek x (PR) – x (LR) – x (TLF) – x (DA) – x (DFNC) – x (CTT) – balek (BQ) – bellek (LC) – belek (DZ) → lemme : balek

6.2.3.1. Cas problématiques relevant du filtre 3

Dans ce groupe, les lemmes dans les dictionnaires sont assez variables et pendant notre recherche nous avons constaté quelques écarts concernant l’adaptation phonique de l’arabe. Pour cette raison, nous allons les brièvement analyser à part et dans certains cas, nous allons proposer des lemmes différant de ceux dans les dictionnaires. Commençons avec des consonnes difficiles à adapter en français abordées dans le chapitre 5.2. En ce qui concerne le lexème ahchouma, nous avons trouvé dans les dictionnaires 4 lemmes différents : ahchouma (CTT), hahchouma (CTT), lahchouma (BQ), larchouma (BQ). Selon la méthode des filtres successifs, ce serait le lemme ahchouma qui devrait être utilisé. Or, dans ce cas là, on pourrait se poser la question si le lemme hchouma ne devrait pas être proposé, comme cette variante est plus proche de mot originel arabe ḥchouma et qu’il peut semble superflu de se référer au lemme ahchouma avec le préfixe servant probablement uniquement comme un appui pour la prononciation. Maintenant, passons au mot hnouch (forme pochette) présent dans les dictionnaires sous les formes suivants : arhnouch (CTT), rnouch (LC, DZ), hnouches (BQ). Le mot provient de l’arabe ḥanūš, prononcé [ħnuːʃ] et pour cette raison, les variantes qui ne contiennent pas la consonne /h/ dans le position initiale pourraient éventuellement être écartées. Dans ce cas, il serait opportun d’omettre la variante du CTT et c’est le lemme du BQ qui serait donc plus approprié dans sa forme au singulier : hnouche. En ce qui concerne le mot bsartkoum (forme pochette), il est présent dans le BQ comme bsahtek. Nous allons utiliser ce lemme, mais nous voulons proposer de noter également la variante bsahtkoum avec une explication : bsahtek en arabe « à ta santé », bsahtkoum « à votre santé », les deux en français « bravo ». Ensuite, c’est le mot khnona (forme pochette) où nous allons proposer un autre lemme que celui dans le dictionnaire. Dans le BQ nous trouvons le lemme rnouna, tandis que le mot 112

arabe est ḫanūna (ḫ peut être translittéré également comme kh; voir supra §5.2.1.). Nous proposons de tenir compte du remplacement de la consonne r- dans la position initiale par kh- pour respecter la forme et la prononciation arabe du mot, le lemme proposé est khnouna. Selon le méthode des filtres successifs, le lemme du mot seum, sem, sum (formes du corpus) devrait être sem. Or, après une analyse phonique de ce mot, nous proposons de sauter le lemme proposé par le BQ et d’utiliser la forme du dictionnaire suivant, qui est le LC, seum. Cette forme reflète mieux la prononciation qui semble être généralement utilisée : [sœm]. Quant au mot verlanisé ken (forme pochette), il est présent dans le CTT sous la forme quène. Cette forme nous a paru inhabituelle et nous avons donc vérifié la situation dans le corpus entier (757 chansons) et nous avons découvert que c’est seulement la forme ken qui y figure (19 occurrences). Nous proposons alors de sauter de nouveau le CTT et d’utiliser la forme du dictionnaire suivant : BQ – ken.

Tableau nº 50 : Récapitulation des lemmes « problématiques » Lemme (forme corpus) Lemme (filtre successif) Lemme final ahchouma ahchouma hchouma bsartkoum bsahtek bsahtek (+ var. graph. bsahtkoum) hnouch arhnouch hnouche khona rnouna khnouna ken quène ken seum, sem, sum sem seum

Pendant le recherche des mots dans les dictionnaires, nous avons également abordé quelques lexèmes contenant des voyelles différant de celles employées dans le corpus. Or, comme le système vocalique de l’arabe est assez compliqué et variable, (voir supra §5.1.1 et §5.2.5.) nous allons respecter les résultats des filtres successifs et nous allons seulement proposer des variantes graphiques qui semblent d’être plus en usage. Il est évident que ces variantes ne peuvent pas être utilisées pour la lemmatisation des mots dans le plateforme TXM (où seulement un lemme est possible), mais il nous paraît utile de le remarquer pourtant.

Tableau nº 51 : Variantes graphiques des lemmes (« voyelles ») Lemme (forme pochette) Lemme (filtre successif) Variante graphique belek balek belek handek hendek handek

113

6.2.4. Filtre 4

Le quatrième filtre consiste à obtenir les lemmes des arabismes qui ne sont pas présents dans les dictionnaires employés.

ex. nouss nouss ex. x (PR) – x (LR) – x (TLF) – x (DA) – x (DFNC) – x (CTT) – x (BQ) – x (LC) – x (DZ) → lemme : nouss nouss

S’il y a plusieurs formes du même lexème, c’est la variante plus fréquente qui est utilisée comme lemme. En ce qui concerne le mot din/dîn, dans notre corpus il a y deux occurrences de la forme din et deux occurrences de la forme dîn. Nous l’avons donc recherché encore dans le RapCor pour obtenir la variante plus fréquente.

ex. din, dîn ex. x (PR) – x (LR) – x (TLF) – x (DA) – x (DFNC) – x (CTT) – x (BQ) – x (LC) – x (DZ) din (2x), dîn (2x), dans le Rapcor din (6x), dîn (2x) → lemme : din

Notons encore que nous avons essayé de trouver tous ces mots dans 757 chansons de RapCor pour pouvoir comparer des variantes graphiques éventuelles. Or, sauf le mot din (6 occurrences)/ dîn (2 occurrences), la recherche a été sans résultat.

114

6.2.5. Résultats de la lemmatisation

Finalement, nous allons résumer les résultats obtenus : nous avons 14 lemmes issus du PR, 5 lemmes du CTT, 9 lemmes issus du BQ, 4 lemmes du LC, 3 lemmes du DZ. 11 lemmes n’ont pas été trouvés dans les dictionnaires. Nous avons proposé 2 lemmes, différant de ceux dans les dictionnaires, sur la base de l’analyse phonique des mots originels arabes (voir le graphique suivant).

Graphique nº 13 : Source des lemmes

Légende : non dict. – lemmes qui ne sont pas présents dans les dictionnaires prop. par nous – lemmes proposés par nous (sur la base de l’analyse phonique)

Nous avons également proposé des variantes graphiques de 4 lemmes, parce que ceux- là nous semblent – sur la base de la recherche dans 757 chansons - être plus utilisées que les lemmes des dictionnaires. Il faut encore noter que nous avons trois fois rompu l’ordre des dictionnaires établi. Dans deux cas c’était le dictionnaire BQ qui a été privilégié au lieu du dictionnaire CTT, dans un cas le dictionnaire LC a été privilégié au lieu du BQ. Avant de terminer, nous voudrions encore remarquer que même si nous avons parfois privilégié un lemme au lieu d’un autre et dans deux cas, nous n’avons même utilisé aucun lemme proposé par les dictionnaires, nous ne voulons pas les marquer comme « fautifs ». Nous supposons que les auteurs des dictionnaires partent de la réalisation phonique et graphique des locuteurs français dont la compétence de réaliser des phonèmes inconnus ne doit pas être toujours bonne. Par contre nous, nous avons pris en considération la translittération des mots arabes et la prononciation arabe des mots originels en désignant des lemmes des arabismes du corpus.

115

En guise de conclusion

Avant de conclure, nous allons résumer quelques résultats de notre travail qui nous semblent importants d’un point de vue statistique. D’un nombre total de 197 arabismes, la majorité, soit 59% (117 items), ont été utilisés par les rappeurs d’origine arabe. En revanche, un tiers de mots (31%, soit 61 mots du corpus) ont été proclamés par les rappeurs dont l’origine n’est pas arabe (ce qui n’exclut pas pour autant la connaissance de la langue arabe, tout au moins passive). L’origine du rappeur nous reste inconnue pour les 7% (soit 13 items) et dans 3% (6 mots), il a été impossible de désigner qui, parmi les voix superposées, est le rappeur utilisant l’arabisme en question (voir supra §3.6). Le graphique suivant montre la répartition des arabismes dont l’utilisateur et son origine nous sont connus (c’est-à-dire la répartition de 178 arabismes).

Graphique nº I : Répartition des arabismes du corpus selon l’origine des rappeurs

Dans notre corpus, nous avons pu repérer 48 arabismes différents dont 23% (11 mots) se trouvent dans tous les trois types de dictionnaires employés (1. dictionnaires généraux, 2. dictionnaires de l’argot, 3. dictionnaires spécialisés en argot contemporain des cités). Quatre items barda, caïd, clébard, gourbi, soit 8% des mots du corpus analysé, figurent seulement dans les dictionnaires généraux et dans les dictionnaires de l’argot. Le plus grand

116

groupe, soit 46% (22 mots), est formé par les arabismes présents seulement dans les dictionnaires spécialisés en argot contemporain des cités. Le dernier groupe est formé par les arabismes qui n’ont été trouvés dans aucun dictionnaire et qui forment 23% (11 items) de notre corpus comme l’illustre le tableau suivant. Il s’agit de 11 mots dont 9 ont été utilisés par les rappeurs d’origine arabe (voir §4.2.1.4).

Graphique nº II : Répartition des arabismes selon leur présence dans les différents types de dictionnaires

Le graphique suivant illustre la répartition des arabismes du quatrième groupe (c’est-à- dire des arabismes qui ne se trouvent pas dans les dictionnaires) selon l’origine des rappeurs. Nous observons que les rappeurs qui ne sont pas d’origine arabe n’ont utilisé que deux items de ce groupe (26%), tandis que les rappeurs d’origine arabe en ont utilisé neuf (74%).

Graphique nº III : Répartition des arabismes qui ne sont pas présents dans les dictionnaires selon l’origine des rappeurs

117

Conclusion

Le but du présent mémoire était la description et l’analyse des arabismes dans le corpus composé des chansons du rap français. Ce dernier a son origine dans les inspirations afro-américaines par les jeunes des banlieues des grandes villes françaises. Evolué en un style autonome, il peut être considéré comme un des vecteurs de la diffusion des parlers des jeunes urbains. Les emprunts à l’arabe y occupent statut prestigieux vu la présence active des jeunes issus de l’immigration maghrébine dans ces « quartiers sensibles ». La question primordiale était de savoir si l’emploi des arabismes était devenu une marque identitaire pour tous les jeunes rappeurs quel que soit leur origine ou si l’emploi des arabismes s’avérait plutôt comme un signe d’un ancrage dans les deux cultures. Bref, l’objectif principal était de voir si les arabismes seront majoritairement utilisés par les jeunes issus des pays où l’arabe est une des langues parlées et quels items retenus seront déjà adapté en tant qu’arabismes-candidats à la dictionnairisation officielle. C’est pourquoi nous avons divisé notre corpus, composé de 126 chansons parues entre 2003 et 2008, en trois parties équilibrées. Toutes les chansons ont été tirées du corpus de rap francophone, le RapCor, créé à l’Institut des Langues et Littératures romanes de la Faculté des Lettres de l’Université de Masaryk à Brno. Notre corpus a été par la suite divisé en trois subcorpus : 1) corpus des chansons interprétées par les rappeurs d’origine arabe, 2) celui où les rappeurs sont d’origine non arabe et 3) subcorpus formé par les chansons des groupes de rap aux origines mélangées dont certains membres sont également d’origine arabe. Ainsi, il a été possible d’observer s’il existe un lien direct entre l’origine du rappeur et la fréquence de l’emploi des arabismes.

L’analyse a apporté de nombreux acquis intéressants concernant les arabismes et leur intégration dans le lexique français. Nous avons commencé la recherche avec la vérification de l’hypothèse du rôle de l’origine ethnique du rappeur sur la fréquence de son emploi des arabismes. Selon cette première hypothèse, nous avons supposé que les rappeurs d’origine arabe vont utiliser les arabismes plus souvent que leurs collègues d’origine non arabe. Cette hypothèse a été confirmée. Dans le corpus, de 178 arabismes (corpus restreint), 66% ont été employés par les rappeurs d’origine arabe (voir supra §3.6). Or, il faut également noter que si nous faisons une comparaison interprète par interprète, certains rappeurs d’origine non arabe ont employé plus 118

d’arabismes que ceux d’origine arabe (concrètement Disiz la Peste parmi les rappeurs indépendants et Rat Luciano parmi les rappeurs des groupes de rap). Nous avons rencontré également quelques rappeurs (les membres des groupes de rap) d’origine arabe qui n’ont utilisé aucun arabisme dans leurs chansons (Wallen du collectif Beni Snassen, Mourad de La Rumeur). Le chapitre suivant est une analyse lexicographique où nous avons observé l’intégration des arabismes dans les dictionnaires différents. Les dictionnaires ont été répartis en 3 groupes, selon leur type : dictionnaires généraux, dictionnaires de l’argot et finalement dictionnaires spécialisés en argot contemporain des cités. Or, comme notre corpus reflète la langue dans son évolution très récente, ils y figurent également les arabismes qui n’ont été trouvé dans aucun dictionnaire, donc d’autres sources ont été utilisées. Au début, nous avons présumé que les rappeurs d’origine arabe vont utiliser des arabismes moins connus, pas encore présents dans les dictionnaires. Cette deuxième hypothèse a été également confirmée. Grâce à leur connaissance de la langue, les rappeurs d’origine arabe sont capables d’utiliser également les arabismes différents de ceux qui sont généralement connus par les jeunes et donc également saisis dans les dictionnaires. Particulièrement dans ces cas-là, il y a une valeur symbolique qui s’y rajoute et, dont nous avons parlé supra, un signe d’affection ou de complicité parmi ceux qui se comprennent entre eux. Ils revendiquent ainsi l’appartenance à leurs origines.

Dans le chapitre concernant l’adaptation phonique, nous avons comparé la prononciation arabe des mots originels, la prononciation de ces mots dans les chansons analysées et, éventuellement, la prononciation proposée par les dictionnaires (cf. §5.2.). Or, l’accent a été mis sur les mots qui contiennent dans les mots originels arabes les phonèmes inconnus et difficiles à réaliser en français. Nous avons supposé que les formes de ces mots ne seront pas unifiées en français et elles vont différer selon la compétence (plus ou moins bonne) de chaque utilisateur. Cette supposition a été en majorité confirmée. Un nombre élevé de variantes graphiques a été trouvé pendant la recherche dans les dictionnaires, ainsi que pendant la comparaison des variantes graphiques du même mot dans les chansons des interprètes divers, ces variantes différant souvent des formes graphiques trouvées dans les dictionnaires. En ce qui concerne notre troisième hypothèse, nous avons supposé que la réalisation phonique des arabismes par les rappeurs d’origine arabe serait plus proche de la réalisation phonique des mots originaux arabes, tandis que la réalisation des interprètes non

119

arabes sera influencée par leur compétence de réaliser correctement les phonèmes arabes. Cette hypothèse n’a pas pu être ni confirmée, ni réfutée. Le corpus ne présente pas suffisamment d’arabismes utilisés également par le groupe A et le groupe B afin de pouvoir faire une comparaison objective. Parmi les arabismes utilisés, il y un certain nombre de réalisation correctes (c’est-à-dire la prononciation correcte des phonèmes arabes) même par les rappeurs d’origine non arabe et de l’autre côté, il faut mentionner que la bonne prononciation des phonèmes arabes n’est pas de règle parmi les rappeurs d’origine arabe qui souvent « francisent » la prononciation du tel ou tel mot. En marge de la comparaison de prononciation, nous avons également tenté une comparaison des formes graphiques. Dans deux groupes des rappeurs, nous avons trouvé des formes graphiques correspondantes à la translittération des mots arabes, ainsi que les formes influencées par le français ou par les efforts d’indiquer l’existence d’une consonne en arabe mais qui n’a pas d’équivalent en français. Sur la base de l’analyse dans ce chapitre, nous avons proposé la réalisation graphique de certains phonèmes ce qui pourrait être utile pour unifier les lemmes des arabismes dans tout le corpus RapCor.

Étant donné que pendant toute la recherche nous rencontrions un nombre élevé de variantes graphiques des emprunts à l’arabe, la tâche finale était de proposer leur lemmatisation afin d’obtenir des lemmes unifiés et ainsi simplifier leur recherche dans le RapCor. Nous avons utilisé la méthode des filtres successifs (proposée et utilisée par Tereza Sekaninová dans son mémoire Stéréotypes liés au verlan : variation diatopique dans le rap français) qui aide à désambiguïser les variantes graphiques. Or, il faut mentionner que nous avons également profité des résultats de l’analyse phonique pour déterminer les lemmes les plus précis possible. Dans trois cas, nous avons rompu l’ordre des dictionnaires établi, parce que la forme présente dans tel ou tel dictionnaire n’a correspondu ni à la transcription, ni à la prononciation arabe et nous n’avons trouvé le lemme correct que dans le dictionnaire suivant. Dans deux cas, nous avons décidé de proposer le lemme par nous-mêmes, car les lemmes dans les dictionnaires n’ont pas du tout correspondu à la situation en arabe. Il s’agit de deux lemmes suivants : hchouma, khnouna (dans les dictionnaires présents comme ahchouma, hahchouma, lahchouma, larchouma et rnouna). Nous avons également proposé des variantes graphiques de certains arabismes parce que, même si les lemmes selon la méthode des filtres successifs n’ont pas été incorrects, il nous semble qu’il existe d’autres variantes graphiques qui sont actuellement plus en usage.

120

Pour conclure, nous voulons constater que même si deux des trois hypothèses formulées au départ ont été confirmées, il serait hâtif de faire un lien direct entre l’utilisation des arabismes et l’origine de l’interprète. Comme le corpus utilisé est relativement restreint et ne couvre qu’une période très courte, les résultats obtenus n’ont pas de valeur générale. Nous voulons surtout donner un aperçu sur les tendances et des bases méthodologiques pour le traitement des arabismes dans le RapCor, éventuellement également dans les dictionnaires d’argot franco-tchèque à venir. En plus, la problématique des arabismes en français est très riche, qu’il fallait mener encore plusieurs recherches sur un corpus beaucoup plus large pour pouvoir décrire ce domaine d’une manière plus exhaustive. Il serait intéressant, par exemple, de mener une recherche concernant l’enregistrement des arabismes dans les dictionnaires, son évolution aussi que des raisons pour tel ou tel type d’enregistrement en interrogeant les auteurs des dictionnaires. Comme l’évolution des arabismes en français est une étude dynamique, il serait également intéressant de réaliser une recherche du point de vue diachronique pour pouvoir observer comment l’emploi des arabismes change dans le temps. La recherche pour vérifier jusqu’à quel point les arabismes sont lexicalisés (ou non lexicalisés) sur un corpus plus large ne serait pas non plus sans intérêt.

121

Liste des illustrations

Cartes

Carte nº 1 : Carte de l’expansion musulmane du VIIe au IXe siècle 16 Carte nº 2 : Pays où l’arabe a une position de la langue officielle 17

Tableaux

Tableau nº 1 : Importance des fonctions linguistiques dans les argots de métiers/sociologiques 24 Tableau nº 2 : Rappeurs d’origine arabe 35 Tableau nº 3 : Rappeurs d’origine non arabe 35 Tableau nº 4 : Membres de Fonky Family et leur origine ethnique 36 Tableau nº 5 : Membres de La Rumeur et leur origine ethnique 36 Tableau nº 6 : Membres de Beni Snassen et leur origine ethnique 36 Tableau nº 7 : Rappeurs des groupes classés selon leur origine 37 Tableau nº 8 : Albums et nombre de chansons analysées 37 Tableau nº 9 : Dictionnaires utilisés 38 Tableau nº 10 : Liste de nos consultants 40 Tableau nº 11 : Répartition des chansons dans les subcorpus 41 Tableau nº 12 : Chansons avec arabisme(s) chez les interprètes étudiés 43 Tableau nº 13 : Liste des arabismes dans les trois subcorpus 44 Tableau nº 14 : Arabismes communs à tous les trois subcorpus avec leurs variantes graphiques 45 Tableau nº 15 : Structures répétitives dans le corpus entier 46 Tableau nº 16 : Arabismes aux fréquences élevées dans notre corpus 46 Tableau nº 17 : Occurrences des arabismes aux fréquences élevées (dans notre corpus) dans 757 chansons 46 Tableau nº 18 : Arabismes aux fréquences élevées dans les subcorpus A, B, C 47 Tableau nº 19 : Arabismes dont l’utilisateur (ou son origine) nous reste inconnu 48 Tableau nº 20 : Arabismes utilisés dans les featurings 48 Tableau nº 21 : Arabismes aux fréquences élevées (rappeurs d’origine arabe) 49 Tableau nº 22 : Arabismes aux fréquences élevées (rappeurs d’origine non arabe) 49 Tableau nº 23 : Fréquence des arabismes avec une seule occurrence 49 Tableau nº 24 : Arabismes avec plusieurs variantes graphiques 50 Tableau nº 25 : Nombre d’arabismes utilisés par les rappeurs étudiés 52 Tableau nº 26 : Présence des arabismes dans les dictionnaires 57 122

Tableau nº 27 : Arabismes et leurs attestations (groupe nº 1) 60 Tableau nº 28 : Marques lexicographiques dans les dictionnaires généraux (groupe nº 1) 62 Tableau nº 29 : Sens du mot mesquin(e) 63 Tableau nº 30 : Sens du mot bled 65 Tableau nº 31 : Sens du mot niquer 66 Tableau nº 32 : Sens du mot kiffer 67 Tableau nº 33 : Arabismes et leurs attestations (groupe nº 2) 68 Tableau nº 34 : Marques lexicographiques dans les dictionnaires généraux (groupe nº 2) 69 Tableau nº 35 : Arabismes qui ne se trouvent pas dans les dictionnaires 72 Tableau nº 36 : Tableau récapitulatif des variantes graphiques 81 Tableau nº 37 : Arabismes avec plusieurs formes graphiques présents dans les dictionnaires généraux 85 Tableau nº 38 : Arabismes avec plusieurs formes graphiques présents seulement dans les dictionnaires spécialisés en argot des cités 85 Tableau nº 39 : Consonnes communes à l’arabe et au français 88 Tableau nº 40 : Voyelles et semi-voyelles communes a l’arabe et au français 88 Tableau nº 41 : Consonnes propres à l’arabe 91 Tableau nº 42 : Arabismes comprenant la consonne kh [x] 94 Tableau nº 43 : Arabismes comprenant les consonnes ḥ [ħ], h [h] 96 Tableau nº 44 : Arabismes comprenant les consonnes ‘ [ʔ] et ᶜ [ʕ] 101 Tableau nº 45 : Arabismes comprenant les consonnes emphatiques 103 Tableau nº 46 : Voyelles 104 Tableau nº 47 : Formes graphiques dans les dictionnaires 108 Tableau nº 48 : Formes graphiques du corpus vs formes graphiques des dictionnaires 109 Tableau nº 49 : Répartition des dictionnaires selon leur type 109 Tableau nº 50 : Récapitulation des lemmes problématiques 113 Tableau nº 51 : Variantes graphiques des lemmes (« voyelles ») 113

Graphiques

Graphique nº 1 : Chansons avec/sans arabismes dans le corpus entier 42 Graphiques nº 2 et 3 et 4 : Les chansons avec/sans arabismes dans les trois subcorpus 42 Graphique nº 5 : Répartition de tous les arabismes du corpus selon l’origine des rappeurs 51 Graphique nº 6 : Répartition des arabismes selon leur présence dans les différents types de dictionnaires 59 Graphique nº 7 : Présence des arabismes dans les dictionnaires 77

123

Graphique nº 8 : Présence des arabismes dans les différents types de dictionnaires 78 Graphique nº 9 : Fréquence des arabismes dans les dictionnaires 80 Graphique nº 10 : Répartition selon le nombre de formes graphiques 83 Graphique nº 11 : Répartition des arabismes avec plusieurs formes graphiques 83 Graphique nº 12 : Répartition des variantes graphiques selon les types de dictionnaires 84 Graphique nº 13 : Sources des lemmes 115

124

Liste des abréviations

A - rappeur d’origine arabe A.P.I. - Alphabet phonétique international AS – autre source adj. - adjectif adv. - adverbe adv. interrog. - adverbe interrogatif arg. - argotique arg. milit. - argot militaire BQ - Bien ou quoi? (2004) CTT - Comment tu tchatches? (2007) DA - Le Dictionnaire de l’argot (2010) DFNC - Le Dictionnaire du français non-conventionnel (1991) DZ - Le Dictionnaire de la zone f. - féminin fam. - familier I - Internet interj. - interjection intr. - intransitif LC - Lexik des Cités (2007) loc. - locution LR - Le Petit Larousse (2009) m. - masculin N - rappeur d’origine non arabe n. - nom N. d’arab. - nombre d’arabismes n° - numéro non dict. - lemmes qui ne sont pas présents dans les dictionnaires p. - page p. ex. - par exemple p. ext. - par extension péj. - péjoratif pop. - populaire PR - Le Nouveau Petit Robert de la langue française (2009) prop. par nous -lemmes proposés par nous (sur la base de l’analyse phonique) qqn - quelqu’un régional. - régionalisme RL - Roland Laffitte SELEFA - Société d’Études Lexicographiques et Étymologiques Françaises et Arabes TLF - Trésor de la langue française informatisé tr. - transitif var. graph. – variante graphique v. - verbe vulg. -vulgaire

125

Liste des annexes

Annexe nº 1 : Liste des chansons analysées ...... 134

Annexe nº 2 : Arabismes du corpus dans les dictionnaires ...... 140

Annexe nº 3 : Fréquence des arabismes dans le corpus ...... 148

Annexe nº 4 : Lemmes des arabismes ...... 152

126

Bibliographie

Articles et monographies :

ANZORGUE, Isabelle, « Du bledos au toubab », Le français en Afrique, 2006, n° 21, pp. 59 - 68.

BARONTINI, Alexandrine, « Pratiques et transmission de l’arabe maghrébin en France », Langues et cité, octobre 2009, n° 15, p. 6.

BENVENISTE, E. : Problèmes de linguistique générale 1, Paris, Gallimard,1993.

BÉTHUNE, Christian, Le Rap : une esthétique hors la loi, Paris, Édition Autrement, 2003.

BILLIEZ, Jacqueline, TRIMAILLE, Cyrile, « Pratiques langagières de jeunes urbains: peut- on parler de ‘parler’»?, GALAZZI, Enrica, MOLINARI, Chiara (éds.), Les Français en émergence, Berne, Peter Lang, 2007, pp. 95-109.

BOCQUET, José-Louis, PIERRE-ADOLPHE, Philippe : Rap ta France, Paris, Editions 84, 1999.

BOYER, Henri : «« Nouveau français », « parler jeune » ou « langue des cités » ? Remarques sur un objet linguistique médiatiquement identifié », Langue française, 1997, vol. 114, n°1, pp. 6 -15. [disponible sur persee.fr]

BROUSSEAU, Anne-Marie, « Identités linguistiques, langues identitaires : synthèse », Arborescences : revue d’études françaises, 2001, n° 1. [disponible en ligne : http://id.erudit.org/iderudit/1001938ar]

CALVET, Louis-Jean, La Sociolinguistique, Paris, PUF, 1998.

CAUBET, Dominique, « Du baba (papa) à la mère, des emplois parallèles en arabe marocain et dans les parlures jeunes en France », Cahiers d’études africaines, 2001, nº 163 – 164, pp. 735 – 748.

CAUBET, Dominique « La "darja", langue de culture en France », Revue Hommes et migrations, 2004, n°1252, pp. 34 – 44.

CAUBET, Dominique, Les mots du bled : création contemporaine en langues maternelles, les artistes ont la parole, Paris, L’Harmattan, 2004.

127

CAUBET, Dominique « Métissages linguistiques ici (en France) et là-bas (au Maghreb) », VEI-Enjeux, septembre 2002, n°130, pp. 117-132.

CAUBET, Dominique, MILLER, Catherine, « Parlers jeunes - entre street langage et branchitude », Revue Economia, 2011, n° 12, pp. 69-71.

CAUBET, Dominique, « Quelques aspects de la présence maghrébine dans la culture urbaine en France », Ethnologies, 2001, vol. 22, nº 1, p. 249–256.

DABÈNE, Louise, BILLIEZ, Jacqueline : « Le parler des jeunes issus de l’immigration », In : VERMÈS, Geneviève, BOUTET, Josiane (dirs.), France, pays multilingue, Paris, L’Harmattan, 1987, pp. 62-77.

DUBOIS, Jean et al., Grand dictionnaire, Linguistique et sciences du langage, Paris, Larousse, 2007 (1ère éd. 1994).

EL HOUSSI, Madjid, Arabismes dans la langue française du moyen âge à nos jours, Paris, L’Harmattan, 2003.

FOURCAUT, Annie, « Les banlieues populaires ont aussi une histoire », Ceras - revue, 2007, n°299. [disponible en ligne : http://www.ceras-projet.com/index.php?id=2384]

GOUDAILLIER, Jean-Pierre, « De l’argot traditionnel au français contemporain des cités », La linguistique, 1/2002, vol. 38, pp. 5-24.

GREVISSE, Maurice, Bon usage : grammaire française avec des remarques sur la langue française d’aujourd’hui, Gembloux, J. Duculot, 1969.

HAMON, Albert : Les mots du français, Paris, Hachette Éducation,1992.

HAMMOU, Karim, « La vérité au risque de la violence. Remarques sur la stylistique du rap en français », Communication au colloque "De l’impolitesse à la violence verbale", Avignon, 2005. [disponible en ligne: http://halshs.archives-ouvertes.fr/docs/00/53/03/28/PDF/2006.10.01_- _parrhA_sia_version_2006.pdf]

Handbook of the International Phonetic Association : a guide to the use of the International Phonetic Alphabet, Cambridge, Cambridge University press, 1999.

KARAAGAÇ, Nurcan Delen, « Sur l’innovation lexicale et l’intégration phonétique et sémantique de quelques emprunts lexicaux en français et en turc », Synergies Turquie, 2009, n° 2, pp. 147 – 158. [disponible en ligne : http://ressources-cla.univ-fcomte.fr/gerflint/Turquie2/nurcan.pdf]

128

LABOV, William, The social stratification of English in New York City, Washington, Center for Applied Linguistics, 1966.

LAFFITTE, Roland, « Deux mots familiers de la langue des jeunes, hachma et hala », Bulletin de la SELEFA, 2ème semestre 2006, n° 8, pp. 27 – 28.

LAFFITTE, Roland, « Deux termes de la langue des jeunes, hallouf et hmar », Bulletin de la SELEFA, 1er semestre 2009, n° 13, pp. 41 – 42.

BAUDE, Olivier, SIBILE Jean, « L’arabe en France », Langues et cité, octobre 2009. n° 15.

BAUDE, Olivier, « La langue des jeunes », entretien avec Françoise Gadet, Langues et cité, septembre 2003. n° 2.

GODEAU, Romdhana et al., « La problématique des interférences langagières entre l’arabe et le français », document proposé par le Lycée Français de Jérusalem (AEFE zone Europe du Sud-est) et validé par Michel NEYRENEUF, IA-IPR d’arabe, le 15 juin 2010. [disponible en ligne : http://www.youscribe.com/catalogue/ressources-pedagogiques/education/cours/la- problematique-des-interferences-langagieres-entre-l-arabe-et-1415994]

LANLY, André, Le français d’Afrique du Nord, Paris, PUF, 1962.

MARTINET, André, Éléments de linguistique générale, Paris, Colin, 1991.

MOUNIN, Georges, Dictionnaire de la linguistique, Paris, PUF, 1974.

OLIVERIUS, Jaroslav, ONDRÁŠ, František, Modernì spisovná arabština: Vysokoškolská učebnice I. dìl., Praha, SET OUT, 2007.

PECQUEUX, Anthony, « La violence du rap comme katharsis : vers une interprétation politique », Volume!, 2004, vol. 3, n° 2, pp. 55 – 70. [disponible en ligne: http://volume.revues.org/1959]

PEREIRA, Christophe, « L’Arabe maghrébin », Communication au colloque international "Langues d’Europe et de la Méditerranée", Nice, 2005. [disponible en ligne : http://www.academia.edu/1223154/Larabe_maghrebin]

PERGNIER, Maurice, Les anglicismes: danger ou enrichissement pour la langue française?, Paris, PUF, 1989.

PETRÁČEK, Karel, Základy gramatického systému spisovné arabštiny, Praha, Státní pedagogické nakladatelství, 1991.

129

PODHORNÁ-POLICKÁ, Alena, FIÉVET, Anne-Caroline, « Approximations perceptives des locuteurs et éclaircissements stylistiques des auteurs : les arabismes à la lumière de l’argot des jeunes (des cités) », In Intrangers. Post-migration et nouvelles frontières de la littérature beur. Bruxelles: Academia Bruylant, 2011, pp. 77-122.

PODHORNÁ-POLICKÁ, Alena, FIÉVET, Anne-Caroline,« Argot commun des jeunes et français contemporain des cités dans le cinéma français depuis 1995 : entre pratiques des jeunes et reprises cinématographiques », Glottopol, revue sociolinguistique en ligne, 2008, n° 12, pp. 212-240.

PODHORNÁ-POLICKÁ, Alena, FIÉVET, Anne-Caroline: « Emprunts dans l’argot des Jeunes Tchèques et Français », In : KACPRZAK, Alicja, GOUDAILLIER, Jean-Pierre (éds.), Standard et périphéries de la langue, Lodz - Lask : Oficyna Wydawnicza Leksem, 2009, pp. 47-58.

SABLAYROLLES, Jean-François, JACQUET-PFAU, Christine, « Les emprunts : du repérage aux analyses. Diversité des objectifs et des traitements », Néologisa, 2008, n° 2, pp. 19 – 38.

SOURDOT, Marc, « Argot, jargon, jargot », Langue française, 1991, n° 90, pp. 13 – 27.

SOURDOT, Marc, « La dynamique du langage des jeunes », Résonances, 2003, n° 10, pp. 4 - 5. [disponible en ligne : http://www.vs.ch/NavigData/DS_314/M17353/fr/Le%20parler%20des%20jeunes.pdf]

TREPS, Marie, Les mots voyageurs. Petit histoire du français venu d’ailleurs, Paris, Seuil, 2003.

TRIMAILLE, Cyril, « Rap français, humour et identité(s) », Écarts d’identité, 2001, n° 97, pp. 52-54.

VAILLANT, Emmanuel, L’immigration, Toulouse, Éditions Milan, 1996.

VICHERAT, Mathias, Pour une analyse textuelle du rap français, Paris, L’Harmattan, 2003.

WALTER, Henriette, BARAKÉ, Bassam, Arabesques, l’Aventure de la langue arabe en Occident, Paris, Robert Laffond, 2006.

WALTER, Henriette, Français dans tous les sens, Paris, Robert Laffont, 1988.

WALTER, Henriette, L’aventure des langues en Occident, leur origine, leur histoire, leur géographie, Paris, Robert Laffont, 1994.

130

WALTER, Henriette, L’aventure des mots français venus d’ailleurs, Paris, LGF - Livre de Poche, 1999.

WALTER, Henriette, Le français d’ici, de là, de là-bas, Paris, JC Lattés, 1999.

WALTER, Henriette, « La langue français et les mots migrateurs », Synergies Italie, 2008, n° 4, pp. 15 – 21. [en ligne: http://ressources-cla.univ-fcomte.fr/gerflint/Italie4/walter.pdf]

WALTER, Henriette, « Où commencent les innovations lexicales?», Langue française, vol. 90 n°1, Parlures argotiques, pp. 53-64. [sur http://www.persee.fr]

ZEGNANI, Sami, « Le rap comme activité scripturale : l’émergence d’un groupe illégitime de lettrés », Langage et société, 4/2004, n° 110, pp. 65-84. [disponible en ligne: www.cairn.info/revue-langage-et-societe-2004-4-page-65.htm]

Thèses et mémoires :

BARRIO, Sébastien, Sociologie du rap français : État des lieux (2000/2006), Thèse de doctorat sous la direction de Rémy Ponton, Paris, Université Paris VIII, 2007. [disponible en ligne : http://1.static.e-corpus.org/download/notice_file/849665/BarrioThese_corr.pdf]

LEHKA-LEMARCHAND, Iryna, Accent de banlieue. Approche phonétique et sociolinguistique de la prosodie des jeunes d’une banlieue rouennaise, Thèse de doctorat sous la direction de Claude Caitucoli et David Le Gac, Rouen, Université de Rouen, 2007. [disponible en ligne : http://www.afcp-parole.org/doc/theses/these_ILL07.pdf]

SEKANINOVÁ, Tereza, Stéréotypes liés au verlan : variation diatopique dans le rap français, Mémoire de master sous la direction d’Alena Polická, Brno, Masarykova univerzita, Filozofická fakulta, 2013. [disponible en ligne : http://is.muni.cz/th/263203/ff_m/DP_Tereza_Sekaninova.pdf]

Dictionnaires :

COLIN Jean-Paul, MÉVEL Jean-Pierre, LECLÈRE Christian : Dictionnaire de l’argot, Paris, Larousse, 2010.

COBRA LE CYNIQUE, Dictionnaire de la Zone, en ligne: http://www.dictionnairedelazone.fr.

GOUDAILLIER, Jean-Pierre, Comment tu tchatches ! Dictionnaire du français contemporain des cités, 3e éd., Maisonneuve & Larousse, Paris, 2001.

131

LAFFITTE, Roland, YOUNSI, Karima, Bien ou quoi ?La langue des jeunes à Ivry et Vitry- sur-Seine, Paris, SELEFA, 2004.

Lexik des cités : lexik des cités illustré, Paris, Fleuve noir 2007.

REY, Alain, CELLARD, Jacques, Dictionnaire du français non-conventionel, Paris, Hachette Éducation, 1991.

TLF. Trésor de la langue française informatisé, CNRS – ATILF en ligne : http://atilf.atilf.fr/tlf.htm

Dictionnaires (sources multimédias) :

Le Petit Larousse 2009. Dictionnaire Multimédia. Version CDROM

Le Nouveau Petit Robert de la langue française 2009. Dictionnaire alphabétique et analogique de la langue française. Version CD-ROM.

Sitographie : http://www.cairn.info/ http://www.persee.fr http://www.inalco.fr http://www.orthogrenoble.net http://www.dglflf.culture.gouv.fr/ http://www.primdev.atelier144.net http://www.dilap.com http://www.monotheisme.over-blog.com http://rapgenius.com http://www.forumislam.com http://www.yabiladi.com http://www.lexilogos.com http://www.dico-des-mots.com http://www.banlieue-connexion.com/france.html http://www.rap2france.com/ http://www.skyrock.com/ http://www.myspace.com/ http://www.soccers.fr http://www.lavi2rue.com http://fr.wikipedia.org http://en.wikipedia.org 132

Annexes

133

Annexe nº 1 : Liste des chansons analysées

Tableau nº I : Subcorpus A - chansons des rappeurs d’origine arabe Rappeur Chanson Album Année de Couplet Refrain Autres parties Code sortie (nombre) (x fois) Ali A.M.O.U.R. Chaos et Harmonie 2005 3 3 intro ALI11 Ali Chaos et Harmonie Chaos et Harmonie 2005 2 2 intro ALI07 Ali Génération scarface Chaos et Harmonie 2005 2 3 intro ALI02 Ali Golden boy Chaos et Harmonie 2005 2 2 - ALI04 Ali L’impasse Chaos et Harmonie 2005 3 6 - ALE01 Ali La vérité reste la vérité Chaos et Harmonie 2005 3 2 - ALI06 Ali Langage venimeux Chaos et Harmonie 2005 1 0 - ALI08 Ali Le chant des sirènes Chaos et Harmonie 2005 2 2 - ALI09 Ali Observe Chaos et Harmonie 2005 2 2 outro ALI03 Ali Oraison funèbre Chaos et Harmonie 2005 2 1+1 - ALI05 Ali Préviens les autres Chaos et Harmonie 2005 2 4 intro ALH01 Ali Rappel à l’ordre Chaos et Harmonie 2005 1 6 - ALI01 Ali Sang froid Chaos et Harmonie 2005 3 4 - AKW01 Ali Tolérance zéro Chaos et Harmonie 2005 3 1+1+1 - ALI10 Booba Alter Ego Le Panthéon 2004 2 1 outro BOW01 Booba Avant de partir Le Panthéon 2004 2 3 intro BLM01 Booba Baby Le Panthéon 2004 3 7 intro, outro BON01 Booba Commis d’office Le Panthéon 2004 4 2 intro, outro BOM01 Booba Hors saison Le Panthéon 2004 3 4 outro BOO04 Booba La faucheuse Le Panthéon 2004 3 3 intro, outro BOO05 Booba Le duc de Boulogne Ouest Side 2006 3 3 intro, outro BOO07 Booba Le mal par le mal Le Panthéon 2004 2 2 - BOO02 Booba Mon son Le Panthéon 2004 3 2 - BOO06 134

Booba No. 10 Le Panthéon 2004 3 3 intro BOO03 Booba Ouest side Ouest Side 2006 3 3 outro BOO08 Booba Pazalaza pour sazamuser Le Panthéon 2004 3 0 - BIB01 Booba R.A.P. Le Panthéon 2004 3 6 intro BSD01 Booba Tallac Le Panthéon 2004 1 0 outro BOO01 Rohff Avec ou sans Au Delà de Mes Limites 2005 3 6 - ROH04 Rohff Dis mon nom Au Delà de Mes Limites 2005 3 3 outro ROJ01 Rohff Hysteric love Le Code de l’Horreur 2008 4 4 - ROA01 Rohff L’Expression du malaise Le Code de l’Horreur 2008 3 2 intro ROH09 Rohff La puissance Au Delà de Mes Limites 2005 2 4 - ROH03 Rohff Le club des métaphores Au Delà de Mes Limites 2005 3 9 interlude, outro ROH07 Rohff Le temps passe Au Delà de Mes Limites 2005 3 8 outro ROH08 Rohff Le virus Le Code de l’Horreur 2008 3 3 - ROH12 Rohff Paris Le Code de l’Horreur 2008 3 5 intro ROH11 Rohff Premier sur le ghetto Au Delà de Mes Limites 2005 3 6 interlude, outro ROH05 Rohff Repris de la justesse Le Code de l’Horreur 2008 3 3 interlude, outro ROH10 Rohff Si seul Le Code de l’Horreur 2008 3 3 - ROW01 Rohff Starfukeuze Au Delà de Mes Limites 2005 3 5 intro, outro ROH06 Rohff Testament Le Code de l’Horreur 2008 1 0 - ROH13

135

Tableau nº II : Subcorpus B - chansons des rappeurs d’origine non-arabe Rappeur Chanson Album Année de Couplet Refrain Autres parties Code sortie (nombre) (x fois) Akhenaton Bien paraître Soldats de Fortune 2006 2 4 - AIS01 Akhenaton Bronx river Soldats de Fortune 2006 2 3 outro AKH23 Akhenaton Dans la cité Soldats de Fortune 2006 2 2 - AMV01 Akhenaton Déjà les Barbelés Soldats de Fortune 2006 2 2 intro ASK01 Akhenaton Du mauvais côté des rails Soldats de Fortune 2006 2 1+1+1 - AKH22 Akhenaton Entre la pierre et la plume Soldats de Fortune 2006 2 0 intro AKI02 Akhenaton La fin de leur monde Soldats de Fortune 2006 1 0 - AKS01 Akhenaton Live dans la discothèque Soldats de Fortune 2006 2 3 intro AKH19 Akhenaton Mots blessées Soldats de Fortune 2006 3 3 - AKH20 Akhenaton Quand ils rentraient chez eux Soldats de Fortune 2006 3 3 - AKH21 Akhenaton Soldats de fortune Soldats de Fortune 2006 3 4 - AKH15 Akhenaton Sur les murs de ma chambre Soldats de Fortune 2006 2 3 - AKD01 Akhenaton Troie Soldats de Fortune 2006 3 3 intro, outro AKH17 Akhenaton Vue de la cage Soldats de Fortune 2006 2 4 outro AKP01 Diam’s Big up Dans Ma Bulle 2006 3 5 outro DIA15 Diam’s Car tu portes mon nom Dans Ma Bulle 2006 3 8 outro DIA11 Diam’s Cause à effet Dans Ma Bulle 2006 2 3 - DIA17 Diam’s Confessions nocturnes Dans Ma Bulle 2006 1 0 intro, outro DIV01 Diam’s Feuille blanche Dans Ma Bulle 2006 3 2+1 outro DIA09 Diam’s Jeune demoiselle Dans Ma Bulle 2006 4 3 intro, outro DIA10 Diam’s La boulette Dans Ma Bulle 2006 3 8 intro, outro DIA07 Diam’s Ma France à moi Dans Ma Bulle 2006 3 4 outro DIA08 Diam’s Marine Dans Ma Bulle 2006 4 5+1 outro DIA12 Diam’s Me revoilà Dans Ma Bulle 2006 4 3 intro, outro DIJ01 Diam’s Par amour Dans Ma Bulle 2006 5 4 outro DIA14 Diam’s Parce Que Brut de Femme 2003 3 5 intro DIA06 136

Diam’s Petite banlieusarde Dans Ma Bulle 2006 1 0 - DIA18 Diam’s T.S. Dans Ma Bulle 2006 3 2+1 outro DIA16 Disiz la Peste Aime ton prochain comme toi- Itinéraire d’un Enfant 2004 3 6 outro DLP04 même Bronzé Disiz la Peste Bo gosse Histoires Extraordinaires 2005 3 3 intro DLP11 d’un Jeune de Banlieue Disiz la Peste Djiguen Itinéraire d’un Enfant 2004 2 12 intro, DLA02 Bronzé interlude, outro Disiz la Peste Fuck you (part 1) Histoires Extraordinaires 2005 3 5 intro, outro DLP07 d’un Jeune de Banlieue Disiz la Peste Fuck you (part 2) Histoires Extraordinaires 2005 3 2 intro, outro DLP15 d’un Jeune de Banlieue Disiz la Peste Inspecteur Disiz Histoires Extraordinaires 2005 3 3 intro, outro DLP17 d’un Jeune de Banlieue Disiz la Peste Jeune de banlieue Histoires Extraordinaires 2005 3 6+1 - DLP08 d’un Jeune de Banlieue Disiz la Peste Juste kiffer Histoires Extraordinaires 2005 3 3 - DLH02 d’un Jeune de Banlieue Disiz la Peste L’homme rendra des comptes Itinéraire d’un Enfant 2004 3 3 intro, outro DLH01 Bronzé Disiz la Peste La fille facile Histoires Extraordinaires 2005 2 1+1 . DLP12 d’un Jeune de Banlieue Disiz la Peste Lyly Histoires Extraordinaires 2005 3 3 intro, outro DLP09 d’un Jeune de Banlieue Disiz la Peste Melissa Histoires Extraordinaires 2005 3 6 intro DLP10 d’un Jeune de Banlieue Disiz la Peste Miss Désillusion Histoires Extraordinaires 2005 2 7 - DLP13 d’un Jeune de Banlieue

137

Disiz la Peste N Dioukel Itinéraire d’un Enfant 2004 3 2 intro, outro DPA01 Bronzé

Tableau nº III : Subcorpus C - chansons des groupes de rap Groupe de rap Chanson Album Année de Couplet Refrain Autres parties Code sortie (nombre) (x fois) Beni Snassen À nous seuls Spleen et Idéal 2008 3 3 - BES07 Beni Snassen Benef Benef Spleen et Idéal 2008 3 3 - BES08 Beni Snassen Beni Snassen Spleen et Idéal 2008 2 3 intro BES01 Beni Snassen Besoin d’oxygène Spleen et Idéal 2008 2 4 intro, outro BES03 Beni Snassen Bil’in Spleen et Idéal 2008 3 3 intro BES06 Beni Snassen Dramatique Spleen et Idéal 2008 3 4 - BEA01 Beni Snassen Être ou ne pas être Spleen et Idéal 2008 3 3 - BES12 Beni Snassen Gémeaux Spleen et Idéal 2008 2 4 intro BES13 Beni Snassen La mentale Spleen et Idéal 2008 2 0 - BES11 Beni Snassen Mauvaises graines Spleen et Idéal 2008 3 6+3 - BES09 Beni Snassen Ô combien Spleen et Idéal 2008 3 4 - BES02 Beni Snassen Parabellum Spleen et Idéal 2008 3 3 - BES10 Beni Snassen Requiem Spleen et Idéal 2008 3 4 - BES05 Beni Snassen Spleen et Idéal Spleen et Idéal 2008 3 8 - BES04 Fonky Family 1984 – Fallait que je le dise Marginale Musique 2006 1 0 outro FFK01 Fonky Family C’est ça ou rien Marginale Musique 2006 4 2 - FFA06 Fonky Family C’est plus comme avant Marginale Musique 2006 3 3 intro FFA02 Fonky Family C’est tout ce qu’on a Marginale Musique 2006 4 6 - FFA07 Fonky Family Cherche pas Marginale Musique 2006 4 5 - FFA14 Fonky Family Comme on débarque Marginale Musique 2006 4 3 - FFA05 Fonky Family Dans les yeux Marginale Musique 2006 4 0 - FFA11 Fonky Family Ils le savent Marginale Musique 2006 4 3 - FFA12 138

Fonky Family La guerre Marginale Musique 2006 4 8 - FFA03 Fonky Family Le plus grand des voyous Marginale Musique 2006 4 0 - FFA09 Fonky Family Le quartier Marginale Musique 2006 2 2 intro FFA04 Fonky Family Les affaires reprennent Marginale Musique 2006 4 3 outro FFA01 Fonky Family Marginale Musique Marginale Musique 2006 4 4 intro FFA08 Fonky Family On s’invite Marginale Musique 2006 4 4 intro FFA10 La Rumeur À nous le bruit Regain de Tension 2004 2 3 - LAR02 La Rumeur Il y a toujours un lendemain Du cœur à l’outrage 2007 2 6 - LAR13 La Rumeur Ils nous aiment comme le feu Regain de Tension 2004 2 3 - LAR03 La Rumeur Je suis une bande ethnique à Du cœur à l’outrage 2007 2 2 outro LSE01 moi tout seul La Rumeur Inscrivez greffier Regain de Tension 2004 2 3 - LAR06 La Rumeur L’encre va encore couler Regain de Tension 2004 1 0 intro LAR01 La Rumeur Les mots qui me viennent Regain de Tension 2004 2 2 intro, interlude, LAR09 outro La Rumeur Maître mot, mots du maître Regain de Tension 2004 2 2 - LAR11 La Rumeur Nom, prénom, identité Regain de Tension 2004 2 8 - LAR12 La Rumeur Nous sommes les premiers sur Regain de Tension 2004 2 2 intro LAR07 La Rumeur P.O.R.C. Regain de Tension 2004 3 5 - LAR05 La Rumeur Paris nous nourrit, Paris nous Regain de Tension 2004 4 3 - LAR08 affame La Rumeur Quand le diable est au piano Regain de Tension 2004 4 3 - LAR10 La Rumeur Soldat Lampda Regain de Tension 2004 3 3 - LAR04

139

Annexe nº 2 : Arabismes du corpus dans les dictionnaires

Tableau nº I : Arabismes du corpus – leurs formes dans les dictionnaires Arabisme Source Arabisme Marque Explication morphosémantique Signification Datation (forme(s) (forme(s) dictionnaire) lexicoga- (première pochette) phique attestation selon PR) ahchouma CTT ahchouma, hahchouma, n.f. - de l’arabe [ħæxʃuma] « infamie, honte » honte

arbiya RL arbiya, adj. et n. fém. - forme féminine de arbi, de l’arabe ᶜarabī, ‒iyya arabe (f.) arbouche BQ arbouch, arbouche, n.m. et f. - arabe, avec suffixe de type arabe algérien arabe babtou DZ babtou, n.m. - verlan de toubab 1. personne de BQ babtou, n.m. verlan de toubab race blanche CTT babtou, bab, n.m. verlan de toubab: [tubab] > [babtu] > [bab] (par européenne, apocope) occidental LC babtou, n.m. verlan de toubab 2. Français de souche 3. Africain ayant adopté le mode de vie européen barda PR barda, n.m. Fam. de l’arabe barda’a, « bât » chargement 1848 LR barda, n.m. Fam. de l’arabe barda’a, « bât d’âne » encombrant, TLF barda, n.m. Fam. de l’arabe barda’a, « bât » rembourré pour un bagage âne ou une mule, « couverture placée sur le dos de la bête » belek DZ belek ou faire belek, loc. - de l’arabe bélek, « faire attention » Attention ! BQ balek, interj., var.: belek de l’arabe bâlek, « attention! » LC bellek, interj. de l’arabe classique red bellek, « fais attention » bled PR bled, n.m. Fam. mot arabe maghrébin « terrain, pays » 1. village, coin fin XIXe LR bled, n.m. Fam. de l’arabe blad, « pays, région » isolé, éloigné TLF bled, n.m. Péj. emprunt à l’arabe d’Algérie blad, « terrain, 2. ville, village, pays», la forme de l’ar. class. étant bilād pays d’origine DZ bled, n.m. - de l’arabe bled, « pays » BQ bled, n.m. - de l’arabe maghrébin bled, « pays » 140

CTT bled, n.m. - de l’arabe maghrébin bled, « terrain, ville, pays » DA bled, n.m. - mot arabe d’Algérie blad, « terrain, pays » DFNC bled, n.m. - de l’arabe d’Algérie bilaëd, « campagne » ou « village », opposés à la ville blédard PR blédard, arde, n. et adj. Fam. et de bled 1. rustre, grossier 1926 péj. 2. qui est natif, qui TLF blédard, n.m. - dérivation de bled, suffixe -ard vient du bled DZ blédard, adj. - de bled BQ blédard, n.m. - - LC blédard, arde, n. - de l’arabe dialectal maghrébin blad DFNC blédard, n.m. - de bled bsartkoum BQ bsahtek, interj. - de l’arabe maghrébin b-sahtek, litt. « à ta santé!» bravo ! caïd PR caïd, n.m. Fam. de l’arabe qâid, « celui qui conduit » chef de bande 1694 LR caïd, n.m. Fam. de l’arabe qā’id, « chef » personnage TLF caïd, n.m. Arg./ de l’arabe qā’id « chef, commandant », considérable dans Pop. et participe actif subst. de qāda, « conduire, son milieu fam. gouverner » DA caïd, n.m. de l’arabe qā’-id, « chef » DFNC caïd, n.m. - - chekem RL chekem, n.m. - de l’arabe šakkām, qui est en argot un balance « souteneur » avant d’être une « balance » clébard PR clébard, n.m. Fam. de clebs chien 1934 klébard LR clébard ou clebs, n.m. Fam. arabe kalb, « chien » DA cleb, clebs ou clébard, n.m. - de l’arabe kelb, pl. kleb, « chien » DFNC clébard, n.m. - suffixation populaire de clebs clebs PR clebs, n.m. Fam. arabe klab chien 1920 LR clébard ou clebs, n.m. Fam. arabe kalb, « chien » TLF clebs, n.m. Arg. arabe d’Algérie kelb (ar. class. kalb), « chien », pl. klab (ar. class. kilāb) DZ clebs ou klebs, n.m. - déformation du mot arabe kelb, kleb, « chien » DA cleb, clebs ou clébard, n.m. - de l’arabe kelb, pl. kleb, « chien » DFNC clebs, n.m. - curieux pluriel arabo-français, venu de l’arabe 141

du Maghreb kleb, « Chiens! », pour arabe classique kilab crouille PR crouille ou crouillat, n.m. Pop. et de l’arabe khouya, « frère » Maghrébin (terme 1917 péj. raciste) TLF crouillat, n.m. Fam. et de l’arabe dialectal, (‘a) ḫūya, « mon frère » injur. DZ crouille, n. - de l’arabe houya, « mon frère » DA crouille, crouillat, crouilla, - du mot arabe (‘a)hùya, « mon frère » crouya, n.m. DFNC crouillat, n.m - de l’arabe khouya, « frère », où le kh est une glutturale (mal) traduite par un r en français din I din, n.m. - de l’arabe dîn ce qui est bien et dîn qui suit les principes de la religion musulmane fissa PR fissa, adv. Arg. de l’arabe fis-saea, « à l’heure même » vite 1909 TLF fissa, adv. Arg. de l’arabe fis-sāa, « à l’instant, vite » DZ fissa, adv. - de l’arabe fi sa’a, « vite, sur le champ » DA fissa, fiça, adv. - de l’arabe fi’s-sâ’a, « sur l’heure, très vite » foolek DZ fouleck, adj. et n. - - 1. désigne un BQ foulek, n.m. - dérivation de fou individu peu CTT foulek, adj. - ressufixation argotique de fou scrupuleux et RL foulek, foulec, fouleck, adj. et - resuffixation du terme arabe fulan / fulān, douteux n. « un(e) tel(le), machin, truc » (il s’agit d’une 2. fou hypothèse) 3. un tel, machin, truc gourbi PR gourbi, n.m. Fam. mot arabe d’Algérie habitation 1841 LR gourbi, n.m. Fam. de l’arabe qurbā, « parenté » misérable et sale TLF gourbi, n.m. - emprunt à l’arabe d’Algérie gurbī, « maison de terre, chaumière, hutte », qui se rattache peut- être à l’arabe classique qurbā, « parenté, voisinage »

142

DA gourbi, n.m. - de l’arabe d’Algérie gurbi, « maison de terre, chaumière » DFNC gourbi, n.m. - de l’arabe gourbi, son gourbi, « sa maison, son chez-soi » hachek RL hachek, loc. - de l’arabe ḥāšāk ou ḥāšā lak, littéralement « loin se dit après avoir de toi /telle ou telle chose » exprimé une chose déplaisante hagar I hagar, v. - en arabe littéral « mépriser » 1. commettre une en arabe algérien « commettre une injustice » injustice 2. faire violence à quelqu’un hagoun BQ agoun, agouna, n.m. et f. - du berbère ‘agoun, lui-même emprunté à l’arabe bête, idiot du Maghreb où il signifie « bègue » hagra DZ hagra, n.f. - de l’arabe ‘agʁa misère, injustice LC hagra, n.f. en arabe maghrébin hagra, mélange de mépris, d’humiliation, d’injustice hakdin RL hakdin, loc. - de l’arabe [bi-]ḥaqq al-dīn, [par] la vraie la vraie religion religion, c’est-à-dire l’Islam (c’est-à-dire l’Islam) halam CTT haram, n.m. - de l’arabe hæraem, « péché » péché haram harami hram handek LC hendek, interj. - de l’expression arabe rend-ek, de l’arabe attention! maghrébin hendek, une mise en garde plus ou moins pressante suivant le contexte hanout RL hanout, n.m. - de l’arabe ḥānūt, « épicerie, boutique, magasin » épicerie, boutique, magasin hass DZ hass, n.f. - - ennui, difficulté, problème hecheun RL hecheum, v. - forme verbale figée de l’arabe classique ḥašama, être gêné, avoir « être gêné, avoir honte » honte

143

hmara BQ hmar, hmara, n.m. et f. - de l’arabe hmar, hmara, « âne, ânesse » âne, ânesse hnine I hnine, adj. - - doux, gentil, attentionné, tendre, pur hnouch DZ rnouch, n.m. - de l’arabe maghrébin kh’nouch « couleuvre » policier, flic CTT arhnouch, n.m. - de l’arabe dialectal marocain, « serpent », «flic», une métaphore basée sur le fait que le serpent siffle tout comme le policier, et selon toute vraisemblance au départ du sens de ce mot BQ hnouches - de l’arabe magrébin hnech, « serpent », pl. n.m.pl. hnoûch ou hnoûcha LC rnouch, n.m. - en arabe dialectal maghrébin rhnouch est le pluriel de rench « serpent », méthaphore qui désigne aussi « quelqu’un de malin, méchant » ken BQ ken, v. tr. et intr. - verlan de niquer 1. posséder DZ kène ou kéner, v.tr. verlan de niquer sexuellement CTT quène, v.tr. verlan de niquer : [nike] > [keni] > [kɛn] 2. tromper khnona BQ rnouna, n.f. - de l’arabe khnoûna, « crotte de nez » crotte de nez, RL khnona, n.f. de l’arabe classique ḫanūna, « morve » morve kho DZ kho, n.m. - de l’arabe kho, « frère » ami, frère LC kho, n.m du maghrébin algérien kho, « frère » kiffer PR kifer ou kiffer, v. tr. et intr. Fam. de l’arabe maghrébin kif (état de béatitude) 1. prendre du 1990 LR kiffer ou kifer, v.tr. Fam. de kif plaisir DZ kiffer, v.tr - - 2. aimer, apprécier BQ kiffer, v. tr. et intr. - dérivation de kif 3. avoir une CTT kiffer, v.tr. - construit à partir de kif, « plaisir » réaction LC kiffer, v.tr. - de l’arabe kif, mélange de tabac et de cannabis démesurée face à une situation maboul PR maboul, e, n. et adj. Fam. arabe mahbūl, « fou » dingue, fou 1860 LR maboul, adj.m. et n.m. Fam. de l’arabe TLF maboul, e, n. et adj. Pop. et de l’arabe mahbūl, « fou, sot, stupide » fam. 144

CTT maboul, adj. - adjectif argotique de l’arabe mahbûl, « fou » DA maboul, e, adj. et n. - de l’arabe mahbûl, « fou » DFNC maboul, e, adj. et n. m. et f. - de l’arabe mahbul, « fou » mesquine PR mesquin, e, adj. - meschin, ine, « jeune homme, fille », XIIe 1. médiocre, sans 1604 misquine italien meschino, arabe miskin « pauvre » importance ni LR mesquin, e, adj. - italien meschino, « chétif » valeur TLF mesquin, e, adj. - emprunt soit à l’italien meschino, « pauvre, 2. qui est attaché à chétif », soit à l’espagnol mezquino, « pauvre, ce qui est petit, indigent », tous deux empruntés à l’arabe miskin médiocre « pauvre » 3. qui témoigne DZ mesquine, n. - de l’arabe meskin, « pauvre, qui suscite la pitié » d’avarice, de BQ mesquine, meskina, n. m.f. - de l’arabe meskîn, « pauvre » parcimonie CTT mesquin, n.m. - de l’arabe miskîn, « pauvre », introduit en ancien 4. personne français par l’intermédiaire de l’italien inspirant de la meschino, « pauvre, chétif » pitié ou de la LC meskin, a, n. - de l’arabe meskin, « pauvre, qui inspire la pitié » peine, DA mesquin, mesquine, adj. - de l’arabe d’Alger meskin, « petit » malheureux, le pauvre, la pauvre niquer PR niquer, v. tr. Arg. du sabir d’Afrique du Nord i-nīk, « il fait 1. avoir des 1890 l’amour », de l’arabe nāk, de même sens relations sexuelles avec, posséder LR niquer, v.tr. Vulg., - sexuellement, très fam. 2. tromper, duper TLF niquer, v.tr. Arg. et mot sabir d’Afrique du Nord, tire de l’arabe nāk: 3.détériorer, pop. i-nik, 3e pers. de l’ind. prés. « il fait l’amour » endommager DZ niquer, v.tr. - de l’arabe nakaha, « s’accoupler » 4. battre qqn BQ niquer, v.tr. - vient de l’arabe nâk, ynîk, « posséder charnellement » CTT niquer, v.tr. et intr. - de l’arabe dialectal maghrébin vi nik, « il coïte » LC niquer, v.tr. - - DA niquer, v.tr. - de l’arabe vi nik, « il coïte » DFNC niquer, v.tr. - très probablement de l’arabe dialectal du Maroc vi nik, « il fait l’amour », par l’intermédiaire d’une formule d’invitation entre militaires et 145

prostituées indigènes : faire nik nik nouss nouss RL nouss nouss, loc. Arg. de l’arabe dialectal nuṣ nuṣ, « moitié-moitié », moitié-moitié de l’arabe classique niṣf, « moitié » scarla BQ scarla, n.m. - verlan de lascar jeune de la DZ scarla, adj. et n. verlan de lascar banlieue, vivant CTT scarla, n.m. verlan de lascar [laskaR] > [skaRla] de petits trafics seum DZ sème ou seume, n.m. - de l’arabe sèmm, « venin » rage, colère sem BQ sem, n.m. de l’arabe sem, « poison » sum LC seum, n.m. en arabe classique seum,« venin », sens qui a glissé pour devenir « jalousie » ou « jalousie maladive » t’miniquer RL t’miniquer, v. - mot formé sur le subst. arabe maghrébin faire un mauvais populaire et grossier [tmenik], « mauvais tour, tour mauvaise blague », dérivé de nāka, « copuler, baiser », d’où le fr. « niquer, avoir » timinik DZ timinik, t’minik, t’manik - de l’arabe maghrébin t’mnik (tu te moques) problèmes, n.m. manières wesh PR wech, adv. interrog. Pop. de l’arabe dialectal 1. comment ? 1983 whèsh DZ ouèche, wèche ou wesh interj. - de l’arabe waach, « Eh quoi ! » quoi ? ouaich BQ ouech, pron., inter. - de l’arabe ouech, « Quoi ? » 2. terme de salut ouech LC wesh, interj. - de l’expression arabe wesh rak, « Comment vas- tu? » whèsh- DZ wesh-wesh, n. - - jeune des cités whèsh zarma BQ zarma, zerma, interj./adv. - de l’arabe za’ma, assertion, dire, avec une ma parole ! tu nuance de vanité, de fanfaronnade parles ! DZ zarma, interj. de l’arabe maghrébin zarma, « c’est-à-dire, par exemple, soi-disant » zbèb PR zob, n.m Vulg. arabe zobb pénis 1894 TLF zob, zobi, zobbi, interj. et n.m. Trivial emprunt à l’arabe maghrébin zob, zeb, « membre viril », et, avec le suff. poss. de la 1re pers. du sing. -ī: zobbī, zebbī DZ zboub, n.m. - -

146

CTT zeub, n.m. - arabe zubb, « sex masculin » DA zob, zobi, n.m. - même origine que zeb : de l’arabe maghrébin zebbi, issu de l’arabe classique zubb DFNC zob, n.m. - de l’arabe zobb, « pénis », et zebbi, « mon zob », en exclamation; la seconde forme s’est conservée dans l’expression: peau de zebi où elle a été comprise comme peau de zébu (animal d’Afrique), alors qu’elle s’est inscrite dans la série : (la) peau de (mes) « couilles », « balles » comme exclamation injurieuse de refus; la prononciation a été fixée sur l’intermédiaire: zeub RL zbèb, n.m. - de l’arabe zubb, « verge, pénis », d’où aussi au Maghreb zbuba zouz CTT zouz, n.f. - en arabe dialectal maghrébin zudʒ ou zuʒ, « deux fille, femme », est aussi utilisé pour désigner le « deuxième » d’un couple, l’autre, c’est-à-dire suivant les cas le mari ou la femme

147

Annexe nº 3 : Fréquence des arabismes dans le corpus

Tableau nº I : Occurrences des arabismes dans les chansons du corpus Arabisme forme(s) pochette Nombre d’arabismes Chanson (couplet/outro/intro/inter- ludes+ refrain x répétition) ahchouma 1+0x0 DIJ01 arbiya 1+0x0 ROH13 arbouche 1+0x0 LAR02 babtou 1+0x0 DLP17 barda 0+4x1 AKH15 belek 1+0x0 BOO06 1+0x0 DLP11 1+0x0 DLH02 bled 1+0x0 ALI08 1+0x0 AKH15 1+0x0 AKH20 1+0x0 AKS01 1+0x0 BES05 2+0x0 BOO01 1+0x0 DIA08 1+0x0 DPA01 1+0x0 DLH01 1+0x0 DLP08 1+0x0 DLP15 1+0x0 FFA12 1+0x0 ROH07 1+0x0 ROH12 blédard 1+0x0 ROJ01 bsartkoum 1+0x0 ROH04 caïd 1+0x0 LAR01 1+0x0 ROH13 chekem 1+0x0 FFK01 clebs 1+0x0 AMV01 clébard 1+0x0 BOO05 1+0x0 LAR03 klébard 1+0x0 LAR13 crouille 1+0x0 ALI02 din 1+0x0 BLM01 1+0x0 ROH13 dîn 1+0x0 ALI09 1+0x0 BES01 fissa 1+0x0 BOO05 foolek 1+0x0 ROH04 2+0x0 ROH10 5+0x0 DIA07 gourbi 1+0x0 DLP10 hachek 1+0x0 ROH05 hagar 1+0x0 ROH10 1+0x0 FFA11 hagoun 1+0x0 ROH05 hagra 1+0x0 AKH22 hakdin 1+0x0 ROH13 handek 1+0x0 ROH11 hanout 1+0x0 FFA01

148

haram 1+0x0 ROH13 hram 1+0x0 ALE01 harami 1+0x0 ROH13 halam 1+0x0 BLM01 hass 1+0x0 ROH09 hecheun 1+0x0 BOO08 hmara 1+0x0 ROH09 hnine 1+0x0 ROH13 hnouch 1+0x0 ALI08 ken 1+0x0 DIA17 1+0x0 DIJ01 1+0x0 DLP11 2+3x2 DLP17 khnona 1+0x0 BES09 kho 2+0x0 ALI02 1+0x0 ALI06 1+0x0 ALI08 2+0x0 ALI09 1+0x0 ALI10 1+0x0 ALI11 7+0x0 BOM01 2+0x0 BOO01 1+0x0 BOO02 1+0x0 BOO03 2+0x0 BOO04 4+3x1 BOO05 1+0x0 BOO06 1+0x0 BOO07 2+0x0 BOO08 1+0x0 BSD01 1+0x0 BOW01 7+0x0 BIB01 1+7x1 BON01 2+0x0 BES13 kiffer 1+0x0 AIS01 1+0x0 AKH19 1+0x0 BOW01 1+0x0 BOO01 1+0x0 BOO03 1+0x0 BON01 1+0x0 DIA08 1+0x0 DIA18 5+3x2 DLH02 1+0x0 ROH03 1+0x0 ROH06 1+0x0 ROH11 maboul 1+0x0 DLP15 mesquine 1+0x0 ROJ01 misquine 1+0x0 DIV01 niquer 1+0x0 AKH19 1+0x0 AKH21 1+0x0 BES04 1+3x2 BES08 1+0x0 BOO01 1+0x0 BOO02 1+0x0 BOO03 1+0x0 BOO04 149

2+0x0 BOO05 1+0x0 BOO07 1+0x0 BLM01 1+0x0 BSD01 1+0x0 DIJ01 2+2x3 FFA01 1+0x0 FFA03 1+3x1 FFA05 1+0x0 FFA07 2+0x0 FFA09

4+0x0 FFA10 2+0x0 FFA14 2+0x0 FFK01 1+0x0 LAR09 1+0x0 LSE01 1+0x0 ROJ01 4+0x0 ROH05 1+0x0 ROH07 2+0x0 ROH09 1+0x0 ROH10 1+0x0 ROH11 nouss nouss 1+0x0 FFA01 scarla 1+0x0 DLP11 seum 1+0x0 ALI08 1+0x0 BOO07 1+0x0 BON01 1+0x0 BES06 sem 1+0x0 AKH15 sum 1+0x0 FFA11 t’miniquer 1+0x0 FFA10 timinik 1+0x0 BIB01 wesh 1+0x0 BOO05 1+0x0 BOO06 1+0x0 BOO08 whèsh 1+0x0 BES08 ouech 1+0x0 FFA10 2+0x0 BOM01 ouaich 3+0x0 DLP15 whèsh-whèsh 1+0x0 BES13 zarma 1+0x0 AKH19 1+0x0 AKS01 1+0x0 BES02 1+0x0 DLP11 1+0x0 ROH05 zbèb 1+0x0 BOO08 zouz 1+0x0 AKH19

150

Tableau nº II : Arabismes utilisés par les rappeurs du corpus Subcorpus Rappeur Nombre Arabismes – variantes graphiques (groupe de rap) total d’arab. différents A Ali 7 bled, crouille, dîn, hnouch, hram, kho, seum Booba 14 belek, bled, clébard, din, fissa, halam, hecheun, kiffer, kho, niquer, seum, timinik, wesh, zbèb Rohff 20(+1) arbiya, bled, blédard, bsartkoum, caïd, din, foolek, hachek, hakdin, hagar, hagoun, haram, harami, handek, hass, hmara, hnine, kiffer, mesquines, niquer, zarma B Akhenaton 9 barda, bled, clebs, hagra, kiffer, niquer, sem, zarma, zouz Diam’s 6 ahchouma, bled, ken, kiffer, misquine, niquer Disiz la 10 babtou, belek, bled, gourbi, ken, kiffer, Peste mabouls, scarla, ouaich, zarma C Sat 2 hagar, niquer (Fonky Family) l’Artificier Menzo 4 bled, ouech, t’miniquer, niquer Le Rat 4 sum, hanout, nouss nouss, niquer Luciano Don Choa 1 niquer Fel 0 - C Hamé 3 arbouche, clébard, klébard (La Rumeur) Mourad 0 - Ekoué 2 niquer, caïd Philippe 0 - C Abd Al 1 zarma (Beni Snassen) Malik Wallen 0 - Mattéo 3 niquer, whèsh, whèsh- whèsh Falkone Hamcho 1 kho Bil’in 1 seum

Tableau nº III : Arabismes utilisés dans les featurings Subcorpus Rappeur Nombre Arabismes – variantes graphiques (groupe de rap) total d’arab. différents A Bram’s 1 kho IS2 1 kho Mala 2 kho, ouech Nessbeal 2 kiffer, seum B Sako 1 kiffer C Kalash 2 chekem, niquer (Fonky Family) l’Afro

151

Annexe nº 4 : Lemmes des arabismes (méthode des filtres successifs)

Tableau nº I : Lemmes des arabismes du corpus

Arabisme Lemme Variante graphique forme(s) pochette proposée ahchouma hchouma arbiya arbiya arbouche arbouche babtou babtou barda barda belek balek belek bled bled blédard blédard bsartkoum bsahtek bsahtkoum caïd caïd chekem chekem clebs clebs clébard clébard klébard crouille crouillat din din dîn fissa fissa foolek foulek gourbi gourbi hachek hachek hagar hagar hagoun agoun hagra hagra hakdin hakdin handek handek handek hanout hanout haram haram harami halam hram

hass hass hecheun hecheun hmara hmara hnine hnine hnouchs hnouche ken ken khnona khnouna kho kho kiffer kiffer maboul maboul 152

mesquine mesquine misquine niquer niquer nouss nouss nouss nouss scarla scarla seum seum sem sum t’miniquer t’miniquer timinik timinik wesh wech wesh whèsh ouech ouaich whèsh-whèsh whèsh-whèsh zarma zarma zbèb zob zouz zouz

153