Masarykova univerzita Filozofická fakulta

Ústav románských jazyků a literatur

Les outils textométriques appliqués au phénomène de la verlanisation dans le corpus des chansons de rap

Bakalářská diplomová práce

Barbora Švehlíková

Vedoucí práce : PhDr. Alena Polická, Ph.D.

Konzultant : Jean-Marc Leblanc, Ph.D.

Brno 2014

Prohlašuji, že jsem bakalářskou diplomovou práci vypracovala samostatně s využitím uvedených pramenů a literatury a také, že tištěná verze mé práce se shoduje s verzí elektronickou.

………………………………………………..

J’aimerais remercier la directrice de mon mémoire, Mme Alena Polická, pour sa patience, ses suggestions, ses corrections et surtout pour ses encouragements durant l’élaboration de ce mémoire. Un grand merci également à M. Jean-Marc Leblanc pour sa complaisance, pour la main secourable qui’il a su me tendre à tout moment concernant la prise en main des logiciels textométriques. Je remercie finalement tous ceux qui m’ont soutenu et qui m’ont aidé lors des problèmes informatiques ou de langue.

Table des matières INTRODUCTION ...... 3 1 DE LA PLACE DU VERLAN DANS LE LANGAGE ET LE RAP FRANÇAIS ...... 5 1.1 Approche sociolinguistique et variations ...... 5 1.2 Le non-standard dans le rap ...... 7 1.2.1 Le français non-standard ...... 8 1.2.2 L’Argot ou les argots ...... 9 1.2.3 Le rap et le langage dans le rap ...... 11 1.3 Le verlan...... 14 1.3.1 Typologie des verlanisations selon l’approche lexicographique ...... 15 1.3.2 Procédés morphologiques de formation des verlanisations ...... 16 1.4 Linguistique de corpus ...... 18 1.5 RapCor ...... 19 1.6 Outils textométriques ...... 20 1.6.1 Lexico 3 ...... 21 1.6.2 TextObserver ...... 22 1.6.3 Alceste ...... 22 1.6.4 TXM ...... 23 2 DEFINITION ET PREPARATION DE CORPUS ...... 24 2.1 Préparation des textes ...... 25 2.2 Balisage du corpus pour Lexico3 ...... 25 2.3 Marquage des verlanisations ...... 27 2.4 Problème avec le codage ...... 27 2.5 Balisage et importation dans TextObserver ...... 28 2.6 Balisage et importation dans Alceste ...... 29 3 ANALYSE DU CORPUS ...... 30 3.1 Caractéristiques générales ...... 30 3.1.1 Principales caractéristiques lexicométriques – Lexico 3 ...... 30 3.1.2 Les thématiques trouvées par Alceste ...... 32 3.1.3 Analyse factorielle des correspondances (Lexico3 et TextObserver) ... 34 3.2 Verlanisations – analyse détaillée ...... 40 1

3.2.1 Distribution géographique des verlanisations ...... 40 3.2.2 Distribution et spécificités des verlanisations selon les locuteurs ...... 43 3.2.3 Distribution des différents types de verlanisations ...... 48 3.2.4 Distribution géographique des verlanisations selon le mode de création57 3.2.5 Analyse factorielle des correspondances (AFC) des verlanisations ..... 60 3.2.6 Comparaison des AFC des partitions loc_feat, loc_feat_membregroupe et locuteur1...... 63 4 EN GUISE DE CONCLUSION : BILAN STATISTIQUE ...... 68 CONCLUSION ...... 69 BIBLIOGRAPHIE ...... 71 Monographies et articles ...... 71 Dictionnaires ...... 73 Sources Internet...... 74 LISTE DES ILLUSTRATIONS ...... 75 Images ...... 75 Graphiques ...... 76 Tableaux ...... 77 LISTE DES ANNEXES ...... 78 ANNEXES ...... 79

2

INTRODUCTION

Depuis les années 60 s’observe une tendance dans la recherche linguistique à se servir de l’analyse statistique et de l’analyse sémantique (de contenu). Bien que la lexicométrie ait été établie il y a quelques décennies, les chercheurs ne s’aperçoivent pas toujours de cette analyse, ou s’en méfient. Quelle est la typologie et quelles sont les possibilités des logiciels lexicométriques? Quelles sont leurs limitations et comment pourrions-nous nous en servir ?

Ce mémoire a pour but de faire une analyse concrète d’un phénomène lexical (le verlan) à l’aide de différents logiciels textométriques (notamment Lexico 3, TextObserver, Alceste, TXM). Notre but secondaire est de signaler, au cours de l’analyse, les obstacles et les imperfections des logiciels qui nous auraient empêchés un traitement facile ; ceci pouvant servir d’inspiration pour les prochaines améliorations de logiciels.

Dans un premier temps, nous allons présenter les points de départ théoriques (les notions de base et les logiciels) de notre recherche pour ensuite passer à la partie pratique, et à l’exploitation de certains logiciels choisis en se servant du phénomène de verlanisation en tant qu’objet d’étude. Dans la partie pratique, nous nous concentrerons d’abord sur les caractéristiques générales du corpus et sur la distribution des verlanisations qui y sont présentes. Successivement, nous étudierons les thématiques que nous fournissent les logiciels et nous les comparerons avec la caractéristique du rap français que nous propose la bibliographie à ce sujet1.

Notre deuxième objectif vise à effectuer une analyse détaillée des verlanisations. Nous essayerons de trouver les possibilités permettant d’observer les corrélations entre :

1. auteur/lieu  nombre des verlanisations 2. auteur/lieu  type de verlanisation (lexicalisée/semi-lexicalisée/non- lexicalisée) 3. lieu  type de création des verlanisations

Pour cet effet, nous avons établi quelques hypothèses qui seront vérifiées au cours de l’analyse. Premièrement, nous supposons que le nombre des mots verlanisés sera plus

1 Par exemple: Christian BETHUNE (2003). Le RAP : Une Esthétique hors la loi. Paris : Ed. Autrement. Manuel BOUCHER (1998). Rap, expression des lacars. Paris : Union peuple et culture. Pierre-Antoine MARTI (2003). Rap 2 : Les mots d’une rupture identitaire. Paris : L’Editions L’Harmattan, 2006. 3

élevé dans les textes des auteurs du Nord de la France que chez les auteurs du Sud. Deuxièmement, nous pensons que les verlanisations lexicalisées vont apparaître plutôt parmi les verlanisations des auteurs du Nord de la France. Et finalement, nous supposons que la formation des verlanisations au Nord est plus complexe en combinant les procédés (apocope, aphérèse, chute d’un phonème etc.) alors qu’au Sud il s’agira surtout de simples verlans créés par permutation de deux syllabes.

Nous incluerons également une expérimentation visant à répondre à des questions portant plutôt sur la forme du corpus en vérifiant les hypothèses suivantes : « Y a t-il a une différence entre le corpus sans « featurings » marqués et celui avec les chanteurs invités marqués dans le corpus ? » « Est-il nécessaire de faire la distinction entre les chanteurs du même groupe parce qu’ils partagent à peu près le même langage ? »

Étant donné que l’un de nos buts est de signaler les avantages et les inconvénients des logiciels, notre travail n’apportera pas seulement une analyse détaillée des verlanisations mais pourra servir comme point de départ aux futurs chercheurs qui seront motivés pour découvrir les logiciels textométriques. De plus, nous visons à nous servir du logiciel TextObserver qui est en développement continuel. Notre exploitation de ce logiciel et son application à un corpus particulier pourrait aider à son amélioration.

4

1 DE LA PLACE DU VERLAN DANS LE LANGAGE ET LE RAP FRANÇAIS

Dans cette partie, nous avons pour but de présenter les points de départ, surtout les notions théoriques de base sur lesquelles nous allons nous appuyer aussi bien que les outils dont nous nous servirons dans cette recherche.

1.1 Approche sociolinguistique et variations

Dans notre travail, nous observons la langue d’un point de vue sociolinguistique, c’est-à-dire que nous rendons compte du fait que la langue représente un objet hétérogène et qu’il existe des corrélations entre les variantes linguistiques et l’appartenance des locuteurs à un certain groupe social.2 La sociolinguistique situe la parole « dans l’ordre social et du quotidien, du privé et du politique, de l’action et de l’interaction pour étudier les variations dans l’usage des mots, rituels de conversations, les situations de communication…»3

D’après Thierry Bulot, l’une des distinctions possibles entre la linguistique et la sociolinguistique repose sur le fait que la sociolinguistique ne fait pas qu’observer et de décrire la langue, et ne se pose donc pas seulement la question de savoir comment ça marche, mais elle doit compléter son questionnement par « pourquoi ça marche comme cela » (ce qui implique le besoin des connaissances théoriques et méthodologiques en plus et hors du seul champ linguistique).4

Un concept majeur de la sociolinguistique est la notion de variation qui est étroitement liée à l’idée de norme. La norme, ensemble d’interdits et de prescriptions, résumée dans des dictionnaires et des grammaires, définit la notion sociolinguistique de « le français standard ». La conscience et l’usage de cette norme sont reflétés dans un parler sans « fautes ». Autrement dit le français standard « prétend à la neutralité devant les

2 Thierry BULOT (2011). « Variations et normes d’une langue ». Dans BULOT, T., BLANCHET, P. (2011). Dynamiques de la langue française au 21ième siècle : une introduction à la sociolinguistique. www.sociolinguistique.fr, consulté le 02/12/2012. 3 Henri BOYER (1991). Éléments de sociolinguistique : Langue, communication et société. Paris : Dunod, p. 6. 4 T. BULOT (2011). « L'approche de la diversité linguistique en sociolinguistique ». Dans BULOT, T., BLANCHET, P. (2011). Dynamiques de la langue française au 21ième siècle : une introduction à la sociolinguistique. www.sociolinguistique.fr. (consulté le 14/02/2014). 5

genres discursifs».5 La sociolinguistique étudie donc les écarts de cette norme, ses variations, son usage et ses usagers.

L’approche sociolinguistique apporte cependant aussi une autre vision de l’objet même de la recherche qu’est la langue. Contrairement à la définition purement linguistique de la langue qui la perçoit comme un objet homogène dont il convient de faire la description dans la perspective de la sociolinguistique, la langue :

renvoie à un objet nécessairement hétérogène, nécessairement produit des usages sociaux, plurinormé, engageant fondamentalement la construction des identités, la socialisation, le rapport au monde, bref un objet complexe qu’il importe bien entendu de décrire mais en lien avec la recherche d’une intelligibilité sociale tant de la description elle-même que des rapports entre les phénomènes langagiers et les phénomènes sociaux.6

Toujours dans cette optique, nous essayons d’englober la langue avec les variations provoquées par les changements de société, par les différences dûes aux lieux (campagne versus ville/ Nord versus Sud, etc.) ; et avec tous les changements selon les groupes sociaux. Pour démontrer la portée de cette approche sociolinguistique, il suffit de relever que le fait de s’exprimer ne consiste pas seulement en une transmission du sens de l’énoncé mais, c’est « se faire évaluer, catégoriser, hiérarchiser et, en cela, c’est forcément le lieu symbolique d’un enjeu social très fort ».7

Louis-Jean Calvet, qui a mené cette discussion, s’explique surtout sur le sujet de la variation diatopique, liée à la mondialisation. Il souligne l’importance de la réunion des outils de la linguistique interne et externe8 pour pouvoir saisir la langue. En même temps il se pose la question de savoir s’il ne faut pas considérer la langue plutôt comme une immense variable dont on a tendance à ne décrire qu’une variante.9

Pour revenir à la notion de la variation, on s’accorde généralement à repérer quelques types de variation linguistique tels que la variation selon l’origine géographique (le plus souvent liée à l’appartenance soit au milieu urbain soit au milieu rural) ; la

5 Françoise GADET (2007). La Variation sociale en français. Paris : Orphrys, p. 20. 6 T. BULOT (2011). « L'approche de la diversité linguistique en sociolinguistique », art. cit. 7 T. BULOT (2011). « L'approche de la diversité linguistique en sociolinguistique », art. cit. 8 Dichotomie descendante de Saussure. 9 Louis-Jean CALVET (2007). « La sociolinguistique au filtre de l'inventaire des langues du monde ». Langage et société. vol.3, n°121-122, p. 266. 6

variation selon l’origine sociale ou l’appartenance à un milieu socio-culturel, l’âge qui est, en effet, un facteur de diversification très important surtout quant au parler jeune dont la variante de langage est d’une part un bon exemple de la variante marquée socialement, d’autre part de variation générationnelle.10 Un autre facteur est la situation de l’acte de communication, en d’autres termes le lieu, le moment, les objectifs communicatifs, les statuts des interlocuteurs etc.11 Dernièrement, mentionons la variable du sexe qui peut provoquer des changements linguistiques. Françoise Gadet propose un classement plus précis en rassemblant les variations dans deux grands groupes. Le premier se concentre sur les usagers et nous pouvons ainsi différencier les variations diachroniques rattachées à des faits historiques, les variations diatopiques liées à la localisation spatiale ou régionale et les variations diastratiques provoquées par la différente position sociale et démographique.12 Dans ce cas-là nous nous intéressons concrètement à l’âge, à la profession, au lieu de séjour, au niveau d’étude etc. (Nous parlons d’un sociolecte, d’une parlure liée à la position sociale.) Le deuxième type porte sur l’usage et nous parlons de la variation diaphasique (ou situationnelle voire stylistique) qui n’est pas liée à l’origine sociale mais s’agit d’un parler adapté à la situation de communication.

La variation s’effectue aussi bien au niveau lexical qu’au niveau phonétique, syntaxique ou morphologique. Dans notre travail, nous allons observer les phénomènes portant uniquement sur le lexique et nous pencherons sur les variations des deux types ; d’un côté notre corpus comporte des textes du registre non-standard, parfois même vulgaire et d’un autre côté nous allons observer les différences diatopiques.

1.2 Le non-standard dans le rap

Étant donné que, pour notre exploration des logiciels textométriques, nous allons étudier un phénomène lexical relevant du langage populaire voire argotique, nous nous sentons obligée de définir ces termes. De même, de relever les spécificités du langage dans le rap puisque nous allons travailler avec un corpus constitué de chansons de rap.

10 H. BOYER (2001). Introdution à la sociolinguistique. Paris : Dunod, p. 24. 11 Idem, p. 29. 12 F. GADET (2007). La Variation sociale en français, op. cit., p. 20. 7

1.2.1 Le français non-standard

À côté du français standard (« la langue standard »13), qui constitue la norme de référence, la forme identificatrice et unificatrice sur un territoire diffusé par l’institution scolaire, les linguistes distinguent le langage populaire, autrement dit la langue parlée par le peuple qui est très variée et instable en vocabulaire. Le français des jeunes qui va nous intéresser fait naturellement partie du français non-standard. Le language des jeunes peut être caracterisé, dans un premier temps, par un ensemble de traits (reposant surtout sur la prononciation et le lexique) qui la démarque du français commun. En guise d’exemple, citons-en quelques uns ; concernant le lexique nous croisons par exemple des procédés de formation comme suffixation (dite parasitaire), apocope (biz, assoce), aphérèse (blème), métaphore (galère), métonymie (casquette), des emprunts à de différentes langues etc.14 Or, la seule énumération des traits ne suffit pas pour caractériser le français des jeunes. De plus, ces traits sont en grande partie valables aussi pour la caractéristique des procédés typiques de l’argot (voir infra). Françoise Gadet voit la piste définitoire possible en associant au langage des jeunes des questions sociales urbaines.15 Les recherches s’accordent à dire qu’en Occident, il existe un lien entre l’usage de traits non-standards et le fait (en ce qui concerne les adolescents) de participer à une culture vernaculaire de groupe des pairs.16

Une des questions liées à la notion de langage populaire est celle de la simplification : pourquoi les locuteurs simplifieraient-ils ? L’aspect problématique de cette question réside dans l’écueil de laisser entendre que les classes populaires simplifient la langue standard à cause d’un niveau éducatif peu élevé, du manque de raffinement ou de l’absence de volonté de précision.17 De même, pour le phénomène de l’hypercorrection, qui peut être perçu comme l’effort de la part des locuteurs qui, marqués par l’éducation et donc par le standard, ne maitrisent pas bien la norme.

Le langage non-standard qui émèrge de nos jours est de plus en plus hétérogène, marqué par l’immigration dans les villes et les banlieues pluri-ethniques qui donnent naissance à une grande diversité et à un métissage langagier. Il est caractérisé par l’emploi

13 T. BULOT (2011). « L'approche de la diversité linguistique en sociolinguistique », art. cit. 14 F. GADET (2003). « Français populaire un classificateur déclassant ». Marges linguistiques. n°6, p. 104. 15 Idem, p. 109. 16 Michelle AUZANNEAU, Caroline JUILLARD (2012). « Introduction. Jeunes et parlers jeunes : catégories et catégorisation. » Langage et société. vol. 3, n°141, p. 6. 17 F. GADET (2003). « Français populaire un classificateur déclassant », art. cit., p. 105. 8

du verlan et de l’hybridation. Les grandes villes et ses banlieues donnent naissance également au rap, qui fait naturellement preuve de cette diversité langagière et sociale, et qui englobe et propage aussi le phénomène socio-langagier du verlan auquel nous allons nous intéresser en particulier.

1.2.2 L’Argot ou les argots

Lorsqu’on s’intéresse au rap, on doit incontournablement aborder la question de l’argot. Le mot argot désignait d’abord une communauté de mendiants ou de voleurs.18 Par la suite, il s’agit d’un lexique cryptique, commune à un ensemble de gens qui s’efforçaient de cacher le sens aux non-initiés ce qui n’est même pas le cas aujourd’hui. Nous verrons, qu’il est tout d’abord plus convenant de parler d’argots ou de parlures argotiques.19 Marc Sourdot distingue l’argot, le jargon et le jargot (sous lequel on classe le technolecte).20 Quant à l’argot, il est traditionellement caractérisé par la fonction cryptique qui le différencie des autres parlures argotiques. Il se peut que le jargot et le jargon posent des problèmes de compréhension. Or, cet effet n’est pas provoqué par la volonté d’être cryptique mais par les conditions socio-énonciatives de l’échange.21 La « composante identitaire » est importante pour l’argot aussi bien que pour le jargon. L’appartenance à un groupe et la cohésion du groupe est partiellement assurée par le langage.22

L’argot est crée d’une part à l’aide des procédés sémantiques comme des périphrases, des emprunts à des langues étrangères ou des modifications par métathèse et d’autre part par des procédés formels comme la troncation, la suffixation ou par la transformation du mot selon une règle concrète.23 La troncation repose sur le retrait d’une partie du mot soit à l’initiale soit à sa finale. Ce terme associe en effet les procédés nommés apocope (la suppression d’un phonème ou d’une syllabe situé à la fin du mot) et aphérèse (la suppression de la partie au début du mot). La suffixation accompagne souvent la troncation, et parmi les suffixes les plus employés nous pouvons citer : -o, -oche, -aque, -ard etc. Le jeu par transformation du mot avec des procédés formalisés est généralement appellé les argots à clefs. Il existe plusieurs exemples d’une telle technique parmi lesquels on peut nommer le largonji qui repose sur le remplacement de la consonne initiale du mot

18 Louis-Jean CALVET (1994). L’argot. Paris: PUF, p. 5. 19 Denise FRANCOIS-GEIGER, Jean-Pierre GOUDAILLIER (1991). Parlures argotiques. Langue française. n° 90. 20 Marc SOURDOT (2001). « L’argotologie : entre forme et fonction ». La linguistique. vol. 38, n°1, p. 29. 21 Idem, p. 33. 22 Idem. 23 L.-J. CALVET (1994). L’argot, op. cit, p. 55 et p. 75. 9

par un « l » et sur le déplacement de la consonne à la fin du mot (ex. jargon  largonji) ou le louchébem qui n’est qu’une variante du largonji des bouchers avec l’ajout supplémentaire de « em » à la finale. Ce parler spécifique des bouchers est néanmoins réservé plutôt aux hommes et ce sont les plus âgés qui le connaissent bien et qui sont capables de produire des phrases entières avec. On pouvait entendre cette langue surtout dans les abattoires de la Vilette ou aux Halles ; aujourd’hui le louchébem se parle encore dans les grandes boucheries parisiennes, et il est bien à noter qu’il s’agit d’un phénomène typiquement parisien.24 L’autre exemple de l’argot à clefs est le verlan (que nous allons traiter de plus près dans le chapitre Le Verlan).

L’argot est essentiellement utilisé à l’oral, même s’il existe aussi dans la littérature, les nouvelles créations sont faites exclusivement à l’oral. Il est caractérisé par une grande instabilité des unités lexicales, autrement dit le vocabulaire argotique est constamment remodelé et renouvelé.

L’argot est devenu un sociolecte, un registre qui n’est parfois pas facile à distinguer du français populaire et de plus, sa fonction est de plus en plus identitaire que cryptique.25 L’argot n’est plus une langue secrète et, selon Calvet, « il est devenu une sorte d’emblème, une façon de se situer par rapport à la norme linguistique […] et par rapport à la société. »26 Alena Polická décrit le déclin de l’argot traditionnel ainsi : Le vieil argot doit donc faire face à une concurrence de la part de l’ « argot des jeunes de banlieues » qui s’en inspire largement, mais dont les valeurs fonctionnelles ont changé. Les argots à base crypto-ludique ont été remplacés par les argots sociaux et un déplacement s’est opéré du centre-ville [...] vers la périphérie.27 Cet argot particulier des banlieues se dévéloppe naturellement avec la pluralité et le multiculturalisme dans les grandes villes qui entraîne une pluralité des pratiques langagières.28

24 Françoise ROBERT L’ARGENTON (1991). « Larlépem largomuche du louchébem. Parler l’argot du boucher. » Langue française. (90), p. 120. 25 L.-J. CALVET (1994). L’argot, op. cit., p. 5. 26 Idem, p. 9. 27Alena PODHORNÁ-POLICKÁ (2008). Universaux argotiques des jeunes, Analyse linguistique dans les lycées professionnels français et tchèques. Brno: Munipress, p. 61. 28 Jean-Pierre GOUDAILLIER (1997). « La langue des cités ». Communication et langages. n°112, p. 96- 110. 10

1.2.3 Le rap et le langage dans le rap

Le rap, terme d’origine anglophone signifiant « une forme de bavardage sur fond rythmique », s’est dévéloppé en France à la fin des années 80, et la France est par la suite devenue le pays (avec les États-Unis) abritant les rappeurs les plus inventifs et les plus féconds.29 Les véritables débuts du rap français et de sa reconnaissance sont généralement liés à la sortie de l’album Qui sème le vent récolte le tempo de MC Solaar en 1991 qui est ensuite devenu la première star du rap en France.30

Étant donné que l’essort du rap français provient de la périphérie des grandes villes, des banlieues défavorisées, il est souvent lié à des termes dépréciatifs comme l’échec scolaire, le chômage ou le racisme.31 Il manifeste une tendance à l’auto-exclusion qui est propre à des groupes socialement exclus, marginalisés ou rejetés. Calvet introduit également à propos du rap la notiton de « culture intersticielle à des fins identitaires » qui décrit les jeunes se situant entre deux cultures, deux langues (celle de leurs parents et du pays d’accueil).32 Pour marquer cette exclusion, le rap est accompagné également de différents signes, dans la plupart des cas repris aux variantes du mouvement hip-hop américain, ayant surtout une fonction identitaire. Nous pouvons citer dans cette même mouvance les graffes, le breakdance, la casquette portée à l’envers, les baskets, la mode du basket et des vedettes noires américaines etc. Cette délimitation est en effet renforcée par des transformations linguistiques telles que le verlan. Le rap joue donc un rôle symbolique car il sert, d’après Calvet, « de miroir identitaire. »33

Le rap tire ses origines de la tradition orale noire américaine34 ; c’est justement cette oralité qui est très importante et caractéristique à toutes les cultures populaires.35 À l’origine du rap en tant que genre musical, qui peut être caractérisé comme un genre écléctique, nous trouvons entre autre des genres musicaux tels que la funk, le reggae ou le jazz et surtout la volonté de créer quelque chose de nouveau, qui pourrait être doté de l’épithète « créatif ». Le rap est lié à la jeunesse36, il se positionne comme le porte parole

29 Christian BÉTHUNE (2003). Le RAP : Une Esthétique hors la loi. Paris : Ed. Autrement, p. 204. 30 Sébastien BARRIO (2007). Sociologie du rap français : état des lieux (2000/2006). Thèse dirigé par M. Rémy Ponton. Université Paris 8 – Vincennes/Saint Denis, p. 31. 31 L.-J. CALVET (1994). Les voix de la ville : Introduction à la sociolinguistique urbaine. Paris : Payot, p. 269. 32 Idem., p. 269. 33 Idem, p. 279. 34 S. BARRIO (2007). Sociologie du rap français…, op. cit., p. 32. 35 Ch. BÉTHUNE (2003). Le RAP : Une Esthétique …, op. cit., p. 45. 36 Manuel BOUCHER (1998). Rap, expression des lacars. Paris : Union peuple et culture, p.163. 11

d’une génération.37 Barrio distingue la première génération des « anciens » qui continue dans la tradition revendicative telle qu’on la connait aux États-Unis, et celle des « nouveaux » qui ont déjà été influencés par le rap institutionnalisé.

Il s’agit d’un art urbain pratiqué dans les banlieueus38 touchant souvent la problématique des injustices au sein de la société.39 Nous pouvons parler de « l’attitude caillera », d’une façon de se présenter de manière défensive ou revandicatrice. Les rappeurs dénoncent ainsi le monde agressif et sans pitié.40 Le rap est dans un premier temps une musique personnelle, accessible et qui s’adresse vers le collectif, apportant un témoignage. Il s’agit donc « d’une chronique de la vie quotidienne de la cité. »41 Les rappeurs parlent de ce que l’on vit tous les jours, dans de nombreux cas il s’agit de transmettre une éxpérience vécue des banlieues défavorisées.42 Ce message peut être rapporté de façon ironique, avec humeur ou de façon réaliste.

Parmi les thèmes centraux du rap citons la politique, ensuite on croise des thèmes sociaux tels que le racisme, l’accès à l’emploi des jeunes, l’exploitation par le travail ou la place de certains groupes comme les immigrés ou les handicapés.43 L’humain ou l’éducation, les thèmes plutôt récents dans le rap, sont souvent dotés d’une connotation positive permettant d’éviter la déviance qui est méprisée. D’autres termes déterminants liés au rap sont le quartier et la rue qui correspondent à la dimension urbaine et populaire du rap et à la population qui vit le quotidien dans les rues.44 La rue forme un point de repère central puisque les rappeurs y rapportent leurs origines, leur appartenance et l’inspiration ce qui est naturellement explicable par le fait que l’apprentissage dans la rue dans les yeux des afro-américains consitute un élément indispensable dans l’éducation.45 Un autre élément important et l’un des thèmes majeurs est la violence et l’image des « gangsters » qui empreigne non seulement les textes mais aussi les clips vidéo et les pochettes des albums.46 Or, dans la plupart de temps, il ne s’agit pas d’une violence réaliste, « de

37 S. BARRIO (2007). Sociologie du rap français…, op. cit., p. 42. 38 Idem, p. 65. 39 Idem, p. 70. 40 M. BOUCHER (1998). Rap, expression des lacars, op. cit., p.165. 41 Idem, p.161. 42 Idem, p.164. 43 S. BARRIO (2007). Sociologie du rap français…, op. cit., p. 91. 44 Idem, p. 96. 45 Ch. BÉTHUNE (2003). Le RAP : Une Esthétique…, op. cit., p. 120. 46 Idem, p. 157. 12

nombreux couplets ne sont pas à prendre au sens littéral »47 ; il faut donc tenir compte du travail poétique et de nombreuses métaphores. Le thème de la violence n’est pas pourtant une nouveauté, il est présent dans la tradition afro-américaine.48 Le rap manifeste également le rapport entre les jeunes et les drogues. Le thème de la drogue est néanmoins traité de plusieurs manières, de façon générale, on fait différence dans l’appréhension entre la drogue douce et la drogue dure. La jeunesse voit dans la drogue douce, qui peut être appelé de nombreux synonymes tels que l’herbe, le cannabis, la marijuana, le sheet, la gandja, le teush etc., un moyen de protester, de s’identifier, de renforcer les rapports sociaux et d’affirmer la différenciation de l’univers réaliste des adultes.49 En revanche, la consomation des drogues dures est fortement déconseillée.50

Quant à la variation au sein de ce genre musical, il existe bien évidemment de différents types de rap. Le rap festif issu de la tradition funk, mettant l’accent sur la musique, les thématiques des soirées, de la gaieté, aborde rarement les questions politiques et vise surtout un public de la jeunesse. En revanche, le rap poétique s’oriente plutôt à un public non-consommateur et peut toucher les questions idéologiques ou même le thème de l’amour ; citons par exemple le rappeur MC Solaar (dont l’album Chapitre 7 est inclus dans notre corpus). Barrio distingue encore le rap humoristique qui joue sur la parodie, l’humour, le sarcasme et le second degré, le rap ego-trip où les artistes font l’éloge d’eux- mêmes, le gangsta rap se répandant surtout à la fin des années 90, racontant les déviances et les crimes qui se sont passés dans les banlieueus, le rap à « thème » qui recherche des thèmes originaux ou le rap conscient (le rap politique) qui exprime un engagement politique et qui souligne souvent les inégalités dans la société. Citons par exemple les rappeurs comme Keny Arkana, MC Solaar, Assassin, Oxmo Puccino, Kery James etc.

Pour fermer cette brève caractéristique générale des thématiques dans le rap il importe de présenter encore un autre trait intéressant. Le rap, étant l’héritier de la culture afro-américaine, fait preuve également d’une frontière faible qui sépare le sacrée du profane. On a affaire à des transitions des poétiques d’un domaine à l’autre.51

47 Robin D. G. KELLEY (1996). « Kicking reality, kicking ballistics : gangsta rap and post-industrial Los Angeles » dans Droppin' Science, critical essays on rap music and hip-hop culture. Collectif dirigé par William Eric Parker. Philadephie : Temple University Press, p. 121. 48 Ch. BÉTHUNE (2003). Le RAP : Une Esthétique …, op. cit., p. 164. 49 M. BOUCHER (1998). Rap, expression des lacars, op. cit., p.168. 50 Idem, p.171. 51 Ch. BÉTHUNE (2003). Le RAP : Une Esthétique …, op. cit., p. 184. 13

En ce qui concerne le langage de rap, il se situe à la frontière de l’argot et de jargot. L’argot est très riche en déformations lexicales et en figures comme : les substitutions de suffixes argotiques, l’introduction d’une syllabe parasite, l’utilisation des métaphores, des métonymies, des emprunts à langues étrangères ou les abréviations.52 Les rappeurs puisent également de la polysémie du langage argotique. Nous y trouvons les procédés comme le verlan (qui est assez caractéristique pour la région parisienne), le sigle, l’apocope aussi bien que l’aphérèse. Pourtant ce langage manque de l’opacité, il est fait pour être compris et donc de ce point de vue il est plus proche de jargot. Les paroles manifestent l’appartenance au quartier dans lequel le rappeur évolue.53 Le vocabulaire évolue selon les quartiers et les villes et cette langue devient un code de reconnaissance pour les jeunes des quartiers54. Dans la partie pratique nous essayons de voir si nous pouvons prouver ce fait (la différence entre le langage et l’utilisation du verlan des rappeurs de la region parisienne et les rappeurs du sud) sur la base de l’analyse textométrique.

1.3 Le verlan

Dans notre travail, nous allons nous intéresser au verlan car il s’agit premièrement d’un phénomène lexical bel et bien mesurable, il représente un jeu au niveau du signifiant. Il permet donc une analyse quantitative. Deuxièmement, ce phénomène est assez fréquent comme nous l’avons vu en présentant le français non-standard. De plus, il n’apparaît pas dans la langue tchèque, ce qui le rend d’autant plus intéressant.

En ce qui concerne l’apparition de ce phénomène, Calvet accentue qu’il faut bien distinguer l’apparition publique et de sa « vie souterraine préalable ».55 Ainsi pouvons- nous considérer que le verlan est apparu avec la chanson de Renaud Laisse béton de 1977. Toutefois, dans certains quartiers parisiens, on entendait parler verlan dans les années 1960.56 Ce jeu sur la forme est cependant beaucoup plus ancien car nous trouvons par exemple Bonbour pour « Bourbon » en 1585. Son emploi était limité et il ne connaît un essor qu’à partir des années 1930 et 1960 dont l’usage faisait surtout parmi les jeunes. Cet emploi demeurait pourtant minoritaire jusqu’aux années 1990 quand le verlan vit une très

52 M. BOUCHER (1998). Rap, expression des lacars, op. cit., p.174. 53 Idem, p.174. 54 Idem, p.178. 55 L.-J. CALVET (1994). L’argot, op. cit., p. 81. 56 Idem. 14

grande créativité même dans les médias.57 La verlanisation est aujourd’hui un marqueur d’identité des bandes d’adolescents de banlieues qui basent leur propre culture ou un mode de vie basé sur le rap. Au même titre qu’un certain style graphique, une mode des baskets et des casquettes de base-ball.58 Toutefois, le verlan n’est pas exclusivement un phénomène de bandes ; on le trouve aussi chez des jeunes de beaux quartiers qui veulent se démarquer de leurs parents par l’utilisation de verlanisations.

Françoise Gadet explique à propos du verlan qu’ « il s’avère différenciateur de façon spatiale (il est surtout caractéristique de la région parisienne ou au moins du nord de la France ; on ne le rencontre guère aussi souvent par exemple à ou à Grenoble) et de façon temporelle (il est aujourd’hui en perte de vitesse en région parisienne… »).59 Les spécialistes sont donc capables de reconnaître, à partir de la façon dont ils utilisent le verlan par exemple, l’origine sociale du locuteur. Dans la partie pratique nous nous occuperons de la question de la différence spatiale dans l’usage du verlan dans le rap français, et nous essayerons donc de démontrer si cette affirmation est valable également dans ce domaine-ci.

1.3.1 Typologie des verlanisations selon l’approche lexicographique

Les mots en verlan s’insèrent continuellement dans le lexique commun de telle manière que certains mots verlanisés sont connus par tout le monde. Ils subissent un procès de la lexicalisation à tel point que nous pouvons les trouver dans les dictionnaires de référence de type Le nouveau Petit Robert. C’est le cas par exemple de meuf, keuf, feuj. Ces mots, dotés d’étiquette « lexicalisé », perdent donc leur valeur argotique aussi bien que leur connotation. À côté de ces verlanisations lexicalisées et généralisées, il existe un grand nombre de verlanisations qui sont captées et présentées dans les dictionnaires spécialisés de type Comment tu tchatches !60, Bien ou quoi ?61. Pour prendre en compte ces différents types de verlanisations dans notre recherche, nous reprendrons le classement des

57 L.-J. CALVET (1994). L’argot, op. cit., p. 81-82. 58 Idem, p. 85. 59 F. GADET (2003). « Français populaire un classificateur déclassant », art. cit., p. 112. 60 J.-P. GOUDAILLIER (2001). Comment tu tchatches ! : dictionnaire du français contemporain des cités. Paris : Maisonneuve et Larose. 61 Roland LAFFITTE, Karima YOUNSI (2004). Bien ou quoi ?: la langue des jeunes à Ivry-sur-Seine. Paris: Selefa. 15

verlanisations lexicalisées / semi-lexicalisées / non-lexicalisées d’après Tereza Sekaninová62 :

1) si la verlanisation n’apparaît dans aucun dictionnaire que nous avons consulté63, nous la considérons comme non-lexicalisée ; 2) si la verlanisation est trouvable dans un, deux et/ou trois dictionnaires consultés, elle se pose comme semi-lexicalisée ; 3) si la verlanisation fait son entrée dans quatre et/ou plus de dictionnaires consultés, elle peut être estimée comme lexicalisée ; 4) si la verlanisation est présente dans un dictionnaire de référence sur deux consulté, elle est de caractère lexicalisé (et généralisé) sans prendre en compte le nombre de dictionnaires dans lesquels elle figure.

Nous utiliserons ce classement pour trier les verlanisations de notre corpus pour pouvoir ensuite créer les groupes de formes qui nous aiderons à observer la distribution géographique des types de verlanisations.

1.3.2 Procédés morphologiques de formation des verlanisations

Comme le mot verlan l’indique, les mots verlanisés sont des mots, le plus souvent disyllabiques, dont les syllabes sont inversées. Or, dans la langue, rien n’est regulier à cent pourcent. De plus, il s’agit d’un phénomène avec un aspect ludique ; la formation des verlanisations est donc un procès assez complexe. Nous allons présenter brièvement la typologie de sa formation.

Lorsqu’on transforme un mot monosyllabique fermé de type C (C) V (C) C, la transformation s’effectue par un passage d’une forme disyllabique à une forme monosyllabique par le biais d’une apocope.64 Ainsi sont crées les mots : meuf ([fam]  [famø]  [møfa]  [mœf]), keuf, reup, keum, reum etc. Lorsque nous avons affaire à un mot monosyllabique ouvert de type CV, ce dernier ne nécessite pas de passage par un mot disyllabique, et donc dans ce cas-là, il s’agit d’une simple permutation des deux phonèmes. Par exemple, là [la]  àl [al], ça [sa]  aç [as].

62 Tereza SEKANINOVÁ (2012). Stéréotypes liés au verlan : variation diatopique dans le rap français. [en ligne] Mémoire de Master. Brno : Université Masaryk, p. 84. 63 Les dictionnaires utilisés: Le nouveau Petit Robert 2008; Trésor de la langue française informatisé; Dictionnaire de l’argot français et de ses origines; Comment tu tchatches ?; Bien ou quoi ! ; Lexik des cités; Dictionnaire de la Zone. 64 J.-P. GOUDAILLIER (2001). « De l’argot traditionnel au français contemporain des cités ». La linguistique. vol.38, n°1, p. 16-17. 16

Étant donné qu’il s’agit d’un phénomène qui s’appuie sur la prononciation dite populaire où le schwa peut être omis, certains mots trisyllabiques peuvent être ainsi verlanisés comme s’ils étaient disyllabiques.65 C’est le cas par exemple de maquereau  [makro]  [kroma] ou de batterie  [batri]  [triba]. Le même phénomène s’observe également concernant certains mots disyllabiques qui peuvent devenir monosyllabiques en verlan, comme dans le cas de meuf, keuf, reup, keum, reum. Pour les mots trisyllabiques non-réductibles nous avons ici trois cas de figures possibles : rigolo  [golo-ri], vérité  [te-veri], portugais  [gɛ -typor]. Il peut également s’observer le cas de mots, au départ trisyllabiques sans avoir de schwa comme le phonème final, qui aboutissent à un mot dissyllabe : dépouillé  [pujde], énervé  [venɛʁ]. C’est notamment le cas des participes passés.

À côté des verlanisations créées par une simple permutation de syllabes (avec une éventuelle omission de phonèmes), nous trouvons un nombre considérable de mots dont la formation était suivie (ou dans certains cas précédée) par un autre procédé. Voici le tableau récapitulatif avec ses exemples :

Tableau n° 1 : Récapitulation des modes de formation des verlanisations verlan tromé – métro, bellepou - poubelle verlan + apocope tasse – verlan de « pétasse »  taspé  apocope  tasse tèç – verlan de « cité »  téci  tèç teush – verlant de shit « haschisch »  teushi  teush meuf, keuf, reup, keum, reum… verlan + redoublement teuteu verlan + résuffixation chichon – verlan de « haschisch » chicha  résuffixation  -on rabzouille – verlan de « arabes »  rabza  résuffixation  -ouille verlan + verlan rebeu verlan + chute d’un phonème gout-dé, mifa verlant + plusieurs procédés zonz, zeb apocope + verlan cro-mi aphérèse + verlan cain-ri Ce tableau nous servira de point de départ pour le tri des verlanisations présentes dans notre corpus afin de pouvoir observer la tendance et la fréquence des types de formation, surtout en ce qui concerne les nouvelles verlanisations non-lexicalisées.

65 Vivienne MÉLA (1997). « Verlan 2000 ». Langue française. n°114, p 19. 17

1.4 Linguistique de corpus

Pour effectuer notre recherche, nous allons travailler avec un corpus, c’est-à-dire avec « une collection de données langagières qui sont sélectionnées et organisées selon des critères linguistiques explicites pour servir d’échantillon du langage ».66 La notion de corpus en linguistique est liée au développement des outils informatiques qui permettent l’utilisation de grands corpus, facilitent leur constitution, leur annotation, et permettent ensuite de les saisir statistiquement.

Il existe de grands corpus nationaux comme par exemple le Frantext qui est la base de données des textes français la plus complète avec 4 515 références, 271 599 218 mots, du XIIe au XXIe siècle, développée et maintenue au sein de l’ATILF-CNRS67.68 Frantex a été créée dans les années 70, afin de fournir des exemples pour le Trésor de la Langue Française69. À côté de Frantext nous trouvons par exemple le Corpus de Référence du Français Parlé (CRFP) constitué sous la direction de Claire Blanche-Benveniste qui comporte des données représentatives du français parlé. Ce corpus compte environ 440 000 mots et il est constitué de 134 enregistrements.70 Un autre exemple de corpus du français parlé est CLAPI71 avec une quarantaine de corpus oraux et 120 transctiptions de situation interactionnelles variées. Mentionnons encore le Corpus journalistique de l’Est Républicain qui est constitué de données textuelles correspondant à trois années de toutes les éditions intégrales du quotidien régional.72

La constitution d’un corpus se fait en plusieurs étapes. Premièrement, il faut faire le nettoyage du corpus où l’on élimine toutes les fautes de frappe et où l’on unifie le format (le codage). Ensuite on ajoute les informations complémentaires, les métadonnées (auteur, date, etc.) et d’autres annotations. L’annotation peut être manuelle ou automatique ; on peut annoter une structure logique du texte (les parties, chapitres etc.) ou les phénomènes lexicaux. Il est possible également d’ajouter des étiquettes, ce qui peut se faire automatiquement également en utilisant les taggeurs (par exemple TreeTagger). Souvent il s’agit d’attribuer à chaque mot des étiquettes sur leur catégorie morpho-syntaxique à l’aide

66 John SINCLAIRE (1996). Preliminary recommandations on Corpus Typology. Rap. tech., EAGLES (Expert Advisory Groupe on Language Engineering Standarts), p.4. 67 Analyse et Traitement Informatique de la Langue Française – Centre national de la Recherche Scientifique. 68 http://www.frantext.fr/ (Consulté le 15 mars 2014). 69 http://atilf.atilf.fr/dendien/scripts/tlfiv4/showps.exe?p=combi.htm;java=no (Consulté le 15 mars 2014). 70 http://sites.univ-provence.fr/delic/corpus/index.html (Consulté le 15 mars 2014). 71 http://clapi.univ-lyon2.fr/V3_Accueil.php (Consulté le 15 mars 2014). 72 http://cnrtl.fr/corpus/estrepublicain/ (consulté le 15 mars 2014). 18

de dictionnaires. Or, l’automatisme doit être souvent suivi du contrôle manuel pour que l’annotation des unités polylexicales, qui occupent une place cruciale dans le lexique, soit correcte. Il existe de nombreuses techniques pour faciliter le repérage automatique de ces mots complexes.73 Néanmoins, surtout dans le cas de notre corpus qui va contenir aussi des unités non-lexicalisées, cette procédure doit être suivie de la « désambiguïsation » et de l’ajout manuel d’étiquettes aux mots qui ne figurent pas dans le dictionnaire de référence. En somme, les annotations et les étiquettes ouvrent des possiblités de recherche automatique sur les éléments ainsi marqués.

La constitution de notre corpus sera décrite dans la partie consacrée à la méthodologie.

1.5 RapCor

Dans notre recherche, nous allons travailler avec un corpus constitué à partir du RapCor. RapCor est un corpus thématique qui rassemble des chansons de rap français. Le projet de RapCor fut démarré en 2009 et ce corpus est constamment enrichi et élargi par les étudiants en Lettres à l’Université Masaryk sous la direction d’Alena Polická.74 Il s’agit d’un corpus du français parlé. Il permet donc d’observer les phénomènes présents dans le français sub-standard, phénomènes lexicaux surtout (le verlan, la néologie, les emprunts etc.). Nous pouvons aussi nous intéresser au côté poétique des chansons, à la dimension socioculturelle du rap, ou étudier le niveau syntaxique du français parlé.

Concernant la constitution du RapCor, les textes qui y sont recueillis sont tout d’abord retranscrits (dans le cas d’océrisation75 de pochettes, le contrôle de ce processus est effectué). Nous faisons ensuite un contrôle de la correspondance du texte et de la version sonore de la chanson, puis un marquage des fautes ortographiques et d’éventuelles différences entre ces deux versions. Ainsi obtenons-nous deux variantes de la chanson. La variante « sonore » est ensuite ségmentée et lemmatisée à l’aide de TreeTagger. Étant donné que les paroles des chansons contiennent un grand nombre de néologismes et d’autres mots non-lexicalisés, un grand nombre d’unités lexicales n’est pas étiqueté (le dictionnaire de TreeTagger ne connait pas ces mots et ne peut donc pas les rattacher à une

73 Benoît HABERT, Adeline NAZARENKO, André SALEM. (1997). Les linguistiques de corpus, [en ligne], p. 168. Disponible sur : http://lexicometrica.univ-paris3.fr/livre/les_linguistiques_de_corpus_1997/. 74 https://is.muni.cz/do/phil/Pracoviste/URJL/rapcor/txm.html (Consulté le 15 mars 2014). 75 Transformation automatique d’un fichier contenant l’image d’un document en fichier texte. 19

classe grammaticale). Par conséquent, il est nécessaire de parcourir manuellement les textes et de rajouter des étiquettes à ces mots inconus de TreeTagger. Certains phénomènes (comme par exemple le verlan, les arabismes, les anglicismes etc.) sont à cette étape-là également annotés. Les chansons sont ensuite converties en format xml pour pouvoir les importer dans le logiciel TXM.

Étant donné que le format du corpus est orienté vers le logiciel TXM, pour pouvoir exploiter d’autres logiciels que TXM, il est nécessaire d’adapter les chansons tirées de ce corpus. Notre besoin d’adaptation et de balisage a suscité des propositions d’ajustement de RapCor, et a engandré des travaux sur RapCor pour qu’il soit « importable » facilement dans Lexico 3, Alceste etc. À côté de l’ajout des balises, nous avons procédé à l’unification du codage et au contrôle typographique de tout le corpus. Nous disposons donc également à présent d’une variante de ce corpus comprenant des chansons non-lemmatisées, balisées en format txt.

1.6 Outils textométriques

La léxicométrie (ou statistique lexicale) est une science qui étudie statistiquement l’usage des mots. Nous parlons parfois également de textométrie pour démontrer qu’il ne s’agit pas seulement de l’observation des lexèmes, mais également de plus grands ensembles car la textométrie permet d’étudier aussi les unités syntaxiques. Elle peut également servir à des analyses sémantiques d’énoncés. Pour effectuer ces calculs, nous nous servons d’instruments informatiques, de divers logiciels, développés pour faciliter le travail des chercheurs en utilisant les processus de calcul statistique pour comparer les fréquences et en exploitant les possiblités de visualisation des résultats.

Un grand nombre de logiciels nous est proposé ; nous pouvons les classer selon l’orientation de l’analyse et selon les fonctionnalités de base qu’ils proposent en plusieurs groupes. Ainsi distinguons-nous les « co-ocurrenceurs » (Weblex, Alceste) qui observent la présence simultanée de deux ou plusieurs mots, ayant souvent un rapport sémantique (et nous fournissent par exemple dans le cas d’Alceste des mondes lexicaux)

Un autre groupe d’outils est représenté par les « catégoriseurs » (TreeTagger, Tropes, Cordial) qui, comme le nom indique, permettent une catégorisation

20

morphosyntaxique ou sémantique.76 TreeTagger sert à la lemmatisation77 du corpus en marquant les informations d’ordre morphosyntaxique (catégorie de mots), en nous laissant la possibilité d’ajouter des étiquettes supplémentaires, ce qui est bien outile quand on a affaire à un phénomène qui relève de la langue populaire. Tropes identifie des « univers de référence » correspondant aux grands thèmes du corpus, repère des catégories de mots et classifie ainsi automatiquement les mots du corpus. En revanche, Cordial sert plutôt à la caractérisation et à l’amélioration de l’écriture en nous procurrant des outils tels que la corréction grammaticale et orthographique, le conjugeur ou le module stylistique.

Le troisième groupe, qui va nous intéresser le plus, rassemble des outils textométriques qui proposent des fonctionnalités de base comme les concordances, l’analyse selon les partitions ou l’analyse factorielle des correspondances (AFC). Parmis ceux-ci nous pouvons citer Lexico 3, TextObserver, Hyperbase, TXM ou Astartex.

1.6.1 Lexico 3

Lexico 3 est un logiciel développé dans le laboratoire de recherche SYLED78 (Système linguistiques, énonciation et discursivité) auprès de l’Université de la Sorbonne Nouvelle Paris 3 nottament par André Salem, Serge Fleury, Cédric Lamalle et William Martinez. Lexico 3 permet de mener des analyses contrastives et chronologiques et offre les fonctionnalités suivantes : Inventaire des segments répétés, concordances, décomptes portant sur les formes graphiques, spécificités par partie, spécificités chronologiques, analyses factorielles des correspondances portant sur les formes, recherche de groupes de formes, graphiques de ventilation en fréquences absolues, relatives ou histogrammes de spécificités. Cet outil ne considère le texte que sur le plan de sa forme graphique (il ne travaille pas au niveau des lemmes) ce qui peut être un inconvénien dans certain type de recherches. Nous allons nous servir de ce logiciel car il n’est pas difficile à maîtriser. Il est clair et nous propose toutes les fonctionnalités basiques. Nous allons utiliser surtout l’analyse des spécificités et des AFC pour dégager les principaux clivages quantitatifs.

76 http://textopol.u-pec.fr/ (Consulté le 15 mars 2014). 77 Chaque variante du mot est réduite à la forme cannonique ; par exemple les formes conjugées des verbes sont mises à l’infinitif etc. 78 http://www.tal.univ-paris3.fr/lexico/ (Consulté le 15 mars 2014). 21

1.6.2 TextObserver

Ce logiciel est développé par le chantier Textopol du Céditec79 pour permettre les observations et l’exploitation des données textuelles multidimensionnelles. La priorité de cet outil est l’interactivité. TextObserver s’appuit sur la plateforme TXM, de manière à reprendre le segmenteur et les possibilités d’importation pour qu’il soit accessible à un plus grand nombre de corpus.80 L’importation dans TextObserver peut être donc effectuée à partir d’un fichier txt qui contient toutes les parties de corpus annotées, à partir d’un xml non-lemmatisé ou lemmatisé.

Parmis les fonctionnalités principales, citons AFC en 2D et 3D, affichage des lignes et colonnes avec la possibilité de sélectionner les facteurs de contribution aux axes, import de listes thématiques, affichage dynamique des points contributifs des axes, les concordances etc.

L’avantage de cet outil en comparaison avec Lexico 3 repose sur l’interactivité, sur l’affichage des points contributifs et sur une représentation en 3D avec une possibilité de zoom et de navigation. TextObserver permet également de visualiser l’interpolation, c’est- à-dire d’observer les relations entre l’AFC initial et l’AFC avec un élément supprimé.

1.6.3 Alceste

Ce logiciel commercialisé, conçu à l’origine par Max Reinert du CNRS, est en ce moment la propriété de la société Image81. Alceste propose une classification originale – la classification descendente hiérarchique. Il procède par fractionnement successif du texte et en extrait des classes représentatives en rapprochant les segments qui contiennent les mêmes léxèmes.82 Plus précisément, il fonctionne sur la base des algorithmes qui construisent la dichotomie succéssive. Ainsi l’ensemble est tout d’abord scindé en deux, chaque partie est ensuite divisée à son tour etc. La plupart de ces algorithmes de classification mesure en même temps la distance ou la dissemblance entre les mots.83 En fin de compte, on obtient un certain nombre de classes, les mondes lexicaux. Alceste inverse donc la démarche classique (classification acsendante) où l’on part des mots, et en

79 Centre d’étude des discours, images, textes, écrits, communication. 80 http://textopol.u-pec.fr/textobserver/?lang=en (Consulté le 15 mars 2014). 81 http://www.image-zafar.com/index_alceste.htm (Consulté le 15 mars 2014). 82 Valérie DELAVIGNE (2004). Présentation d'Alceste. Texto! [en ligne], vol. IX, n°4. Disponible sur : http://www.revue-texto.net/Corpus/Manufacture/pub/Alceste2.html. (Consulté le 15 mars 2014). 83 Maurice ROUX (1985). Algorithmes de classification. Paris : Masson. Disponible sur : http://www.imep- cnrs.com/docu/mroux/algoclas.pdf. 22

recherchant leur coocurrents on classe ces mots. Cependant il propose aussi une classification ascendente pour que l’utilisateur puisse optimiser les interprétations de résultats.

Ce logiciel propose aussi des AFC, des réseaux de la forme et d’autres fonctionalités. Cependant, nous allons utiliser Alceste surtout pour constituer les mondes lexicaux afin de pouvoir les comparer avec les thématiques dans le rap en général. Une méthode analogue à la méthode Alceste est également disponible dans le logiciel diffusé librement, IRaMuTeQ.

1.6.4 TXM

TXM est un outil open source, qui permet de traiter les grands corpus étiquetés et structurés en xml (ce qui rend possible le travail avec les annotations spécifiques de RapCor par exemple). Le responsable du projet TXM est Serge Heiden qui travaille avec son équipe de développeurs auprès de l’École Normal Supérieur de Lyon. 84

Un des grands avantages de cet outil est la possibilité de l’installer également sur Linux ou Mac (ce qui n’est pas possible pour l’instant dans le cas de Lexico 3 ou TextObserver). On y trouve des fonctionnalités comme la construction des sous-corpus à partir de métadonnées, la construction des partitions, les concordances avec un retour aux textes (aussi avec des recherches de motifs lexicaux complexes), les AFC avec les contributions etc.

TXM est un outil bien documenté avec la possibilité de regarder des vidéos d’atelier d’iniciation à TXM sur Youtube.85 Nous allons nous servir de TXM au départ de notre recherche pour extraire de notre corpus lemmatisé (repris du RapCor) les verlanisations étiquetées en xml pour ensuite en constituer des groupes de formes et des listes thématiques. Ceci nous facilitera le travail (nous ne devrons pas rechercher toutes les verlanisations à la main) et nous pourrons observer ce phénomène dans les autres logiciels qui ne reconnaissent pas ces annotations supplémentaires. En outre, certains logiciels ne travaillent qu’avec la variante non-lemmatisée de corpus (Lexico 3), nous perdons donc avec l’import du corpus non-lemmatisé toutes ces annotations.

84 http://textometrie.ens-lyon.fr/?lang=fr (Consulté le 15 mars 2014). 85 http://txm.sourceforge.net/enregistrement_atelier_initiation_TXM_fr.html (Consulté le 15 mars 2014). 23

2 DEFINITION ET PREPARATION DE CORPUS

Les premiers pas de notre recherche sont la construction du corpus des chansons de rap comportant des verlanisations. Étant donné que nous essayons de montrer les possibilités du traitement d’un corpus qui comporte des phénomènes lexicaux à l’aide de logiciels textométriques, nous avons décidé de reprendre le corpus et certaines hypothèses de notre collègue Tereza Sekaninová86 concernant des verlanisations et il s’agit d’une part de comparer les résultats obtenus par des logiciels lexicométriques (Lexico 3, TextObserver, Alceste, TXM) et, d’autre part, il faut montrer ce que nous pouvons obtenir comme résultats en travaillant avec ces logiciels.

Image n° 1 : Carte de la France – délimitation de la frontière entre deux espaces de la scène musicale87

Le corpus de Tereza Sekaninová, qui comporte 270 chansons, était composé des chansons figurant dans le corpus RapCor. Ce corpus fut constutué en respectant deux critères. Le premier critère était celui de la provenance géographique des interprètes. Il fallait choisir des interprètes du Nord de la France aussi bien que du Sud pour pouvoir comparer d’éventuelles différences d’emploi et de construction des verlanisations dans ces

86 T. SEKANINOVÁ (2012). Stéréotypes liés au verlan…, op. cit. 87 Idem, p. 49. 24

deux espaces. La définition des cadres géographiques fut faite par le marquage de la frontière sur la carte de la France qui mène parallèlement avec la frontière du nord des régions Poitou Charente, Limousin, Auvergne et Rhône-Alpes (voir l’image n°1). Le deuxième critère adopté par Sekaninová fut l’année de la sortie de l’album. Il fut choisi de travailler avec les chansons créées dans une période de dix ans (de 2001 à 2011).

Les chansons reprises étaient préparées et annotées spécialement pour le logiciel TXM. La construction et la préparation de notre corpus consiste donc premièrement en une modification et une adaptation du corpus pour le logiciel Lexico 3 à partir des textes bruts des chansons. Chaque logiciel demande un certain format d’import sous peine de ne pas pouvoir être traité. Dans le cas de Lexico 3, il est nécessaire de mettre toutes les parties du corpus, c’est-à-dire tous les textes qui correspondent à des chansons, dans un seul fichier .txt et de baliser chaque partie. Cette annotation et cette délimitation des parties du corpus nous permet de définir des blocs plus grands (par exemple un bloc de tous les chanteurs du nord de la France) aussi bien que les parties plus petites qu’une chanson. Par exemple, cette segmentation permet de faire la distinction entre les passages chantés par des rappeurs invités, « featuring », et les rappeurs « auteurs de l’album ».

2.1 Préparation des textes

La préparation est effectuée en plusieurs étapes. Premièrement, il faut unifier le codage des textes (nous avons rencontré des textes où deux codages étaient mélangés). Ensuite est nécessaire le travail de nettoyage des caractères, surtout des apostrophes. Par la suite, la réduction des majuscules au début d’un vers est important puisque Lexico3 considère les mots « La » et « la » comme des formes distinctes.

2.2 Balisage du corpus pour Lexico3

Les premières expérimentations avec la forme de balise mènent à l’ajout successif de plusieurs balises, ainsi qu’à leur combinaison.

La première balise contenant l’information sur le locuteur n’était pas efficace et ne montrait pas beaucoup d’informations car il s’agissait d’un code mélangeant les indications sur le locuteur aussi bien que sur la participation d’un autre chanteur. Cela a provoqué que nous avons reçu une grande quantité de locuteurs. Un locuteur pouvait apparaître plusieurs fois seulement à cause de la marque qui incluait aussi l’invité. Il est évident qu’il faut soit

25

distinguer qui parle dans telle ou telle partie du texte en utilisant une seule marque pour chaque locuteur, soit de négliger la participation d’un autre chanteur. Ceci nous amène à l’idée d’essayer de comparer ces deux approches dans les logiciels. Nous nous sommes décidée à constituer deux types de balises. Une qui porterait l’information seulement sur l’auteur de l’album – locuteur1 et l’autre qui différencierait précisément qui parle – loc_feat_membregroupe. En effectuant le marquage, l’idée de ne pas distinguer les chanteurs au sein d’un groupe mais de marquer le texte tout simplement par un code du groupe était née. En supposant que le texte est l’œuvre collective du groupe, il nous paraissait inutile de distinguer qui parle exactement. D’ici vient l’idée de la dernière balise loc_feat qui ne tient pas compte de quel membre du groupe parle, mais qui pourtant tient compte des invités (des « featurings »).

26

Pour rendre efficace notre traitement, nous avons aussi combiné les balises. Nous avons ajouté l’information sur la provenance géographique dans la balise de locuteur. Le N est utilisé pour marquer le Nord de la France (défini ci-dessus), la marque S signifie le Sud de la France, X montre que nous ne connaissons pas l’origine, GB marque l’auteur d’origine britannique et USA d’origine américaine.

2.3 Marquage des verlanisations

Pour effectuer un marquage rapide, nous dressons une liste de verlanisations selon laquelle nous procéderons à la recherche des mots dans le corpus par le biais d’un éditeur de texte. Tout d’abord, nous avons exporté une liste des mots depuis le logiciel TXM. Ensuite nous avons consulté la liste des verlanisations trouvés par Tereza Sekaninová88 et, finalement, nous avons complété notre liste par des formes graphiques et par d’autres verlanisations que nous avons trouvées sur l’Internet.89

Une fois la liste prête, les verlanisations peuvent être marquées par un astérisque avant le mot. Une expérimentation a montré qu’un astérisque après les mots n’était pas pratique car même en ajoutant l’astérisque parmi les délimiteurs, il n’était pas facile de faire un groupe de formes avec tous les mots verlanisés. En revanche, l’astérisque devant un mot permet d’aligner dans le dictionnaire toutes les verlanisations par ordre alphabétique. Nous pouvions ensuite facilement glisser les mots et créer un groupe de formes.

2.4 Problème avec le codage

Un des problèmes rencontrés portait sur le codage des textes et l’incompatibilité de codage UTF-8 (UCS Transformation Format - 8-bit) avec les logiciels français plus précisément avec Lexico3. Le codage UTF-8 est pratique puisqu’il supporte une grande quantité de caractères, y compris tous les caractères français. Il est supporté non seulement par le système d’exploitation Windows français, mais aussi par la version tchèque. Mais comme Lexico 3 ne travaille qu’avec le codage windows-1252 (ANSI), il fallait donc soit travailler dans deux systèmes d’exploitations - dans Linux qui est capable de travailler avec les deux codages et de les faire passer facilement à l’aide du petit logiciel iconv de

88 T. SEKANINOVÁ. Stéréotypes liés au verlan…, op. cit., p. 161-162. 89 Wikipédia, l'encyclopédie libre. Verlan. [en ligne]. (Modifié le 12 mars 2013) Disponible sur : http://fr.wikipedia.org/wiki/Verlan (consulté le 14 mars 2013). 27

l’un à l’autre en cas de besoin et dans Windows où uniquement nous pouvons démarrer le logiciel Lexico 3 soit posséder un système Windows français où le codage ne poserait pas de problème. La dernière possibilité de travailler dans le système d’exploitation tchèque uniquement était très compliqué, bien qu’il existe des logiciels pour faire passer un texte d’un codage à un autre aussi pour Windows, mais cela s’avère beaucoup plus compliqué que sous Linux.

2.5 Balisage et importation dans TextObserver

Étant donné que TextObserver permet plusieurs façons d’importer le corpus, il était pratique et relativement rapide de transformer la forme de la balise pour Lexico3 à l’aide d’un petit logiciel. TextObserver demande une balise en langage xml. Ainsi, nous avons obtenu un fichier xml comportant toutes les parties balisées du corpus. Par expérience, nous avons trouvé quelques exigences spécifiques de TextObserver quant à la forme. Premièrement la balise ne peut contenir que des caractères anglais (il faut enlever tous les caractères spécifiques comme « é », « à », « ç » etc.). Deuxièmement il ne faut pas mettre un tiret bas dans la balise. TextObserver ne le traite pas bien. Il lui arrive de ne pas trouver du tout cette balise. Par conséquent, nous avons changé un peu le nom des balises: loc_feat_membregroupe devient FeatMembreGr et loc_feat devient LocFeat. Finalement, il est nécessaire d’enlever ou de remplacer les caractères comme « & » du texte. Dans notre corpus, il y avait par exemple « Dolce & Gabbana », « M&M’s » « R&B» etc. ; nous les avons remplacés par « n’ » .

28

TextObserver est également capable d’importer le corpus sous d’autres formats. L’un, dont nous profitons, est l’importation d’un seul fichier xml rassemblant toutes les parties du corpus déjà lemmatisées et étiquetées. Les chansons du corpus Rapcor sont disponibles dans ce format lemmatisé, et donc il suffit seulement de mettre toutes les chansons dans un seul fichier xml à l’aide d’un script sous Linux :

#!/bin/bash cat ~/Desktop/textobserver/*.xml > ~/Desktop/textobserver/corpus/corpus.xml

2.6 Balisage et importation dans Alceste

La transformation de notre corpus en format qui demande Alceste est facile à partir de celui qu’on avait pour Lexico. Étant donné que nous avons pour but de faire une analyse générale des thématiques de tout le corpus nous n’avons pas besoin de distinction de beaucoup de sousparties. Il nous suffit de laisser seulement la partition selon les locuteurs (loc_feat) et d’omettre tout le reste. Ainsi chaque partie doit-elle commencer par quatre étoiles, espace, une étoile, nom général de partition, tiret bas et le nom de notre partition. Nous avons également ajouté ou plutôt laissé dans le nom aussi l’information sur la provenance géographique du locuteur. La balise est donc en ce format :

**** *loc_N_ALI

29

3 ANALYSE DU CORPUS

Tout d’abord, nous nous concentrerons sur des caractéristiques générales du corpus et sur la distribution des verlanisations dans le corpus. Plus précisément, notre observation portera sur des caractéristiques purement statistiques du corpus, plus concrètement sur les mots employés le plus souvent et les hapax90, ainsi que sur la différenciation de la fréquence des verlanisations selon la provenance géographique. Pour cet effet nous allons nous servir de Lexico 3. Les thèmes abordés dans notre corpus, que nous allons ensuite comparer avec ceux, généralement présenté (voir le chapitre Le rap et le langage dans le rap), seront examiné à l’aide du logiciel Alceste. L’analyse concrète des verlanisations et la vérification de nos hypothèses sera, quant à elle, effectuée par l’entremise de Lexico 3 et TextObserver.

Pour effectuer l’analyse portant sur les différences entre le corpus sans « featurings » marqués et celui avec tous les chanteurs étiquetés, nous allons nous servir des AFC générés par Lexico 3, et par TextObserver. De même, pour répondre à la question de savoir s’il est nécéssaire de distinguer les chanteurs du même groupe ou si cela est négligeable parce qu’ils partagent le même langage.

3.1 Caractéristiques générales

Pour signaler les caractéristiques générales de notre corpus, nous allons nous servir sourtout de Lexico 3, puisqu’il est assez clair et facile à maîtriser, également d’Alceste, qui nous fournira des « mondes lexicaux » ou des thématiques abordées dans notre corpus.

3.1.1 Principales caractéristiques lexicométriques – Lexico 3

En partant du tableau de base affichant les principales caractéristiques lexicométriques de chaque partie (en choisissant la partition loc_feat), nous pouvons déjà dresser une caractéristique de départ. Tout d’abord, notre corpus comporte 164 968 occurrences, 19 182 formes graphiques et 10 322 formes qui n’apparaissent qu’une seule fois. La fréquence maximale montre le nombre d’occurrences de la forme la plus fréquente du corpus.

90 Les mots qui ne sont employés qu’une seule fois. 30

Image n° 2 : Caractéristiques générales du corpus

À partir des mots les plus employés, nous pouvons constater, qu’il s’agit d’un corpus atypique, ou plutôt qu’il comporte des parties très variées en lexique et en nombre d’occurrences. Habituellement, le mot le plus fréquent est la préposition de ou, à la limite, des articles. Nous trouvons également à côté de ces deux classes le pronom personnel je (souvent élidé) ou l’emploi plus particulier de tu (N_ELR91), vient ensuite le pronom on (N_MAL92, N_ZEL93, X_ZAH94), la préposition pour (S_KRH95), la conjonction de coordination et (N_DIA_X_JBR96 ; N_BLA97 ; N_BOU98), la conjonction de subordination que (N_NUT99 ; S_LEA100), le verbe être conjugé à la troisième personne du singulier (N_TAI101) et l’amalgame de la préposition avec l’article défini au (X_JAL102).

Le tableau reflète tout de suite également une autre particularité de notre corpus : il comporte des parties qui sont en anglais. Il s’agit de locuteurs « featuring » USA_SLJ103 dont le mot le plus fréquent et do et GB_OMA104 qui emploit le plus souvent le mot that.

En observant les nombres d’occurrences, il apparaît comme évident que le corpus contient un certain nombre de parties qui sont très petites par rapport aux autres (cf. image n°3). Il s’agit en général des parties de textes d’un chanteur « featuring » ou parfois d’une partie où l’auteur chante avec le chanteur invité simultanément. Par conséquent, les mots les plus fréquents diffèrent souvent du reste. C’est le cas par exemple de S_PSY_S_MIO105 avec le déterminant possessif au féminin ma ou X_FLF106 avec le pronom te.

Image n° 3 : Illustration du déséquilibre des tailles des parties

91 Elodie Rama 92 Mala 93 Zeler 94 Zaho 95 K.Rhyme Le Roi 96 Diam’s avec Jacky Brown dans la chanson Me revoilà (Album : Dans ma bulle, 2006). 97 Blacko 98 Boulox 99 Nuttea 100 Léa Castel 101 Taïro 102 Janice Leca 103 Syleena Johnson 104 Omar 105 Groupe PSY 4 de la Rime et de Mino dans la chanson On naît, on vit, on meurt (Album :Block Party, 2002). 106 Flavor Flow 31

3.1.2 Les thématiques trouvées par Alceste

En ce qui concerne les thématiques présentes dans notre corpus nous allons regarder les résultats de la classification descendante (l’analyse et classification automatique sur la base de différents algorithmes de classification) de notre corpus, ce qui nous permet d’observer les idées et les thèmes dominants du corpus. Pour cet effet nous nous sommes servie du logiciel Alceste qui n’a identifié que 3 classes (voir l’image n°4).

32

Image n° 4 : Classification descendente (Alceste)

La première classe, qui contient d’habitude les mots et les phrases les plus significatifs, comporte des mots vulgaires, argotiques, le vocabulaire marqué par les procédés relevant du language parlé, avec les thèmes de la drogue, du sexe et du rap (mec, mic, rap, baiser, fuck, cul, gun, etc.). Nous pouvons constater que cette classe correspond seulement partiellement à des thématiques généralement attribuées au rap (que nous avons relevées dans le chapitre Le rap et le langage dans le rap). Cette analyse fait plus preuve de la spécificité du langage employé (français non-standard, jeux de mots, emprunts) que de l’importance de thèmes tels que la politique, les questions sociales, la rue ou le banditisme.

33

La deuxième classe rassemble des mots à consonnances plus poétiques, avec des thématiques touchant la vie tel que vivre, amour, chance, solitude, jour etc. Cette dimension relevée par Alceste démontre l’approchement du rap à la poésie et montre également la présence de morceaux des artistes classifiés dans le courant du rap poétique au sein de notre corpus (par exemple MC Solaar).

La troisième classe, la moins forte au niveau de sa spécificité, oscille autour de mots tels que : homme, guerre, terre, survivre. Nous pouvons considérer que ces familles de mots correspondent à la dimension sociale et au caractère défensif voire combatif du rap qui se voit comme un porte-parole décrivant la dure réalité, les souffrances et l’hostilité du monde.

3.1.3 Analyse factorielle des correspondances (Lexico3 et TextObserver)

Pour avoir un aperçu général de notre corpus, nous nous servirons de l’outil Analyse factorielle des correspondances - AFC (de Lexico 3 aussi bien que de TextObserver) qui nous montre des affinités des parties ou de grandes différences sous l’image d’un graphique. Le premier graphique d’AFC généré par Lexico 3 à partir de l’ensemble du corpus (voir l’image n°5) démontre qu’il y a deux parties très différentes du reste : il s’agit des chanteurs anglophones featuring Omar (Britannique) et Seleena Johnson (Américaine). Le premier compte 123 occurrences des mots ainsi que la forme la plus employée that et la deuxième regroupe 50 occurrences et la forme la plus fréquente, do. Le fait qu’il s’agisse dans les deux cas de l’anglais et la longueur limitée des propos, les font s’afficher dans la même partie du graphique, dans les quadrants deux et trois. La différence entre eux repose sur le lexique employé.

34

Image n° 5 : AFC de l’ensemble du corpus (Lexico 3)

Lexico 3 ne permet pas de zoomer l’amoncellement du centre de système cartésien ou d’étendre le graphique pour que nous voyions ce qui se passe ensuite au milieu. Il ne nous reste qu’à enlever les deux parties et de compter l’AFC de nouveau sans ces deux parties, ce qui va changer l’aperçu de notre corpus. Également, cela nous permet de décortiquer ce qui se passe au milieu et de voir s’il n’y a pas d’autres parties qui portent une information significative qui la diffèrent des autres. Sur l’image n°6 est visualisé le résultat de cette opération. Nous voyons qu’à part quelques parties qui sont sensiblement écartées, le corpus a l’air d’être plus ou moins homogène : la plupart des parties est concentrée autour du centre du système cartésien et la plus grande accumulation se trouve dans le quatrième quadrant. Lorsque nous nous focaliserons sur les parties éloignées, nous verrons que la partition X_FLF,107 qui est la plus écartée du centre (à droite), se distingue par un petit nombre d’occurrences (7) et par l’emploi de l’anglais (like, music) ce qui crée une forte spécificité. Une autre partition qui se trouve à droite S_AKH_S_SAK108 comporte seulement trois occurrences qui, bien qu’elles soient en français provoquent par leur petit nombre l’emplacement de cette partie à droite.

107 Flavor Flow 108 & Sako 35

Image n° 6 : AFC sans GB_OMA et USA_SLJ (Lexico 3)

La partie non définie (ND) est naturellement écartée, étant assez particulière car elle comporte des propos dont le locuteur n’était pas idéntifiable. Elle contient souvent des mots anglais (dont ceux avec la plus grande spécificité sont : I, like, the, your) ou des mots comme inchallah, Marseille, jazz, soul. La partie N_SEF, qui est la seule tout en haut du graphique, se distingue par l’emploi des mots crr, frère, grand, page, public, des noms propres : Hussein, Molotov, Moussa, Sefyu, France aussi bien que par l’emploi des verlanisations. S_PSY_S_MIO est caractérisée par des mots tels que mère, ma, travail. La partie N_TPA n’a qu’un petit nombre d’occurrences (12) dont les plus spécifiques sont : boivent, gangsters, œil. Pareillement, pour N_PRAN nous trouvons peu d’occurrences (7) et la spécificité des mots : tapent, verlan, tasse, œil.

Nous avons répété l’elimination de certaines parties encore deux fois : pour la première fois nous obtenons, de nouveau, à peu près le même résultat (l’image n°7). Les parties les plus éloignées sont les parties très petites (des featurings, les parties où chantent deux rappeurs) ou le groupe intitulé « non défini ». Le quatrième enlèvement apporte un petit changement (l’image n°8) au niveau de disposition (presque toutes les parties sont rassemblées autour de l’axe x) mais parmi les parties aux extremités nous voyons dans la majorité les parties featurings et tous les rappeurs principaux sont « cachés » au centre du

36

graphique. Nous pouvons décortiquer seulement l’emplacement du rappeur Sinik légèrement à gauche. La partie N_TAI (artiste featuring Taïro), la plus éloignée, est caractérisée par l’emploi de certains mots anglais (wicked, yes), il y apparaît une verlanisation tin-ma et un nombre considérable d’occurrence de mots tout et or. Pour voir ce qui se passe vraiment au niveau des interprètes non-featurings, quel est leur positionnement l’un envers l’autre, il faudrait enlever toutes les petites parties, ce qui changerait complétement le caractère du corpus.

Image n° 7 : AFC après le deuxième enlèvement de certaines parties

37

Image n° 8 : AFC après le troisième enlèvement de certaines parties les plus éloignées

Quant au TextObserver, la visualisation d’AFC n’est pas encore réussie et nous ne voyons pas la situation dans un format compact (ce qui démontre l’image n°9 qui, sans l’annotation, ne serait pas lisible).

Image n° 9 : AFC général (TextObserver) avec des annotations

38

Cependant, nous pouvons zoomer et bouger avec le graphique, qui est disponible en 2D aussi bien qu’en 3D. L’avantage de cet outil repose notament sur le fait que la visualisation nous propose non seulement la position des parties/locuteurs, mais aussi des points contributifs (qu’on peut enlever ou n’en visualiser que les plus pertinents) et par conséquent nous aurions tout de suite pu voir pouquoi certaines parties sont écartées. Il n’est donc pas nécessaire de chercher cette information dans les spécificités. Or, étant donné que notre corpus est assez atypique et que la plupart des parties est accumulée au centre du système cartésien, nous ne voyons pas bien les mots apportant la spécificité, ni après la garde seulement des points contributifs les plus marqués en travaillant avec Séléction par facteurs de contribution aux axes (voir l’image n°10). Cet outil, dans le cas de notre corpus, ne permet pas de travailler avec les plus petites nuances dont nous avons besoin. D’un côté cela est dû à la spécificité de notre corpus qui est constitué d’un grand nombre de parties qui paraissent, jusque là, à la lumière de l’analyse textométrique, assez homogènes ; d’un autre côté TextObserver ne prend pas encore en compte la possibilité de ce genre de corpus, ni dans la façon de visualiser les résultats, ni dans le maniement des fonctionnalités. Il serait par exemple pratique de pouvoir utiliser les flèches sur le clavier pour un maniement plus précis avec le curseur.

Image n° 10 : Comparaison des deux situations : visualisation de tous les points contributifs et état des choses après le mouvement presque imperceptible du curseur dans la Séléction par facteurs de contribution aux axes

L’autre avantage de ce logiciel est la posibilité de choisir une visualisation en 3D permettant de mieux comprendre la situation. L’AFC général (sans omission des parties) montre les parties « anglophones » très éloignées avec des mots qui présentent la plus forte spécificité, comme dans Lexico. Mais nous pouvons aussi remarquer que la partie ND

39

n’est pas proche de la ligne x comme il paraissait dans le graphique de Lexico 3, mais elle est dans l’espace, plus loin sur la ligne z (voir l’image n°9).

3.2 Verlanisations – analyse détaillée

Après avoir vu les principales caractéristiques du corpus, nous nous focaliserons uniquement sur les verlanisations, leur distribution, leur fréquence dans chaque partie du corpus et leur mode de formation.

3.2.1 Distribution géographique des verlanisations

Pour cette analyse détaillée des verlanisations, nous avons établi quelques hypothèses. Premièrement, nous essayons de vérifier l’hypothèse selon laquelle le nombre des mots verlanisés sera plus élevé dans les textes des auteurs du Nord de la France que chez les auteurs du Sud.109

Pour étudier la distribution des verlanisations, nous utilisons la fonctionalité Concordance de Lexico, qui permet de voir l’emplacement d’un mot ou d’un groupe de formes dans le texte en visualisant de façon claire les mots choisis au milieu, et leur entourage dans la phrase. Il est possible également de choisir la taille de contexte ou le rangement alphabétique de la liste des concordances selon ce qui précède ou ce qui suit le mot recherché. En choisissant le groupement par lieu et en glissant le groupe de forme des verlanisations, nous arrivons à afficher les concordances des verlanisations regroupées par la provenance géographique des locuteurs. À premier vue, les proportions du corpus, du point de vue de la distribution et de l’emploi des verlanisations selon le lieu, sont très déséquilibrées. Nous le voyons plus précisément sur l’image n°11 qui comporte un nombre élevé de verlanisations – 318 dans les textes du Nord et avec 60 verlanisations dans les textes du Sud.

Image n° 11 : Le nombre des verlanisations selon l’espace géographique

Cet affichage confirme notre hypothèse que le nombre de verlanisations sera plus élevé chez les auteurs du Nord de la France que chez les auteurs du Sud. Nous avons dressé une liste des verlanisations qui apparaissent plus que cinq fois dans notre corpus et

109 J.-P. GOUDAILLIER (2001). « De l’argot traditionnel au français contemporain des cités », art. cit., p. 18. 40

une autre liste avec les hapax et nous allons observer ainsi que comparer leur différences d’emploi.

Image n° 12 : Verlanisations qui sont présentes dans notre corpus plus que 5 fois

Image n° 13 : Hapax

Sur la base des résultats ci-dessus, nous pouvons constater que les auteurs du Sud ont recours plutôt à l’utilisation des verlanisations très répandues et les plus souvent utilisées, tels que meuf, keuf, zik et caillera, et qu’ils n’emploient pas trop d’hapax. En revanche, les hapax sont très favorisés par les auteurs du Nord. Voici les deux graphiques (graphique n°1 et n°2) sur lesquels est cette tendance bien évidente. Le premier graphique affiche les nombres absolus afin de démontrer la grande différence d’emploi selon le lieu alors que dans le deuxième nous voyons bien, grâce à la visualisation en pourcentage, la tendance qu’a le Sud à favoriser les verlanisations qui sont très fréquentes (elles apparaissent au moins 5 fois dans notre corpus) et la prépondérance des hapax au Nord.

Graphique n° 1 : Distribution des verlanisations Graphique n° 2 : L'emploi des verlanisations - classes faites sur la base de la fréquence

350 100% 300 90% 26% 84 80% 48% 250 70% plus que plus que 5 60% 5 200 43% 50% 137 17% 150 hapax 40% hapax 30% 100 20% 31% 35% 10% 50 97 29 10 0% 0 21 Nord Sud Nord Sud

Il est également possible, à l’aide de cette fonctionalité (Concordances), de regarder la distribution d’une verlanisation particulière. Nous choisissons au hasard quelques exemples de verlanisations qui sont très fréquentes :

41

meuf : Partie : nord, Nombre de contextes : 19 Partie : sud, Nombre de contextes : 8 caillera, cailleras, cailles-ra : Partie : nord, Nombre de contextes : 7 Partie : sud, Nombre de contextes : 5 zik, ZIK, zic, zique : Partie : nord, Nombre de contextes : 9 Partie : sud, Nombre de contextes : 16

Ces résultats accompagnent les graphiques précédents et montrent que si nous rélativisons le nombre total des verlanisations, nous obtiendrons que les mots verlanisés très fréquents dans notre corpus sont beaucoup employés, dans certains cas même plus nombreux, chez les locuteurs du Sud.

Le seul problème qui se pose est la non-lemmatisation de notre corpus et la non- unification des formes graphiques des verlanisations qui rendent les résultats discutables. Lexico ne permet pas de faire les « mini groupes de formes » au sein d’un groupe de formes ce qui serait très utile dans ce type d’analyse. Il ne nous reste qu’à enlever manuellement de la liste des concordances (ce qui n’est pas possible directement dans Lexico mais dans le fichier exporté) des « quasi hapax » qui ne sont que de différentes formes graphiques de verlanisations. Nous recomptons des résultats et nous obtenons que le nombre d’hapax est de 90 dans le Nord contre 4 dans le Sud (tin-ma, verlan, yébis, yégri). Sur le graphique suivant (graphique n°3) nous voyons d’assez grands changements dans les proportions. Il faut surtout noter que les hapax ne forment plus la partie dominante chez les locuteurs du Nord, mais qu’ils restent malgré tout très nombreux et suremployés par rapport au Sud.

42

Graphique n° 3 : L'emploi des verlanisations - classes faites sur la base de la fréquence (hapax recompté)

100% 26% 80% 48% plus que 5 28% 60% hapax 7% 40% fréquence entre 2 et 45% 45% 20% 4

0% Nord Sud

La fonctionalité Concordances a aussi un inconvénient, car elle n’offre pas de combinaison des paramètres. Il serait pratique de pouvoir afficher les verlanisations selon la provenance géographique et le locuteur en même temps ; pour cette raison nous avons dû ajouter l’information sur le lieu dans le code même (ex. N_LSP110).

3.2.2 Distribution et spécificités des verlanisations selon les locuteurs

Pour examiner la distribution des verlanisations selon les locuteurs, nous allons regarder d’une part les concordances, et d’autre part nous nous servirons de la fonctionalité de Lexico 3 nommée Partitions, où nous pouvons visualiser la distribution des unités dans le corpus sous forme d’un graphique. Elle nous permet d’observer également les « Spécificités ».

Notre corpus comporte 46 locuteurs qui emploient au moins une verlanisation. Nous avons dressé un tableau (tableau n°2) avec les locuteurs chez qui nous trouvons plus que 10 verlanisations avec le plus grand nombre chez Booba (50 occurrences). La plupart d’entre eux vient du Nord de la France sauf Faf Larage (S_FAF) qui est le seul représentant des locuteurs du Sud avec un nombre élevé de verlanisations. Lexico 3 ne facilite pas l’affichage des locuteurs qui n’utilisent pas de verlanisations.

110 Nord_Les Sages Poètes De La Rue 43

Tableau n° 2 : Locuteurs qui emploient plus que 10 verlanisations

Locuteurs qui emploient plus que 10 verlanisations Nombre de Partie contextes N_ALI 19 N_BOO 50 N_DIA 30 N_DLP 29 N_FLY 16 N_KND 12 N_LIM 24 N_LSP 11 N_RIM 17 N_SEF 22 N_SIN 11 N_SNI 16 S_FAF 26

Quant à la visualisation de la distribution, elle peut être affichée en fréquence absolues, où nous voyons le nombre réel d’occurrences dans chaque partie du corpus, en fréquences relatives, où le nombre d’occurrences est rapporté à la longueur de la partie, ou bien en visualisant les spécificités. Cette dernière visualisation nous fournit des résultats d’un calcul statistique qui montrent clairement sous forme d’un graphique l’indice de spécificité calculé pour une unité lexicale ou pour un ensemble d’unités choisies (dans notre cas nous avons choisi l’ensemble des verlanisations par glissement d’un groupe de forme dans le graphique) dont la fréquence est supérieure à 10, et où le seuil de probabilité est fixé à 5% par rapport à chaque partie, et par rapport à l’ensemble de corpus.

Il est impossible de choisir la fréquence minimale inférieure à 10 comme nous pouvons le faire en procédant par « Statistiques par partie »  « Spécificités » ; en revanche, quand nous procédons par ce dernier cheminement, nous n’obtenons pas de graphique, mais une liste des unités lexicales sans pouvoir choisir un groupe de forme concret que nous voulons étudier. Il serait plus pratique pour notre analyse de pouvoir choisir la fréquence, vu que le nombre de verlanisations n’est pas très élevé, et que dans seulement 13 parties sur 102 (loc_feat) apparaissent plus que 10 verlanisations (cf. tableau n°2).

44

L’image n°14 montre les spécificités des verlanisations de notre corpus. Il n’est guère visible sur cette image « non-zoomée » à quelle partie se rapportent les spécificités. Seulement, en rapprochant le graphique, nous pouvons observer ce qui se passe exactement. Nous voyons une forte spécificité de la partie N_BOO111(+18) et une légèrement moins forte spécificité des parties : N_HIF112 (+3), N_KND (+3), N_LIM (+10), N_MES113 (+4), N_MVL114 (+3), N_NES115 (+3), N_RIM116 (+4), N_RIM_N_KER117 (+6), N_SEF118 (+4), N_SNI119 (+4) . Si nous voulons intérpréter la spécificité, il faut retourner aux textes, ce que Lexico permet en traversant par les « Concordances », où nous choisissons la visualisation par parties loc_feat, et nous glissons le groupe de forme des verlanisations. Cela serait plus pratique si Lexico offrait tout de suite le retour au texte et au tableau des spécificités pour que nous voyions pourquoi la spécificité est aussi élevée, sans devoir utiliser les autres fonctionnalités.

La différence entre le Nord et le Sud est bien visible déjà à partir de cette image, où les spécificités des auteurs du Nord (tous les auteurs qui ont « N » au début du code) sont positives et celles des auteurs du Sud sont négatives. La spécificité négative (-3) de N_MCS, qui apparaît parmi les chanteurs du Nord, nous surprend.

Lorsque nous nous penchons sur les concordances selon les locuteurs, il est évident que l’indice de la spécificité est élevé, surtout si un chanteur suremploie des verlanisations, ou bien s’il apporte une verlanisation que n’utilisent pas les autres. De plus, la plupart des chanteurs qui ont la spécificité élevée, intervient dans les chansons en tant que « featuring ». Étant donné que la taille des énoncés est très petite chez les chanteurs « featuring », la spécificité marque aussi le suremploi des verlanisations par rapport à la taille.

111 Booba 112 Hifi (featuring) 113 Mascon Escobar (featuring) 114 Movez Lang (featuring) 115 Nessbeal (featuring) 116 Rim-K 117 Rim-K et Kery James (featuring) 118 Sefyu 119 Sniper (groupe) 45

Image n° 14 : Les spécificités des verlanisations selon les locuteurs

En ce qui concerne Booba et sa spécificité la plus élevée (+18), cela est dû à un grand nombre de verlanisations (50 occurrences). En examinant les graphiques des fréquences et des spécificités pour chaque mot verlanisé, nous voyons que parmi les verlanisations employées par Booba, apparait un nombre considérable de verlanisations que n’utilisent pas les autres rappeurs (au moins de cette forme) : cro-ma, phonetel, meusseu, mané-ci, béflan, téij, zeb, zness, tier-kar (cette forme), ke-skon, teuf (au sg), lé- par, bé-bar (cette forme x be-bar), brelic, reurti (cette forme), pe-sou, fe-shnou, àl, beurre, vêt-sur, k’unfry, péra (cette forme x pera, pe-ra), gout-dé, bouldé, beuj.

La spécificité de la partie des chansons de Rim K porte sur l’emploi de son nom dans ses énoncés et dans les mots beur (6 fois), revé, reum, barjots et rabzouz qui ne sont pas pareillement employés chez d’autres. De même, dans la partie avec featuring de Kery James, nous trouvons l’emploi de Rim-K et de ler-ga qui, avec le fait qu’il s’agit d’une petite partie, marquent une forte spécificité.

Quant à la spécificité +6 de la partie de LIM, il s’agit d’un même phénomène que nous trouvons chez Booba, puisque les verlanisations tels que : reur-ti, vile(s)-ci, zar-bi,

46

zness-bi, ous, ient(s)-cli, llets-bi, squeud (cette forme x skeud), teshmi, tierquart (forme sans tiret), rotte-ca, reur-ti n’aparaissent que chez lui.

En observant la situation du Sud, il faut constater qu’elle est complétement différente. Tout d’abord, les énoncés du Sud contiennent en général beaucoup moins de verlanisations comme nous avons pu le voir dans le chapitre précédent. Nous n’y trouvons pas de chanteurs « featuring » avec une spécificité marquante qui étaient assez nombreux dans le cas du Nord. Il s’agit des énoncés des représentants principaux de la scène musicale du Sud dont la spécificité négative marque surtout le sous-emploi de verlanisations par rapport aux autres parties.

Voici les parties avec une grande spécificité négative : S_FFA120 (-8), S_IAM (-8), S_KEN121 (-10), S_PSY122 (-6), S_SOP123 (-8). Le retour aux textes permet de voir que la Fonky Family utilise les deux formes zic et zik pour désigner la musique, et en examinant la spécificité de ces deux variantes graphiques, nous obtenons que seulement la forme zic est celle qui n’apparaît pas chez autres chanteurs et qui, avec le mot verlanisé beurs, crée une forte spécificité positive chez ce groupe. Le fait d’avoir seulement deux mots qui marquent une grande spécificité positive, et de n’avoir employé que cinq verlanisations dans ses énoncés, provoque finalement la spécificité négative.

Les énoncés du groupe IAM ne contiennent pas de verlanisations du tout, tout comme ceux de Soprano. Même si nous trouvons dans notre corpus d’autres parties où manquent des verlanisations, dans le cas de IAM et Soprano, la forte spécificité négative marque notamment le sous-emploi par rapport à la taille de ces deux parties. Plus la partie est grande, plus nous attendons l’apparition d’une verlanisation.

Quant à Keny Arkana, elle emploie peu de verlanisations (zik et scred) par rapport aux autres (d’où la spécificité négative). Même la spécificité des deux verlanisations qu’elle emploie est plus grande chez d’autres rappeurs. Malgré la grande spécificité positive des mots zik et beur chez Psy 4 De La Rime, dans l’ensemble, ils sous-emploient les verlanisations par rapport à la taille des textes des autres interprètes. La spécificité est donc négative dans les chiffres.

120 Fonky Family (groupe) 121 Keny Arkana 122 Psy 4 De La Rime (groupe) 123 Soprano 47

Nous examinons également les énoncés des auteurs avec une spécificité un peu moins élevée. En ce qui concerne la partie S_AKH124 (-4), nous y trouvons les verlanisations suivantes: keufs, barge, vénèrent, rebeu, renoi. Il s’agit d’une part des verlanisations très fréquentes, d’autre part son nombre est très petit par rapport à la taille de cette partie. La partie S_DON125 (-3) ne contient qu’un mot verlanisé (barges) aussi bien que S_FAY126 (-4), (verlan.). Le mot verlan apporte une grande spécificité à Fayçal parce qu’il n’apparaît que chez lui, mais étant donné que c’est la seule verlanisation qu’il a utilisée, son emploi de verlanisations est caractérisé par une spécificité négative.

Le cas particulier des énoncés de N_MSC127 (-3) qui, quoiqu’ils fassent partie du subcorpus Nord sont caractérisés par une spécificité négative, est effectivement très proche des caractéristiques des parties du Sud. MC Solaar emploie seulement trois mots verlanisés : meufs, pécho et ap dont l’emploi est plus significatif chez autres chanteurs que chez lui. Quant à la partie X_JBR128 (+3), elle est marquée par la verlanisation tess qui apparaît encore chez Diam’s. Étant donné qu’il s’agit d’une petite partie, l’emploi d’une seule verlanisation crée déjà une spécificité positive.

Pour résumer, il est apparent que les valeurs positives signifient le suremploi des verlanisations en général ou d’une verlanisation concrète et souvent aussi l’apparition d’une verlanisation que n’utilisent pas les autres. En revanche, les valeurs négatives marquent le sous-emploi par rapport aux autres et par rapport à la taille des textes. En même temps, les verlanisations employées par les chanteurs du Sud peuvent être caractérisées par une certaine « neutralité », c’est-à-dire que les verlanisations utilisées sont employées aussi par les autres, chez qui elles peuvent être même plus représentatives (le cas de MC Solaar).

3.2.3 Distribution des différents types de verlanisations

Pour pouvoir étudier la distribution des types de verlanisations (dont le classement est présenté dans la partie théorique), nous avons trié les verlanisations de notre corpus et nous les avons réparties en trois groupes (lexicalisées, semi-lexicalisées, non-lexicalisées). Étant donné qu’à ce moment-là nous ne travaillons pas avec des lemmes, il faut prendre en

124 Akhenaton 125 Don Choa 126 Fayçal 127 MC Solaar 128 Jacky Brown 48

compte tout de même les variantes graphiques. Dans les cas où le mot apparaît sous différentes formes (soit variante au pluriel soit une autre variante graphique), nous consultons les tableaux de Sekaninová129 pour les classer. Ainsi, nous obtenons trois groupes inégaux :

Tableau n° 3 : Les statistiques de verlanisations selon le type

nombre relatif nombre relatif nombre d'occurrences d'occurrences nombre de d'occurrences (100%=toutes (100%=type de variantes total les verlanisation) graphiques verlanisations)

Nord Sud Nord Sud Nord Sud 71 19% verlanisations lexicalisées 25 70% 30% 50 21 16% 35% 251 66% verlanisations semi-lexicalisées 128 85% 15% 213 38 67% 63% 56 15% verlanisations non-lexicalisées 49 98% 2% 55 1 17% 2% 378 ensemble des verlanisations 202 100% 84% 16% 318 60

Ce tableau nous sert de base aux graphiques n°4, n°5 et n°6. Une fois le classement fini, ces regroupements peuvent être utilisés pour la création des groupes de formes dans Lexico 3. Ensuite, nous essayons de voir si notre hypothèse selon laquelle les verlanisations lexicalisées vont être plus fréquentes chez les chanteurs du Nord s’avère comme confirmée.

Partant du choix de la partition : « lieu », nous avons fait glisser le groupe de formes des verlanisations lexicalisées vers l’outil « Concordances ». Ces verlanisations apparaissent dans 50 contextes chez les chanteurs provenant du Nord, et dans 21 contextes chez les rappeurs du Sud. L’emploi des verlanisations lexicalisées est plus pertinent chez les locuteurs du Nord, ce qui relève d’ailleurs du fait que 84% de l’ensemble des verlanisations apparaît chez les rappeurs du Nord. La différence n’est pas pourtant aussi grande que dans le cas des autres types de verlanisations, surtout en comparaison avec la situation de la distribution des verlanisations non-lexicalisées. Voici le graphique n°4, basé

129 T. SEKANINOVÁ (2012). Stéréotypes liés au verlan…, op. cit., p. 146-150. 49

sur le tableau n°3, qui démontre en chiffres relatifs le nombre d’occurrences des types de verlanisations selon la provenance des rappeurs.

Graphique n° 4 : Le nombre d’occurrences des types de verlanisations selon la provenance des rappeurs (100%=nombre d’occurrences)

100%

90%

80%

70% 70% 60% 85% 84% verlanisations utilisées par les 98% 50% rappeurs du Nord 40% verlanisations utilisées par les rappeurs du Sud 30%

20% 30% 10% 15% 16% 0% 2% items items semi- items non- TOTAL lexicalisées lexicalisées lexicalisées

Trente pourcent d’occurrences des verlanisations lexicalisées se trouvent dans les énoncés des rappeurs du Sud, ce qui est assez élevé par rapport à l’ensemble des verlanisations. En revanche, seulement 2% des verlanisations non-lexicalisées est prononcé par les locuteurs du Sud. Cette répartition pourrait se référer à une grande volonté qu'ont les rappeurs du Nord de recourir au verlan en tant que procédé créatif favori. Ceci concorde donc avec la thèse selon laquelle le verlan n’est pas un mode de formation typique du Sud. Ce résultat soutient néanmoins aussi l’idée de la lexicalisation, puisque les mots déjà insérés dans le lexique commun se trouvent plus fréquemment dans les énoncés du Sud. Quant à l’emploi des verlanisations semi-lexicalisées, il correspond à l’emploi général de l’ensemble des verlanisations.

50

Nous nous sommes intéressée non seulement à la distribution géographique de chaque type de verlanisation, mais aussi à la répartition globale des différents types de verlanisations dans les deux régions (voici les graphiques n°5 et n°6). Il est évident que le type le plus répandu est la verlanisation semi-lexicalisée dans les deux espaces. Peut-on donc considérer les verlanisations semi-lexicalisées comme des mots à caractère identitaire ? Étant donné que les connotations des mots lexicalisés s’effacent avec leur usage massif, ne pouvons-nous pas donc voir dans la volonté d’un emploi considérable des verlanisations semi-lexicalisées dans le rap un essai de différenciation, de faire voir l’appartenance à un milieu socio-culturel ?

Graphique n° 5 : La répartition des types de Graphique n° 6 : La répartition des types de verlanisations au Sud verlanisations au Nord

Sud Nord nombre d'occurrences (100%) = 60 nombre d'occurrences (100%) = 318

17% 16% 2% 35%

63% 67% verlanisations lexicalisées verlanisations semi-lexicalisées verlanisations non-lexicalisées

La différence d’emploi de différents types de verlanisations repose surtout dans l’emploi des verlanisations lexicalisées qui sont, au Sud, employées deux fois plus fréquemment qu’au Nord. Ceci est fait au détriment de l’emploi des verlanisations non- lexicalisées, qui apparaissent sensiblement plus souvent au Nord. Ainsi pensons-nous démontrer que lorsque les rappeurs du Sud utilisent le verlan, ils recourent plutôt à des verlanisations semi-lexicalisées et lexicalisées et non à la formation de nouvelles verlanisations. Nous pouvons donc supposer que le phénomène de la verlanisation est, dans le milieu du Sud de la France, un emprunt auquel les rappeurs recourent parce que, justement, ils revendiquent leur appartenance identitaire.

51

Pour compléter cette analyse, nous avons visualisé les spécificités des différents types de verlanisations dans un seul graphique. Le-voici sur l’image n°15.

Image n° 15 : Spécificités des types de verlanisations selon le lieu (Lexico 3)

Nous pouvons observer une nette différence entre le Nord et le Sud. À cela s’ajoute une visualisation claire d’inégalité des types de verlanisations où les dimensions des colonnes reflètent le nombre de verlanisations (dans notre corpus, nous avons la plus grande représentation des verlanisations semi-lexicalisées, suivi par les verlanisations non- lexicalisées). Les dimensions des colonnes ne montrent donc pas cet abîme entre le nombre de contextes au Nord et au Sud (sans quoi la colonne la plus grande serait celle représentant les verlanisations non-lexicalisées).

Nous étudions aussi la distribution de types de verlanisations selon l’année de sortie, parce qu’une possible évolution diachronique nous intéresse. L’image n°16 montre les résultats fournis par Lexico 3. L’année avec la spécificité la plus marquante est 2004. Si nous regardons quels albums sont sorti cette année, il ne nous surprendra pas qu’il s’agisse d’albums des rappeurs chez qui on trouve un nombre de verlanisations parmi les plus élevés (2004 : sortie de l’album de Booba (Nord) : 50 contextes et de Rim-K (Nord) : 17 contextes). En regardant les deux rappeurs de plus près, il importe de préciser que Booba

52

est le maître du verlan non-lexicalisé ce qui prouve le nombre d’occurrences de ce type de verlanisations : 12 contextes. En comparaison avec d’autres contextes les plus pertinents de ce type de verlanisation : 8 occurrences chez LIM, 5 occurrences chez Sniper ou 4 occurrences (Les Sages Poètes de la Rue, Rim-K), Booba paraît le plus créatif. L’année 2004 représente donc une rupture par rapport aux années précédentes, ce qui est très bien visible également sur le graphique n°7 ci-dessous.

Quant à d’autres années, l’année 2006 fut productive : beaucoup d’albums de notre corpus sont sortis cette année-là. Ainsi citons les albums de Keny Arkana (Sud), de la Fonky Family (Sud), d’Akhenaton (Sud), qui contiennent seulement un petit nombre de verlanisations, et les albums de Sniper (Nord), de Sinik (Nord) et de Diam’s (Nord) qui, en revanche, comportent un nombre significatif de verlanisations. La spécificité repose donc sur le fait qu’en 2004 le nombre de verlanisations a été très élevé par rapport à la taille de la partition, alors qu’en 2006 par rapport à la taille de cette partie (elle contient 6 albums), le nombre de verlanisations est considérablement plus petit (2 albums : 83 verlanisations contre 6 albums : 75 verlanisations). Enfin, l’année 2011 porte une spécificité importante puisqu’il n’y a que 2 occurrences des verlanisations cette année-là, il s’agit des mots scred et zik dans l’album de Keny Arkana (Sud) et par conséquent la spécificité porte sur le sous- emploi du verlan comparé aux années précédentes.

Cette visualisation (l’image n°16) apporte aussi une autre information importante ; les spécificités sont dans la plupart des cas représentées surtout par les verlanisations semi- lexicalisées. Il apparaît qu’en 2004, 2005 et 2008, ce type de verlanisations est sensiblement suremployé par rapport aux autres.

53

Image n° 16 : Spécificités des types de verlanisations selon l’année de sortie des albums

Pour démontrer l’évolution de nombre de contextes des verlanisations selon les années de sortie des albums, et pour expliquer d’une certaine façon les spécificités, nous créons un graphique à partir des chiffres obtenus par Lexico 3 (voici le graphique n°7). Le nombre de contextes ne suffit pas néanmoins pour une évaluation objective, car nous ne disposons pas de corpus équilibré au niveau des tailles des partitions par année de sortie des albums, et nous ne pouvons donc pas affirmer par exemple que la tendence à employer les verlanisations a atteint le sommet entre les années 2004 et 2008 et que petit à petit, nous avons affaire à une diminution d’emploi de ce phénomène. Cela nous mène à travailler avec la moyenne (qui rendra le résultat un peu plus exacte) et à ajouter ainsi une autre courbe qui traduit mieux la tendance diachronique. Déjà, nous voyons que l’année 2006 a été témoin d’une baisse d’emploi des verlanisations (en prenant en considération la taille de partition). Cela correspond donc effectivement à la visualisation des spécificités (de l’image n°16). À chaque fois que l’on connaît une rupture importante dans l’emploi de verlanisations, cela apporte une grande spécificité. L’orientation des spécificités (chiffres positifs ou négatifs) correspond donc à la baisse ou à l’augmentation du nombre d’occurrences des verlanisations. Il semble que les spécificités prennent en considération la taille du corpus et des partitions.

54

Il nous paraît intéressant d’observer également séparément les tendances dans les deux espaces. Or, nous rencontrons une difficulté, car Lexico 3 ne permet pas d’obtenir le nombre d’occurrences en combinant deux types de partitions. Il faudrait retravailler l’apparence des balises de notre corpus, où l’on mettrait l’information de la provenance géographique même dans la balise portant l’information de la sortie de l’album.

Nous essayons d’observer également la distribution des trois types de verlanisations selon les locuteurs (dans ce cas-là nous ne heurtons pas au problème de l’impossibilité de combiner deux types de partitions parce que la provenance géographique est incluse dans la forme de la balise des locuteurs), mais Lexico 3 ne visualise pas bien le résultat (voir l’image n°17). Les spécificités ne sont pas affichées en couleurs ni après le zoom, probablement faute d’un très grand nombre de locuteurs et de la tentative de visualiser trois groupes de formes à la fois.

Graphique n° 7 : Nombre de contextes de verlanisations selon la sortie des albums

100

90 88 83 80 75 70 63 60 nombre de 50 contextes des verlanisations 40 41,5 moyenne 30

20 20 21,0 2222,0 13 10 1212,0 10,7 10,4 6,7 6,5 0 00,0 22,0 2001 2002 2003 2004 2005 2006 2007 2008 2009 2011

55

Image n° 17 : Distribution des types de verlanisations selon les locuteurs

Pour conclure ce chapitre, nous avons confirmé notre hypothèse : le nombre de verlanisations lexicalisées est effectivement plus élevé chez les locuteurs du Nord. Or, la différence entre le nombre de contextes est beaucoup plus marquante dans le cas des verlanisations non-lexicalisées. Ainsi pouvons-nous considérer que les rappeurs du Nord, en comparaison avec le Sud, aiment particulièrement ce procédé créatif de formation de nouveaux mots, et par conséquent, nous pouvons confirmer que le verlan est un phénomène typique plutôt pour le Nord de la France, plus précisément pour la région parisienne. En même temps, nous voyons que les verlanisations lexicalisées sont diffusées et plus insérées (par rapport aux autres types) dans la langue, ce qui prouve le fait qu’ils apparaissent en un plus grand nombre (que d’autres types des verlanisations) chez les locuteurs du Sud. Quant aux verlanisations semi-lexicalisées, il semble que ce type de verlanisation est porteur de la fonction identitaire. Il nous apparaît que ces résultats prouvent aussi que le phénomène de la verlanisation est un emprunt intralinguistique du lexique tout fait que les rappeurs du Sud utilisent pour s’identifier à la communauté du rap.

56

3.2.4 Distribution géographique des verlanisations selon le mode de création

Consacrons-nous à présent à la vérification de la troisième hypothèse principale selon laquelle la formation de verlanisations au Nord est plus complexe, combinant davantage de différents procédés (apocope, aphérèse, chute d’un phonème etc.) alors qu’au Sud il s’agira surtout de verlans crées par une simple permutation. Pour cet effet, nous avons dû classer les verlanisations selon les procédés morphologiques de formation dont l’aperçu était présenté dans la partie théorique. Avant d’observer le lien entre le type de création et le lieu, voici, sur le graphique n°8, la statistique des modes de création des verlanisations selon les types de verlanisations.

Graphique n° 8 : Modes de formation des verlanisations selon les types de verlanisations

0% noms propres 2% 0% 20% plusieurs procédés 5% 4% 4% VERL+RED 0% 0% 0% APO+VERL 0% 2% 0% lexicalisées APH+VERL 2% 2% semi-lexicalisées 4% non-lexicalisées VERL+chute 5% 4% 0% VERL+VERL 1% 0% 32% VERL+APO 29% 12% 40% VERL 57% 76%

0% 20% 40% 60% 80%

Sur le premier regard, nous pouvons affirmer que les verlanisations lexicalisées sont le seul type qui a un aussi grand pourcentage (20%) de verlanisations créees par plusieurs procédés. Il s’agit nottament de mots comme beur, rebeu etc. À part le procédé classique – la simple permutation de syllabes, le deuxième mode de formation très fréquent est le verlan auquel s’ajoute une apocope. Ainsi sont créées 32% de verlanisations lexicalisées et 29% de verlanisations semi-lexicalisées. Cette classe rassemble des mots comme : caille,

57

meuf, keuf, brolic, barge etc. En même temps, il apparaît que parmi les verlanisations lexicalisées, nous ne trouvons pas un nombre extrêmement elevé de celles qui n’ont été créées que par permutation. Seulement 40% des verlanisations lexicalisées contre 76% des non-lexicalisées sont créées de cette manière. Il s’avère que pendant le procès d’insertion des verlanisations dans le lexique commun, pendant la lexicalisation, les mots subissent d’autres changements, le plus souvent une apocope.

Pour qu’on puisse observer les corrélations entre le mode de création et le lieu d’occurrence de la verlanisation, nous avons dressé des groupes de formes qu’on a ensuite importés dans Lexico 3. Les spécificités ne montrent pas grande chose. En effet, elles démontrent clairement la différence entre le Nord et le Sud mais à peu près de la même façon que lorsqu’on visualise la distribution des verlanisations en général, ou la distribution des types de verlanisations. Nous optons donc pour la fonctionnalité Concordances pour voir la fréquence d’occurrences selon la provenance du locuteur. Nous avons dressé un tableau avec le nombre d’occurrences pour chaque mode de formation et nous avons fait manuellement un graphique à partir de ces chiffres.

Graphique n° 9 : Nombre d'occurrences des verlanisations selon le mode de formation

70% 67%

VERL 60% VERL+APO 50% 48% VERL+VERL 40% 40% VERL+chute

APH+VERL 30% 25% APO+VERL 20% VERL+RED 10% 7% 7% 2% 0% 1% 1% 1% 0% 2% 0% 0% 0% 0% Nord Sud

Étant donné qu’au Sud, le type de verlanisation le plus fréquent était les verlanisations semi-lexicalisées (63%) et lexicalisées (35%) et vu que parmi ces verlanisations nous trouvons un nombre très élevé des mots en verlan crées avec une apocope, il ne nous surprend pas que ce type de formation soit aussi élevé au Sud. De

58

même pour les modes de création les plus élevés au Nord. Si nous revenons au graphique n°5, nous voyons qu’au Nord s’opère une prédominance des verlanisations semi- lexicalisées (67%) qui sont dans 57% des cas créées par simple permutation, et dans 29% on y ajoute encore une apocope. Par conséquant, au Nord nous avons affaire, logiquement, à de plus grands nombres de ces deux types de formation. Il est intéressant de noter que la formation par plusieurs procédés est aussi élevée au Nord qu’au Sud. En outre, nous pouvons constater que le Nord est plus riche en types de formation, car y apparaît également le verlan avec la chute d’un phonème (foncedé), l’aphérèse suivie du verlan (cainri), l’apocope suivi du verlan (cro-mi) ou le verlan suivi d’un redoublement (roro) qui ne figurent pas dans l’ensemble d’occurrences des verlanisations de Sud.

À présent, nous essayons d’observer seulement la classe des verlanisations non- lexicalisées pour visualiser les tendances dans la formation des verlanisations les plus récentes et les moins insérées dans la langue. Nous avons déjà vu que 76% des verlanisations non-lexicalisées de notre corpus étaint créées par une simple permutation et 12% par le verlan suivi d’une apocope (voir graphique n°8). Si nous regardons ce type de verlanisations encore de plus près, surtout en se focalisant sur la distribution géographique, il est frappant que la création de nouvelles verlanisations est le domaine exclusivement des rappeurs du Nord (voir le graphique n°10). Il n’y a qu’une seule occurrence de la verlanisation non-lexicalisée dans les énoncés des rappeurs du Sud de la France. En ce qui concerne les verlanisations du Nord, 68% (36 occurrences) sont créées de manière classique, par une seule permutation des syllabes et 19% (10 occurrences) sont créées en plus avec une apocope.

Graphique n° 10 : Distribution des verlanisations non-lexicalisées en distinguant leur mode de création (chiffres absolus)

40 36 35 30 VERL 25 VERL+APO 20 VERL+chute 15 APH+VERL 10 10 APO+VERL 5 2 2 2 plusieurs procédés 1 1 0 0 0 0 0 0 Nord Sud

59

En somme, la majorité des verlanisations est créée par une permutation de syllabes, ou alors cette permutation est suivie par l’apocope (comme le démontre le graphique récapitulatif n°11). Quant aux autres procédés de formation, ils sont plutôt marginaux. En ce qui concerne la distribution, au Sud, 76% de verlanisations étaient créées par une apocope alors qu’au Nord on voit la prédominance de la simple verlanisation, ce qui est visible notamment sur la distribution des verlanisations non-lexicalisées.

Graphique n° 11 : Aperçu récapitulatif de modes de formation des verlanisations du corpus

70% 60% 60%

50% VERL

40% VERL+APO VERL+VERL 30% 25% VERL+chute 20% APH+VERL 10% 4% 6% 0% 1% 0% 0% APO+VERL 0% VERL+RED plusieurs procédés

3.2.5 Analyse factorielle des correspondances (AFC) des verlanisations

Avec la possibilité de visualiser dans l’AFC de TextObserver les listes thématiques importées, il nous paraît intéressant de regarder l’emplacement des verlanisations dans l’AFC. Dans l’attente que les verlanisations puissent peut-être apporter une spécificité considérable à certaines parties, nous importons les listes thématiques et nous les affichons avec un marquage. Néanmoins, comme les images n°18, n°19 et n°20 montrent, presque toutes les verlanisations sont regroupées autour du centre de graphique et donc elles ne représentent pas un facteur majeur de la spécificité. Faute de visualisation non-réussie de TextObserver, nous reconnaissons à peine de quels mots il s’agit. Même après le zoom, la lecture reste toute de même problématique à cause d’accompagnement des caractères indéchiffrables (voir l’image n°21).

60

Image n° 18 : AFC des verlanisations dans Textobserver

Image n° 19 : Zoom d’AFC des verlanisations dans TO Image n° 20 : Zoom d’AFC des verlanisations dans TO

61

Image n° 21 : AFC des verlanisations dans TO – Zoom de la verlanisation éloignée du centre

Une seule verlanisation est un peu éloignée du centre, voici l’image n°20 ou l’image n°21 sur laquelle est la verlanisation encore plus zoomée. Il s’agit du mot meufs qui se situe près de locuteur N_TPA130. Or, ce chanteur (featuring) ne prononce pas ce mot et donc, on ne voit aucun lien direct entre cette verlanisation et ce « point colonne ». La variante au pluriel du mot meuf est présente 13 fois dans notre corpus. Dans la plupart des cas elle est prononcée par les locuteurs du Nord, qui, quant à eux, ne sont pas éloignés du centre du graphique. Lorsque nous regardons les concordances, une seule chose nous frappe : la verlanisation meufs est en majorité précédée par l’article défini les tandis que par exemple sa variante au singulier est précédée par les pronoms possessifs (voir l’image n°22 et n°23). À part ce contexte, nous ne voyons pas d’autres traits qui pourraient causer cet éloignement.

Image n° 22 : Concordances meufs Image n° 23 : Concordances meuf

La fonctionalité de TextObserver, permettant d’afficher dans l’AFC les listes thématiques préalablement constituées, est très pratique car cet outil nous aide à imaginer le positionnement des mots définis. Par conséquant, cela nous donne une idée de la particularité ou de l’ordinaire des mots choisis de notre corpus. Les verlanisations ne sont

130 Tepa, rappeur featuring dans la chanson Les gangsters boivent à l’œil de l’album Après l’Orage de Les Sages Poètes De La Rue. 62

donc pas apparemment un phénomène très particulier dans l’ensemble de notre corpus (presque toutes sont regroupées autour du centre de graphique). Néanmoins, il se peut que ceci soit causé par la présence des mots anglais, qui, en majorité, causent l’éloignement des partitions les plus marquées et donc il est possible que si les anglicismes ne faisaient pas partie de notre corpus, les verlanisations seraient beaucoup plus marquées et plus étendues.

3.2.6 Comparaison des AFC des partitions loc_feat, loc_feat_membregroupe et locuteur1

Puisque nous avons croisé un problème lors de la préparation de notre corpus concernant la nécessité de balisage des locuteurs featurings et par conséquent aussi la distinction et le balisage des paroles des chanteurs au sein du même groupe, nous avons décidé d’examiner les AFC des trois partitions possibles. Pour cet effet nous avons émis deux hypothèses dont la vérification nous aiderait à la meilleure constitution de futurs corpus. En outre, cela pourrait également rendre l’élaboration de RapCor plus efficace. Premièrement, nous supposons qu’il y a une grande différence entre le corpus avec les featurings marqués et celui sans cette distinction. Deuxièmement, nous pensons que la distinction entre les chanteurs du même groupe n’est pas pertinente car ils partagent à peu près le même langage. Nous allons donc examiner cette différence en comparant les visualisations des AFC.

Premièrement, nous allons comparer les AFC des partitions locuteur1 et loc_feat. La partition loc_feat distingue, comme on l’a décrit dans la partie théorique, les locuteurs et les chanteurs featurings. Autrement dit, lorsqu’on choisit la partition loc_feat, les paroles se rassemblent sous le nom de chanteur peu importe s’il s’agit de rappeur – auteur de la chanson ou s’il est seulement rappeur intervenant. Ainsi par exemple les paroles featurings de Vitaa chez Sinik ou Diam’s seront regroupés et recevront « l’étiquette » Vitaa. De même les paroles que Psy 4 de la Rime prononcent dans la chanson d’Akhenaton Vu de la cage seront classés sous S_PSY et non sous S_AKH comme le sera si nous choissons la partition locuteur1. Les images n°24 et n°26 montrent les AFC de ces deux partitions. Il est évident, que les AFC diffèrent considérablement et donc que la distinction des featurings change radicalement l’aperçu du corpus et les relations entre les parties. Par conséquant, nous pouvons affirmer qu’il importe de faire cette distinction pendant l’élaboration du corpus.

63

Deuxièmement, nous allons comparer la partition loc_feat avec loc_feat_membregroupe qui, en plus des featurings, diffère selon quel rappeur du groupe parle. Ceci était distingué nottament parce qu’il existe des rappeurs qui faisaient partie d’un groupe et qui chantaient également solo (par exemple Akhenaton ou Soprano). Cette distinction donc permettrait hypothétiquement d’observer une éventuelle évolution du lexique de l’interprète. En comparant les images n°24 et n°25, nous voyons que les AFC paraissent identiques. Cependant, nous utilisons encore les AFC 3D de TextObserver pour vérifier cette conformité. Image n° 24 : AFC de partition loc_feat

Image n° 25 : AFC de partition loc_feat_membregroupe

64

Image n° 26 : AFC de partition locuteur1

Après avoir visualisé les AFC 3D, nous devons constater que la conformité apparente est inexacte et que la visualisation de Lexico 3 peut mener à des conclusions imprécises à cause d’incapabilité de plasticité de visualisation et des graphiques uniquement bi-dimensionels. La différence des partitions porte nottament sur l’emplacement de petites parties (comme N_DIA_X_JBR ou ND qui sont placées en devant du graphique (n°27) lorsqu’on distingue les membres des groupes. En revanche, sur l’image n°28, ces petites parties sont au fond du graphique.

65

Image n° 27 : AFC 3D de partition loc_feat_membregroupe

Image n° 28 : AFC 3D de la partition loc_feat

66

Pour résumer, les AFC ont, en effet, montré qu’il importe de distinguer les rappeurs featurings. En ce qui concerne la nécessité de distinguer les membres des groupes, même si cette distinction paraît négligeable selon Lexico 3, TextObserver montre cependant que cela apporte certains changements dans les AFC. Il s’avère donc utile de distinguer et de baliser également les parties prononcées par les différents membres des groupes pour avoir la possibilité de travailler avec ces légers changements.

67

4 EN GUISE DE CONCLUSION : BILAN STATISTIQUE

Afin de pouvoir passer à la conclusion même, résumons les principaux résultats statistiques de notre recherche. Dans notre corpus, nous trouvons 378 occurrences des verlanisations dont 318 sont employées par les locuteurs du Nord de la France et 60 occurrences apparaissent dans les textes des rappeurs du Sud. Notre corpus contient 202 verlanisations (les formes graphiques incluses) dont la répartition selon les types de verlanisations est la suivante :

Tableau n° 4 : Bilan statistique de nombre des verlanisations

nombre relatif nombre de d'occurrences nombre variantes (100%=toutes d'occurrences graphiques les verlanisations) verlanisations lexicalisées 25 71 19% verlanisations semi-lexicalisées 128 251 66% verlanisations non-lexicalisées 49 56 15% ensemble des verlanisations 202 378 100%

Quant à la répartition géographique des types de verlanisations, les plus répandues sont les verlanisations semi-lexicalisées dans les deux régions. Tandis que le Nord fait preuve d’une grande créativité avec 17% des verlanisations lexicalisées, au Sud, 35% des verlanisations employées sont les mots lexicalisés. Graphique n° 13 : Bilan - Les types de verlanisations au Nord Graphique n° 12 : Bilan – types de verlanisations au Sud

Nord Sud nombre d'occurrences (100%) = 318 nombre d'occurrences (100%) = 60 17% 16%

2% 35%

63% verlanisations lexicalisées 67% verlanisations semi-lexicalisées verlanisations non-lexicalisées

En ce qui concerne le mode de formation, 60% de toutes les verlanisations sont créées par une simple permutation de syllabes. Un autre type de formation assez fréquent et l’utilisation de l’apocope (25%) après cette permutation. De cette manière est créée 67% des verlanisations apparaissant chez les rappeurs du Sud.

68

CONCLUSION

Ce mémoire a eu pour but d’effectuer une analyse concrète des verlanisations et de vérifier certaines hypothèses à l’aide des outils textométriques. Pour cet effet, nous avons choisi notamment des outils assez faciles à maîtriser qui comprennent les principales fonctionnalités de statistique textuelle, nommément Lexico 3, TextObserver et pour examiner les thématiques nous avons utilisé Alceste. Nos hypothèses tentaient de mener notre recherche vers une étude détaillée de la distribution géographique des verlanisations, ses types et ses modes de formation.

Dans un premier temps, nous avons essayé de regarder la distribution géographique des verlanisations en général, sans nous axer sur leur type. Déjà après avoir affiché les concordances, il était clair que les verlanisations sont un phénomène prépondérant au Nord de la France avec 318 d’occurrences contre 60 d’occurrences au Sud. Avec la fonctionnalité des spécificités nous avons ensuite illustré cette différence primordiale entre ces deux espaces et nous avons donc ainsi étayé la confirmation de notre première hypothèse.

Dans un deuxième temps, nous nous sommes intéressée à la répartition des types de verlanisations selon le niveau de leur lexicalisation. Nous avons posé comme hypothèse que les verlanisations lexicalisées vont apparaître plutôt parmi les verlanisations des auteurs du Nord de la France. Dans la globalité, nous trouvons, en effet, un plus grand nombre d’occurrences chez les rappeurs du Nord (70% des verlanisations lexicalisées se trouvent chez les locuteurs du Nord). Or, par rapport à la somme des verlanisations au Sud, le pourcentage des verlanisations lexicalisées est plus élevé (35% contre 16%) qu’au Nord. Le fait que chez les locuteurs du Nord nous trouvons 88% de toutes les verlanisations non- lexicalisées prouve que les verlanisations sont le domaine souverain de la région parisienne qui fait ainsi preuve d’une créativité sensible et qui donne le ton, quant au verlan, à tout le reste de la France où apparaissent plutôt les verlanisations déjà assez insérées dans le lexique.

Notre troisième supposition concernait le mode de création des verlanisations. Nous avons supposé que la formation des verlanisations au Nord est plus complexe en combinant les procédés (apocope, aphérèse, chute d’un phonème etc.) alors qu’au Sud il s’agira surtout de simples verlanisations créées par permutation de deux syllabes.

69

Néanmoins, déjà en examinant les types de verlanisations et leurs procédés morphologiques de création, nous avons réalisé que les verlanisations lexicalisées subissent une formation plus complexe que les autres types. Ainsi, vu le pourcentage de ce type de verlanisation au Sud, il s’avérait que le résultat pourrait réfuter notre hypothèse. Quoique le nombre de mode de création par verlan suivi d’une apocope soit la création privilégiée des verlanisations du Sud (nécessairement dû au nombre élevé des verlanisations lexicalisées), en somme, nous pouvons affirmer qu’au Nord on trouve pourtant une plus grande « richesse » des modes de création.

À côté de la vérification des hypothèses, notre but secondaire était de signaler les obstacles et les imperfections des logiciels utilisés qui, comme nous l’avons vu, reposaient en majeure partie sur la visualisation. Dans le cas de Lexico 3, l’impossibilité de combiner plusieures partitions nous a obligés à retravailler la forme de notre corpus où il fallait rajouter l’information sur la provenance du locuteur dans la balise. En outre, la visualisation statique des AFC et l’impossibilité d’interpolation rend difficile l’interprétation et peut mener même vers une désinterprétation, comme nous l’avons vu dans le cas de comparaison des partitions loc_feat et loc_feat_membregroupe. Or, bien qu’il soit nécessaire d’interpréter avec prudence les résultats obtenus et, de façon optimale, il convient de compléter l’aperçu par l’entremise d’un autre outil, ce logiciel reste tout de même un outil pratique pour dévoiler les principales données statistiques.

Quant à TextObserver, cet outil essaie de nous procurer des fonctionnalités qui, à présent, manquent dans d’autres logiciels. Il se fonde sur l’interactivité et tente d’exploiter les possibilités d’une visualisation 3D. Cependant, cette tentation ne répond pas encore aux besoins de notre type de recherche. La visualisation et la durée d’exécution de certaines opérations sont les facteurs qui peuvent nuire à l’évaluation positive de nos résultats, pourtant nous croyons apporter de nouvelles pistes pour aborder le corpus.

Au terme de cette analyse, nous concluons que les logiciels textométriques représentent des outils pratiques et permettent d’aborder le corpus de manière statistique. Les calculs statistiques traditionnels peuvent apporter des résultats comparables. Or, l’usage des logiciels textométriques permet davantage une démonstration visuellement claire. Encore que les logiciels ne soient pas parfaits soit au niveau de la visualisation des résultats, de l’import ou d’autres paramètres, ils nous facilitent énormément le travail et le rendent plus amusant.

70

BIBLIOGRAPHIE

Monographies et articles

AUZANNEAU, Michelle, JUILLARD, Caroline (2012). « Introduction. Jeunes et parlers jeunes : catégories et catégorisation. » Langage et société. vol.3, n°141, p. 5-20.

BARRIO, Sébastien (2007). Sociologie du rap français : état des lieux (2000/2006). Thèse dirigé par M. Rémy Ponton. Université Paris 8 – Vincennes/Saint Denis.

BETHUNE, Christian (2003). Le RAP : Une Esthétique hors la loi. Paris : Ed. Autrement.

BOUCHER, Manuel (1998). Rap, expression des lacars. Paris : Union peuple et culture.

BOYER, Henri (1991). Éléments de sociolinguistique : Langue, communication et société. Paris : Dunod.

BOYER, Henri (2001). Introduction à la sociolinguistique. Paris : Dunod.

BULOT, Thierry (2011). « Variations et normes d’une langue ». Dans BULOT, T., BLANCHET, P. (2011). Dynamiques de la langue française au 21ième siècle : une introduction à la sociolinguistique. Disponible sur .

CALVET, Louis-Jean (1994). L’argot. Paris: PUF.

CALVET, Louis-Jean (1994). Les voix de la ville : Introduction à la sociolinguistique urbaine. Paris : Payot.

CALVET, Louis-Jean (2007). « La sociolinguistique au filtre de l'inventaire des langues du monde ». Langage et société. vol.3, n°121-122, p. 259-273.

DELAVIGNE, Valérie (2004). « Présentation d'Alceste ». Texto! [en ligne], vol. IX, n°4. Disponible sur : .

FRANCOIS-GEIGER, Denise, GOUDAILLIER, Jean-Pierre (1991). « Parlures argotiques ». Langue française. n°90.

GADET, Françoise (2003). « Français populaire un classificateur déclassant ». Marges linguistiques. n°6.

71

GADET, Françoise (2007). La Variation sociale en français. Paris : Orphrys.

GOUDAILLIER, Jean-Pierre (1997). « La langue des cités ». Communication et langages. n°112, p. 96-110.

GOUDAILLIER, Jean-Pierre (2001). « De l’argot traditionnel au français contemporain des cités ». La linguistique. vol.38, n°1.

GOUDAILLIER, Jean-Pierre (2001). Comment tu tchatches ! : dictionnaire du français contemporain des cités. Paris : Maisonneuve et Larose.

HABERT, Benoît, NAZARENKO, Adeline, SALEM, André. (1997). Les linguistiques de corpus. Disponible sur : http://lexicometrica.univ- paris3.fr/livre/les_linguistiques_de_corpus_1997/.

KELLEY, Robin D. G. (1996). « Kicking reality, kicking ballistics : gangsta rap and post- industrial Los Angeles » dans Droppin' Science, critical essays on rap music and hip-hop culture. Collectif dirigé par William Eric Parker. Philadephie : Temple University Press.

LEBART, L., SALEM, A. (1994). Statistique Textuelle. Paris : Dunod. Disponible sur : http://issuu.com/sfleury/docs/st-1994-lebart_salem/1?e=1010051/2683332.

MARTI, Pierre-Antoine (2006). Rap 2 France : Les mots d’une rupture identitaire. Paris : L’Editions L’Harmattan.

MÉLA, Vivienne (1991). « Le verlan ou le langage du miroir ». Langage. n°101, p. 73-94.

MÉLA, Vivienne (1997). « Verlan 2000 ». Langue française. n°114, p. 16-34.

PODHORNÁ-POLICKÁ, Alena (2009). Universaux argotiques des jeunes : analyse linguistique dans les lycées professionnels français et tchèques. Brno : Masarykova univerzita.

ROBERT L’ARGENTON, Françoise (1991). « Larlépem largomuche du louchébem. Parler l’argot du boucher. » Langue française. n°90, p. 113-125.

ROUX, Maurice (1985). Algorithmes de classification. Paris : Masson. Disponible sur : http://www.imep-cnrs.com/docu/mroux/algoclas.pdf.

72

SEKANINOVÁ, Tereza (2012). Stéréotypes liés au verlan : variation diatopique dans le rap français. [en ligne] Mémoire de Master. Brno : Université Masaryk. Disponible sur : https://is.muni.cz/auth/th/263203/ff_m?info=1;zpet=%2Fauth%2Fvyhledavani%2F%3Fsea rch%3Dtereza%20sekaninov%C3%A1%26start%3D1.

SINCLAIRE, John (1996). Preliminary recommandations on Corpus Typology. Rap. tech., EAGLES (Expert Advisory Groupe on Language Engineering Standarts).

SOURDOT, Marc (2011). « La dynamique du français des jeunes : sept ans de mouvement à travers deux enquêtes (1987-1994) », in. PODHORNÁ-POLICKÁ Alena (éd.) : Aux marges de la langue : argots, style et dynamique lexicale. Brno : Munipress, p. 42-61.

SOURDOT, Marc (2001). « L’argotologie : entre forme et fonction ». La linguistique, vol.38, n°1.

Dictionnaires

Cobra le Cynique. Dictionnaire de la Zone . [en ligne]. Disponible sur : http://www.dictionnairedelazone.fr/.

GOUDAILLIER Jean-Pierre (1997). Comment tu tchatches ! Dictionnaire du français contemporain des cités, Paris, Maisonneuve et Larose.

Collectif Permis de vivre la ville (2007). Lexik des cités illustré. Paris: Fleuve noir.

LAFFITTE, Roland, YOUNSI, Karima (2004). Bien ou quoi ?: la langue des jeunes à Ivry-sur-Seine. Paris: Selefa.

Le nouveau Petit Robert de la langue française 2010. Paris : Dictionnaires le Robert.

TLF. Trésor de la langue française informatisé, CNRS-ATILF. [En ligne] ? Disponible sur : http://atilf.atilf.fr/tlf.htm.

73

Sources Internet http://textopol.u-pec.fr/ http://www.tal.univ-paris3.fr/lexico/ http://www.sociolinguistique.fr/ http://www.persee.fr/web/guest/home http://www.cairn.info/ http://textometrie.ens-lyon.fr/ http://www.image-zafar.com/index_alceste.htm http://www.frantext.fr/ http://atilf.atilf.fr/dendien/scripts/tlfiv4/showps.exe?p=combi.htm;java=no http://sites.univ-provence.fr/delic/corpus/index.html http://clapi.univ-lyon2.fr/V3_Accueil.php http://cnrtl.fr/corpus/estrepublicain/ https://is.muni.cz/do/phil/Pracoviste/URJL/rapcor/txm.html http://txm.sourceforge.net/enregistrement_atelier_initiation_TXM_fr.html http://fr.wikipedia.org/wiki/Verlan

74

LISTE DES ILLUSTRATIONS

Images

Image n° 1 : Carte de la France – délimitation de la frontière entre deux espaces de la scène musicale ...... 24

Image n° 2 : Caractéristiques générales du corpus ...... 31

Image n° 3 : Illustration du déséquilibre des tailles des parties ...... 31

Image n° 4 : Classification descendente (Alceste)...... 33

Image n° 5 : AFC de l’ensemble du corpus (Lexico 3) ...... 35

Image n° 6 : AFC sans GB_OMA et USA_SLJ (Lexico 3) ...... 36

Image n° 7 : AFC après le deuxième enlèvement de certaines parties ...... 37

Image n° 8 : AFC après le troisième enlèvement de certaines parties les plus éloignées ... 38

Image n° 9 : AFC général (TextObserver) avec des annotations ...... 38

Image n° 10 : Comparaison des deux situations : visualisation de tous les points contributifs et état des choses après le mouvement presque imperceptible du curseur dans la Séléction par facteurs de contribution aux axes ...... 39

Image n° 11 : Le nombre des verlanisations selon l’espace géographique ...... 40

Image n° 12 : Verlanisations qui sont présentes dans notre corpus plus que 5 fois ...... 41

Image n° 13 : Hapax ...... 41

Image n° 14 : Les spécificités des verlanisations selon les locuteurs ...... 46

Image n° 15 : Spécificités des types de verlanisations selon le lieu (Lexico 3) ...... 52

Image n° 16 : Spécificités des types de verlanisations selon l’année de sortie des albums . 54

Image n° 17 : Distribution des types de verlanisations selon les locuteurs ...... 56

Image n° 18 : AFC des verlanisations dans Textobserver ...... 61

Image n° 19 : Zoom d’AFC des verlanisations dans TO Image n° 20 : Zoom d’AFC des verlanisations dans TO………………………………...... 61

Image n° 21 : AFC des verlanisations dans TO – Zoom de la verlanisation éloignée du centre ...... 62 75

Image n° 22 : Concordances meufs Image n° 23 : Concordances meuf ...... 62

Image n° 24 : AFC de partition loc_feat ...... 64

Image n° 25 : AFC de partition loc_feat_membregroupe...... 64

Image n° 26 : AFC de partition locuteur1...... 65

Image n° 27 : AFC 3D de partition loc_feat_membregroupe ...... 66

Image n° 28 : AFC 3D de la partition loc_feat ...... 66

Graphiques

Graphique n° 1 : Distribution des verlanisations Graphique n° 2 : L'emploi des verlanisations - classes faites sur la base de la fréquence…… ...... 41

Graphique n° 3 : L'emploi des verlanisations - classes faites sur la base de la fréquence (hapax recompté) ...... 43

Graphique n° 4 : Le nombre d’occurrences des types de verlanisations selon la provenance des rappeurs (100%=nombre d’occurrences) ...... 50

Graphique n° 6 : La répartition des types de verlanisations au Sud ...... 51

Graphique n° 5 : La répartition des types de verlanisations au Nord ...... 51

Graphique n° 7 : Nombre de contextes de verlanisations selon la sortie des albums ...... 55

Graphique n° 8 : Modes de formation des verlanisations selon les types de verlanisations 57

Graphique n° 9 : Nombre d'occurrences des verlanisations selon le mode de formation .... 58

Graphique n° 10 : Distribution des verlanisations non-lexicalisées en distinguant leur mode de création (chiffres absolus) ...... 59

Graphique n° 11 : Aperçu récapitulatif de modes de formation des verlanisations du corpus ...... 60

Graphique n° 12 : Bilan – types de verlanisations au Sud ...... 68

Graphique n° 13 : Bilan - Les types de verlanisations au Nord ...... 68

76

Tableaux

Tableau n° 1 : Récapitulation des modes de formation des verlanisations ...... 17

Tableau n° 2 : Locuteurs qui emploient plus que 10 verlanisations ...... 44

Tableau n° 3 : Les statistiques de verlanisations selon le type ...... 49

Tableau n° 4 : Bilan statistique de nombre des verlanisations ...... 68

77

LISTE DES ANNEXES

Annexe n° 1 : Principales caractéristiques de la partition loc_feat ...... 79

Annexe n° 2: Listes des verlanisations triées selon le type avec les procédés morphologiques de formation marqué ...... 80

Tableau 1 : Les verlanisations non-lexicalisées ..…………………………………79

Tableau 1 : Les verlanisations semi-lexicalisées………………………………….80

Tableau 3 : Les verlanisations lexicalisées………………………………….…….80

Annexe n° 3 : Les chansons constituant notre corpus ...... 82

78

ANNEXES

Annexe n° 1 : Principales caractéristiques de la partition loc_feat

Principales caractéristiques de la partition: loc_feat

Fréq. Fréq. Partie occurrences formes hapax Forme Partie occurrences formes hapax Forme Max Max

GB_OMA 123 25 3 11 that S_AKH_S_SAK 3 3 3 1 les N_ALI 6295 2060 1488 234 la S_DON 3387 1235 886 89 de N_ALI_N_HIF 36 24 17 5 les S_ESK 2229 792 559 86 de N_ALI_N_MES 34 28 24 3 de S_EXP 198 127 96 10 l N_ATK 50 41 36 5 d S_FAF 8129 2159 1507 214 de N_BAU 325 189 139 14 les S_FAF_N_TAI 84 16 0 9 de N_BLA 328 173 105 9 et S_FAY 4087 1684 1378 136 de N_BOO 5200 1784 1313 148 la S_FAY_X_ILY 83 50 24 4 de N_BOU 82 62 51 5 et S_FFA 11680 2435 1575 363 de N_BRA 207 143 109 8 les S_FRE 380 219 161 14 la N_DDA 180 118 94 10 de S_IAM 6515 2190 1628 180 l N_DEN 302 160 115 21 les S_KAL 1442 614 455 54 de N_DIA 11779 2258 1404 324 de S_KEN 12604 3020 1949 436 de N_DIA_S_VIT 44 28 16 5 - S_KEU 249 170 133 9 le N_DIA_X_JBR 14 14 14 1 et S_KRH 151 102 81 7 pour N_DLP 7597 1909 1261 273 je S_LAL 4119 1284 889 136 la N_ELR 151 103 82 9 tu S_LEA 106 69 46 7 que N_FLY 4723 1369 950 122 de S_MIO 322 194 151 14 la N_HIF 245 140 94 10 les S_MOI 89 56 41 8 de N_HPO 4609 1466 1030 135 de S_PSY 10234 2741 1873 253 de N_ISS 134 95 73 6 j S_PSY_S_LAL 6 6 6 1 les N_KER 309 175 121 11 j S_PSY_S_MIO 9 7 5 2 ma N_KEYDJ 181 120 93 9 l S_RAT 376 194 144 12 de N_KND 1711 660 489 76 j S_RPZ 185 121 90 10 la N_LIM 2395 822 578 92 de S_SAK 968 476 366 37 le N_LIM_N_MVL 41 29 23 5 des S_SHU 1145 535 418 36 de N_LSP 4371 1271 835 100 j S_SLM 241 156 123 11 les N_LSP_X_VAI 107 71 54 11 - S_SOP 7278 1835 1203 236 de N_MAL 272 164 119 11 on S_SOP_S_MIO 50 19 1 4 la N_MCS 4358 1475 1094 137 le S_SOP_S_RAT 50 31 23 6 de N_MES 151 115 96 6 la S_STB 129 100 81 4 la N_MVL 404 216 164 21 de S_VEU 573 303 232 23 les N_NES 306 188 144 15 les S_VIT 436 165 103 23 je N_NUT 179 82 45 9 que S_VOR 168 117 94 8 de N_OLC 139 111 95 5 de USA_SLJ 50 29 15 4 do N_OXM 5094 1667 1209 135 de X_CLY 124 89 69 5 la

79

N_PRAN 6 6 6 1 les X_DIL 115 84 64 6 je N_RIM 3328 1189 881 141 de X_DOU 179 124 98 8 à N_RIM_N_KER 66 54 44 3 le X_DRAF 134 107 90 7 de N_SEF 4383 1309 934 213 - X_DRE 125 96 83 6 de N_SIN 3090 990 699 106 je X_FLF 6 6 6 1 t N_SMR 183 115 78 9 de X_ILY 262 157 120 12 j N_SMR_N_ATK 26 17 9 3 je X_JAL 25 21 19 3 au N_SNI 2919 1081 808 89 de X_JBR 118 75 53 8 j N_TAI 124 61 43 11 est X_JDA 98 79 69 5 de N_TPA 12 6 0 2 les X_KSL 147 103 82 5 la N_VIT 112 70 50 6 j X_NLA 261 170 141 12 de N_WALLEN 76 61 51 5 l X_PIB 43 27 21 5 de N_ZEL 164 83 39 8 on X_SLE 29 25 21 2 la ND 1678 709 477 36 i X_VAI 195 95 51 10 la S_AKH 6585 2268 1672 203 la X_ZAH 124 64 37 7 on

Annexe n° 2: Listes des verlanisations triées selon le type avec les procédés morphologiques de formation marqué

Légende : VERL VERL+APO VERL+VERL VERL+chute APH+VERL APO+VERL VERL+RED plusieurs procédés noms propres Tableau 2 : Les verlanisations non-lexicalisées

*gar-ba *quar-pla *teuteu *beuh *ke-shnés *rain-té *tin-ma *bledia *ke-skon *ré-bou *ve-le *bonchar *leche-ca *rect-di *vet-sur *bouldé *lé-par *re-vé *vile-ci *brolic *llets-bi *scal-ap *viles-ci *brolics *main-de *sé-pa *ze-fa *çon-cal *mané-ci *skeudi *zeil *cro-ma *meusseu *talfute *zness *cro-mi *neltu *téchan *zness-bi *diban *ous *téfro *dreupin *péra *tenos *duper *pe-sou *ter-mon *enlec 80

Tableau 3 : Les verlanisations semi-lexicalisées

*deuspi *reup *teij *àl *fe-shnou *reurs-ti *té-ma *ap *foncedé *reurti *te-schmi *as *fonce-dé *reur-ti *teshmi *barjot *gen-ar *reuss *tess *barjots *golmon *Rim *teufs *be-bar *gout-dé *ro *tièpe *bé-bar *gova *Rortis *tiéqs *be-flan *ien-cli *rotte-ca *tier-kar *béflan *ients-cli *scarla *tierquar *bé-ger *ive *scarlas *tier-quar *beu *kaill *scred *tiex *beu-her *ken *seufs *ti-peu *beuj *keufs *sique-mu *ton-car *brelic *k'unfri *skeud *trom *caille *là-celle *son-pri *trôme *caillera *ler-ga *squeud *tymp *cailleras *maness *ste-po *vénèrent *cailles *meufs *stockma *vénères *cailles-ra *mifa *stock-ma *yébis *cainri *ness-biz *tar-ba *yégri *cain-ri *oi-de *tass *you-voi *card-pla *pera *tasses *zeb *car-na *pe-ra *tass-pés *zen *ceaux-mor *phonetel *te-bois *zic *ché-la *phone-tel *tec *zik *cheum *potkas *tèc *ZIK *cistes-ra *rabza *técal *zinc *croma *rabzouz *tèce *zique *dékis *rade-mou *tè-ce *zonz *demer *refré *té-ces *dé-spé *re-frès *téci *deur-vi *relous *té-ci

Tableau 4 : Les verlanisations lexicalisées

*beurre *och *roro *babtou *beurs *ouf *teuf *barge *cainf *pécho *vénère *barges *chanmé *rebeu *verlan *barje *chelou *relou *zar-bi *barjes *keuf *renoi *beur *meuf *reum 81

Annexe n° 3 : Les chansons constituant notre corpus

Les rappeurs du Nord de la France Les rappeurs du Sud de la France Ali : CHAOS & HARMONIE (2005) Akhenaton : SOLDATS DE FORTUNE (2006)

Titre ABR Titre ABR

Rappel à l’ordre ALI01 Soldats de fortune AKH15 Génération Scarface ALI02 Alamo AKH16 L’impasse Troie ALE01 AKH17 (feat Macson Escobar) (feat Sako) Observe ALI03 Vue de la cage AKP01 Golden boy ALI04 (feat PSY) Oraison funèbre ALI05 Canzone di malavita AKH18 La vérité reste la vérité ALI06 L’école de samba AIV01 Chaos et harmonie ALI07 (feat Iam et Veust Lyricist) Préviens les autres Déjà les barbelés ALH01 ASK01 (feat Hifi) (feat Sako) Langage venimeux ALI08 Akhenaton : SOLDATS DE FORTUNE (2006) Le chant des sirènes ALI09 Titre ABR Sang froid AKW01 (feat Keydj et Wallen) Dans la cité AMV01 Tolérance zéro ALI10 (feat Moïse et Veust Lyricist) A.M.O.U.R. ALI11 Bien paraître AIS01 Booba : PANTHÉON (2004) (feat Iam et Sako) Comode Le Dégueulasse Titre ABR AFV01 (feat FAF et Veust Lyricist) Tallac BOO01 La fin de leur monde AKS01 Le Mal par le Mal BOO02 (feat Shurik’n) Commis d’office Bronx river AKH23 BOM01 (feat Mala) Do it, do it, do it ASK02 No. 10 BOO03 (feat Sako) Hors-saison BOO04 Crèverie haut de gamme AKF01 R.A.P. (feat FRE) BSD01 (feat Sir Doum’s) Quand ils rentraient chez eux AKH21 Baby (feat Toko) BON01 (feat Nessbeal) Don Choa : VAPEURS TOXIQUES (2002) La faucheuse BOO05 Titre ABR Mon son BOO06 Alter ego BOW01 Apocalypse DON01 Pazalaza pour sazamuser Petit Bordel II DON02 BIB01 (feat Issaka et Bram’s) Vapeurs Toxiques DON03 Avant de partir Aaah DON04 BLM01 (feat Léya Massry) Don Choa : JUNGLE DE BÉTON (2007) Diam's : DANS MA BULLE (2006) Titre ABR Titre ABR Lune de miel DOZ01 82

La boulette DIA07 (feat Zaho) Ma France à moi DIA08 Anesthésie général DON05 Feuille blanche DIA09 Ghetto Youth DON06 Jeune demoiselle DIA10 Eska Crew : INSTINCT DE SURVIE (2005) Car tu portes mon nom DIA11 Titre ABR Marine DIA12 Dans ma bulle DIA13 Introductif ESK01 Par amour DIA14 E.S.K.A. ESK02 Big up DIA15 Ma vie c’est ESK03 Confessions nocturnes Fuyez DIV01 ESN01 (feat Vitaa) (feat Nitro) T.S. DIA16 Liberta ESK04 Me revoilà Faf Larage : RAP STORIES (2007) DIJ01 (feat Jacky Brown) Titre ABR Cause à effet DIA17 Petite banlieusarde DIA18 Le soul dans le sang FAF03 Disiz La Peste : LES HISTOIRES EXTRAORDINAIRES Millionnaire FAF04 D’UN JEUNE DE BANLIEUE (2005) Pas le temps FAF05 Titre ABR Ta meuf FAF06 Intro DLP08 Rap story (part 1) FAF07 Une histoire extraordinaire DLP09 Demande pardon FAF08 Inspecteur Disiz DLP20 C’est pas ma faute FAF09 Fuck you Part I DLP10 C’est de l’or FAT01 Jeune de banlieue DLP11 (feat Taïro) Lyly DLP12 Prise d’otage FAF10 Mélissa DLP13 Une faveur FAP01 Bo gosse DLP14 (feat Piero Battery) La fille facile DLP15 Rap story (part 2) FAF11 Miss Désillusion DLP16 Le brancheur FAF12 Interlude Mc Pikachou DLP17 Qui on est FAF13 Fuck you Part II DLP18 Fayçal : SECRETS DE L’OUBLI (2009) Outro DLP19 Titre ABR Flynt : J’ÉCLAIRE MA VILLE (2007) Le sentier de l’écriture FAY01 Titre ABR La belle endormie FAY02 1 pour la plume FLY01 Fragments de vies FAK01 J’éclaire ma ville FLY02 (feat Keurspi et Slam Mc) Mes sources FLY03 La morale d’un candide FAY03 Ça fait du bien d’le dire FLY04 Carnets du sous-sol FAY04 Notre existence FLY05 (feat Ilyes) Rien ne nous appartient FLY06 Vraies liaisons et lesions FAY05 Tourner la page FLY07 Arabesques FAV01 Hocus Pocus : PLACE 54 (2007) (feat Vorass et Experimental) Mon ange gardienne FAY08 Titre ABR Rapsodies FAJ01

83

Place 54 HPO09 (feat J-Day, Dilem, Clyde, Dreck, Quitte à t’aimer Nordine L’Archer, So et Drago) HPM01 (feat Magik Malik) In articulo mortis FAY09 Smile Fonky Family : MARGINALE MUSIQUE (2006) HOM01 (feat Omar) Titre ABR Recyclé HPF01 (feat Fred Wesley et Stro the 89th Key) Les affaires reprennent FFA01 Normal HPO10 C’est plus comme avant FFA02 Vocab La guerre FFA03 HPT01 (feat T.Love et The Procussions) Le quartier FFA04 Mr Tout le monde HPO11 Comme on débarque FFA05 Tournée HP012 C’est ça ou rien FFA06 Touriste C’est tout ce qu’on a FFA07 HPE01 (feat Elodie Rama et Tribeqa) 1984 - fallait que je le dise FFK01 Je la soul (feat KAL) HPK01 (feat Taïriq Keda) Marginale musique FFA08 Histoire d’une VHS HPO13 feat FLF Voyage immobile HPO14 Le plus grand des voyous FFA09 Kennedy : CICATRICE (2009) On s’invite FFA10 Dans les yeux FFA11 Titre ABR Ils le savent FFA12 Bâtard de Français KND02 Chez nous FFA13 Oseille KND03 Cherche pas FFA14 Cicatrice KND04 IAM : REVOIR UN PRINTEMPS (2003) LIM : DÉLINQUANT (2007) Titre ABR Titre ABR Lâches IAM40 Intro LIM01 Armes de distraction massive IAM39 Si on réussit Visage dans la foule IAM45 LIZ01 (feat Zeler) Ici ou ailleurs IAM41 On vit comme des bandits (feat Syleena Johnson) LID01 (feat Denver) Tiens IAM43 Mon mec s’est fait péter Fruits de la rage IAM36 LMA01 (feat Movez Lang et Aty.K + Samira) Murs IAM38 J’ai trop 21 04 IAM37 LML01 (feat Movez Lang) Aussi loin que l’horizon IAM46 Je rap Kalash L’Afro : CRACHEUR DE FLAMMES (2007) LIB01 (feat Boulox) Titre ABR Outro LIM02 Les Sages Poètes De La Rue : APRÈS L’ORAGE Cracheur de flammes KAL01 (2002) Keny Arkana : ENTRE CIMENT ET BELLE ÉTOILE Titre ABR (2006)

Titre ABR Après l’orage LSP08 Les gangsters boivent à l’œil LSP09 La missile suit sa lancée KEN01

84

(feat TPA, PRAN) J’viens d’l’incendie KEN02 Oublie-moi LSP10 J’me barre KEN03 Dis-moi la vérité Sans terre d’asile KEN12 LSN01 (feat Nuttea) Entre les lignes : Une goutte de plus KEN13 Les Sages Poètes De La Rue : APRÈS L’ORAGE Prière KEN14 (2002) Keny Arkana : L’ESQUISSE 2 (2011) Titre ABR Titre ABR Tout le monde fait oh ! LSP11 (feat Vitea) Buenos dias KEN16 No one to care LSP12 J’arrive du monde de demain KEN17 Leçon de vie pour avancer LSP13 Marseille KKR01 MC Solaar : CHAPITRE 7 (2007) (feat KAL et RPZ + ASH) V pour vérités KEN18 Titre ABR Je passe le salut KEN19 Intreau MCS72 Hors game KEN20 Carpe diem MCS73 Au milieu du chaos KEN21 Da Vinci Claude MCS74 Freestyle du maquis KEN22 In god we trust MCS75 À la vibe et mektoub KEN23 Coup d’œil dans le métro MCS76 Nature sauvage KEN24 Si on t’demande MCS77 Petit soldat KEN25 Sous les palmiers MCB02 Planquez-vous KEN26 Mollah Solaar MCS78 Une décennie d’un siècle KEN27 L’auberge du Bouleau Blanc MCS79 Old school dédicace KEN28 Avec les loups MCS80 À l’ombre des jugements KEN29 Merci MCS81 Odyssée d’une incomprise KEN30 Impact avec le diable MCS82 L’Algérino : MENTALITÉ PIRATE (2007) Oxmo Puccino : L’AMOUR EST MORT (2001) Titre ABR Titre ABR L’envie de vaincre LAL01 Quand j’arrive OXM09 Fleur fanée LAL02 Demain peut-être OXM10 L’enfant de Marseille LAL03 Le tango des belles dames OXM11 Le chant des pirates LAL04 J’ai mal au mic OXM12 Entre 2 flammes LAL05 Le laid OXM13 Johnny Hama LAL06 Ghettos du monde OXM14 Psy 4 De La Rime : BLOCK PARTY (2002) S 13-6.35 OXM15 Titre ABR Premier suicide OXC01 (feat Le Célèbre Bauza) Voici PSY01 Fais-le pour moi Le son des bandits OXM16 PSS01 (feat Keity Slake) (feat Saleem) À ton enterrement Sale bête PSY02 OXD01 (feat Dany Dan) On naît, on vit, on meurt PMA01 Mine de cristal OXM17 (feat Mino, LAL et Stone Black) L’amour est mort OXM18 Classic PSY03 Impasse désillusion OXM19 Terre promise PSY04

85

(feat Kery James + FRE) Block party PSY05 Rim-K : L’ENFANT DU PAYS (2004) L’enjeu PSY06 Repère les collabos PSY07 Titre ABR La vengeance aux 2 visages PSY08 Portrait RIM01 2 sortie PSY09 Dans la tête d’un jeune Beur RIM02 À cœur ouvert PSY10 Au tournant Tchao tchao PSY11 RIM03 (feat Janice Leca) Jamais j’oublierai PSY12 Je m’adapte RIM04 Soprano : PUISQU’IL FAUT VIVRE (2007) Intact RIJ01 Titre ABR (feat Kery James) Sefyu : SUIS-JE LE GARDIEN DE MON FRÈRE ? Donc SOP01 (2008) Le divan SOP02 Titre ABR Mélancolique anonyme Suis-je le gardien de mon frère SOD01 SEF02 (feat DIA) ? Molotov 4 SEF03 Bombe humaine SOP03 Le journal SEF04 Halla halla SOP04 3ème guerre SEF05 Dans ma tête SOP05 Au pays du zahef SEF06 Moi j’ai pas SOP06 Mon public SEF07 La famille SOL01 Sans plomb 93 SEF08 (feat Léa Castel) Sinik : SANG FROID (2006) Tant que dieu SOM01 (feat Mino) Titre ABR Juste fais-le SOR01 Autodestruction SIN04 (feat Le Rat Luciano) Mon pire ennemi SIN05 À la bien SOP07 Ne dis jamais Welcome SIV01 SPY01 (feat Vitaa) (feat PSY) Bonhomme SIN06 Parle-moi SOP08 La cité des anges SIN07 Ferme les yeux et imagine-toi SOB01 Sniper : TRAIT POUR TRAIT (2006) (feat Blacko) Passe-moi le mic SOP09 Titre ABR Puisqu’il faut vivre SOP10 Dans mon monde SNI01 Album FRENCH CONNECTION (2003) Trait pour trait SNI02 Titre ABR Donne tout SNI03 La France (Itinéraire d’une Watcha gonna do polémique) SNI04 FAM01 (feat Olivier Cachin) (FAF feat. Main Concept) Crève la faim FRK01 (FRE feat K.Rhyme Le Roi et Massive Toene)

86