Les Outils Textométriques Appliqués Au Phénomène De La Verlanisation Dans Le Corpus Des Chansons De Rap
Total Page:16
File Type:pdf, Size:1020Kb
Masarykova univerzita Filozofická fakulta Ústav románských jazyků a literatur Les outils textométriques appliqués au phénomène de la verlanisation dans le corpus des chansons de rap Bakalářská diplomová práce Barbora Švehlíková Vedoucí práce : PhDr. Alena Polická, Ph.D. Konzultant : Jean-Marc Leblanc, Ph.D. Brno 2014 Prohlašuji, že jsem bakalářskou diplomovou práci vypracovala samostatně s využitím uvedených pramenů a literatury a také, že tištěná verze mé práce se shoduje s verzí elektronickou. ……………………………………………….. J’aimerais remercier la directrice de mon mémoire, Mme Alena Polická, pour sa patience, ses suggestions, ses corrections et surtout pour ses encouragements durant l’élaboration de ce mémoire. Un grand merci également à M. Jean-Marc Leblanc pour sa complaisance, pour la main secourable qui’il a su me tendre à tout moment concernant la prise en main des logiciels textométriques. Je remercie finalement tous ceux qui m’ont soutenu et qui m’ont aidé lors des problèmes informatiques ou de langue. Table des matières INTRODUCTION ................................................................................................... 3 1 DE LA PLACE DU VERLAN DANS LE LANGAGE ET LE RAP FRANÇAIS ............................................................................................. 5 1.1 Approche sociolinguistique et variations ................................................ 5 1.2 Le non-standard dans le rap .................................................................... 7 1.2.1 Le français non-standard ......................................................................... 8 1.2.2 L’Argot ou les argots .............................................................................. 9 1.2.3 Le rap et le langage dans le rap ............................................................. 11 1.3 Le verlan................................................................................................ 14 1.3.1 Typologie des verlanisations selon l’approche lexicographique .......... 15 1.3.2 Procédés morphologiques de formation des verlanisations .................. 16 1.4 Linguistique de corpus .......................................................................... 18 1.5 RapCor .................................................................................................. 19 1.6 Outils textométriques ............................................................................ 20 1.6.1 Lexico 3 ................................................................................................. 21 1.6.2 TextObserver ......................................................................................... 22 1.6.3 Alceste ................................................................................................... 22 1.6.4 TXM ...................................................................................................... 23 2 DEFINITION ET PREPARATION DE CORPUS ............................... 24 2.1 Préparation des textes ............................................................................ 25 2.2 Balisage du corpus pour Lexico3 .......................................................... 25 2.3 Marquage des verlanisations ................................................................. 27 2.4 Problème avec le codage ....................................................................... 27 2.5 Balisage et importation dans TextObserver .......................................... 28 2.6 Balisage et importation dans Alceste .................................................... 29 3 ANALYSE DU CORPUS ..................................................................... 30 3.1 Caractéristiques générales ..................................................................... 30 3.1.1 Principales caractéristiques lexicométriques – Lexico 3 ...................... 30 3.1.2 Les thématiques trouvées par Alceste ................................................... 32 3.1.3 Analyse factorielle des correspondances (Lexico3 et TextObserver) ... 34 3.2 Verlanisations – analyse détaillée ......................................................... 40 1 3.2.1 Distribution géographique des verlanisations ....................................... 40 3.2.2 Distribution et spécificités des verlanisations selon les locuteurs ........ 43 3.2.3 Distribution des différents types de verlanisations ............................... 48 3.2.4 Distribution géographique des verlanisations selon le mode de création57 3.2.5 Analyse factorielle des correspondances (AFC) des verlanisations ..... 60 3.2.6 Comparaison des AFC des partitions loc_feat, loc_feat_membregroupe et locuteur1............................................................................................ 63 4 EN GUISE DE CONCLUSION : BILAN STATISTIQUE .................. 68 CONCLUSION ..................................................................................................... 69 BIBLIOGRAPHIE ................................................................................................. 71 Monographies et articles ...................................................................................... 71 Dictionnaires ........................................................................................................ 73 Sources Internet.................................................................................................... 74 LISTE DES ILLUSTRATIONS ............................................................................ 75 Images ............................................................................................................... 75 Graphiques ........................................................................................................... 76 Tableaux ............................................................................................................... 77 LISTE DES ANNEXES ........................................................................................ 78 ANNEXES ............................................................................................................. 79 2 INTRODUCTION Depuis les années 60 s’observe une tendance dans la recherche linguistique à se servir de l’analyse statistique et de l’analyse sémantique (de contenu). Bien que la lexicométrie ait été établie il y a quelques décennies, les chercheurs ne s’aperçoivent pas toujours de cette analyse, ou s’en méfient. Quelle est la typologie et quelles sont les possibilités des logiciels lexicométriques? Quelles sont leurs limitations et comment pourrions-nous nous en servir ? Ce mémoire a pour but de faire une analyse concrète d’un phénomène lexical (le verlan) à l’aide de différents logiciels textométriques (notamment Lexico 3, TextObserver, Alceste, TXM). Notre but secondaire est de signaler, au cours de l’analyse, les obstacles et les imperfections des logiciels qui nous auraient empêchés un traitement facile ; ceci pouvant servir d’inspiration pour les prochaines améliorations de logiciels. Dans un premier temps, nous allons présenter les points de départ théoriques (les notions de base et les logiciels) de notre recherche pour ensuite passer à la partie pratique, et à l’exploitation de certains logiciels choisis en se servant du phénomène de verlanisation en tant qu’objet d’étude. Dans la partie pratique, nous nous concentrerons d’abord sur les caractéristiques générales du corpus et sur la distribution des verlanisations qui y sont présentes. Successivement, nous étudierons les thématiques que nous fournissent les logiciels et nous les comparerons avec la caractéristique du rap français que nous propose la bibliographie à ce sujet1. Notre deuxième objectif vise à effectuer une analyse détaillée des verlanisations. Nous essayerons de trouver les possibilités permettant d’observer les corrélations entre : 1. auteur/lieu nombre des verlanisations 2. auteur/lieu type de verlanisation (lexicalisée/semi-lexicalisée/non- lexicalisée) 3. lieu type de création des verlanisations Pour cet effet, nous avons établi quelques hypothèses qui seront vérifiées au cours de l’analyse. Premièrement, nous supposons que le nombre des mots verlanisés sera plus 1 Par exemple: Christian BETHUNE (2003). Le RAP : Une Esthétique hors la loi. Paris : Ed. Autrement. Manuel BOUCHER (1998). Rap, expression des lacars. Paris : Union peuple et culture. Pierre-Antoine MARTI (2003). Rap 2 France : Les mots d’une rupture identitaire. Paris : L’Editions L’Harmattan, 2006. 3 élevé dans les textes des auteurs du Nord de la France que chez les auteurs du Sud. Deuxièmement, nous pensons que les verlanisations lexicalisées vont apparaître plutôt parmi les verlanisations des auteurs du Nord de la France. Et finalement, nous supposons que la formation des verlanisations au Nord est plus complexe en combinant les procédés (apocope, aphérèse, chute d’un phonème etc.) alors qu’au Sud il s’agira surtout de simples verlans créés par permutation de deux syllabes. Nous incluerons également une expérimentation visant à répondre à des questions portant plutôt sur la forme du corpus en vérifiant les hypothèses suivantes : « Y a t-il a une différence entre le corpus sans « featurings » marqués et celui avec les chanteurs invités marqués dans le corpus ? » « Est-il nécessaire de faire la distinction entre les chanteurs du même groupe parce qu’ils partagent à peu près le même langage ? » Étant donné que l’un de nos buts est de signaler les avantages et les inconvénients des logiciels, notre travail n’apportera pas seulement une analyse détaillée des verlanisations mais pourra servir comme point