lol thats how reddit talks;) : le site américain Reddit comme espace de variation de l’anglais : étude de corpus intersectionnelle et quantitative d’usages non standard, au prisme du genre, de l’âge et de l’ethnicité Marie Flesch To cite this version: Marie Flesch. lol thats how reddit talks;) : le site américain Reddit comme espace de variation de l’anglais : étude de corpus intersectionnelle et quantitative d’usages non standard, au prisme du genre, de l’âge et de l’ethnicité. Linguistique. Université de Lorraine, 2020. Français. NNT : 2020LORR0192. tel-03129082 HAL Id: tel-03129082 https://hal.univ-lorraine.fr/tel-03129082 Submitted on 2 Feb 2021 HAL is a multi-disciplinary open access L’archive ouverte pluridisciplinaire HAL, est archive for the deposit and dissemination of sci- destinée au dépôt et à la diffusion de documents entific research documents, whether they are pub- scientifiques de niveau recherche, publiés ou non, lished or not. The documents may come from émanant des établissements d’enseignement et de teaching and research institutions in France or recherche français ou étrangers, des laboratoires abroad, or from public or private research centers. publics ou privés. AVERTISSEMENT Ce document est le fruit d'un long travail approuvé par le jury de soutenance et mis à disposition de l'ensemble de la communauté universitaire élargie. Il est soumis à la propriété intellectuelle de l'auteur. Ceci implique une obligation de citation et de référencement lors de l’utilisation de ce document. D'autre part, toute contrefaçon, plagiat, reproduction illicite encourt une poursuite pénale. Contact : [email protected] LIENS Code de la Propriété Intellectuelle. articles L 122. 4 Code de la Propriété Intellectuelle. articles L 335.2- L 335.10 http://www.cfcopies.com/V2/leg/leg_droi.php http://www.culture.gouv.fr/culture/infos-pratiques/droits/protection.htm ATILF-CNRS | École doctorale SLTC (Sociétés, Langages, Temps, Connais- sances) Thèse présentée et soutenue publiquement en vue de l’obtention du titre de docteure de l’université de Lorraine, Mention « Sciences du langage », par Marie Flesch, le 16 décembre 2020 lol thats how reddit talks ;) : le site américain Reddit comme espace de variation de l’anglais. Étude de corpus intersectionnelle et quantitative d’usages non standard, au prisme du genre, de l’âge et de l’ethnicité Jury Président du jury : Luca Greco, professeur des universités, université de Lorraine Rapporteuses : Maria Candea, maitresse de conférences HDR, université Sorbonne Nouvelle Natalie Kübler, professeur des universités, université de Paris Examinatrice : Fabienne Baider, professeure des universités, université de Chypre Directrice de thèse : Sophie Bailly, professeure des universités, université de Lorraine ii Résumé Cette thèse étudie les relations entre les pratiques d’écriture en ligne et le genre sur le site communautaire américain Reddit. Elle s’appuie sur un corpus de près de 20 millions de tokens comprenant les commentaires en anglais de 1044 internautes, qui inclut les contributions de 300 personnes transgenres et non binaires. Dans une perspective intersectionnelle, des variables peu souvent prises en compte dans les études sociolinguistiques quantitatives du genre, comme l’âge et l’ethnicité, ont été intégrées aux analyses. Les variables linguistiques étudiées comprennent 11 variations par rapport à la langue écrite standard : 6 procédés d’ajout (émoticônes, émojis, étirements de lettres, étirements de ponctuation, mots en majus- cules et interjections) et 5 procédés de réduction (abréviations, graphies phonétiques, g-droppings, omissions d’apostrophe et omissions de la ma- juscule du pronom personnel I). En complément de ces analyses linguis- tiques, la thèse propose une exploration quantitative de l’identité en ligne des Redditors. Elle s’intéresse ainsi aux marqueurs les plus visibles de l’ac- tivité des Redditors dans la communauté, dont leurs pseudonymes, leurs centres d’intérêt, leur « karma », la longévité de leurs comptes et la modéra- tion de forums. Les analyses, qui s’appuient principalement sur la méthode de la régression multiple, montrent notamment que femmes et hommes transgenres s’alignent rarement sur les femmes et hommes cisgenres. L’in- tégration de l’ethnicité aux analyses permet par ailleurs de dresser un ta- bleau nuancé des pratiques d’écriture des femmes et des hommes, et montre la pertinence de l’étude de l’interaction du genre avec d’autres variables sociodémographiques. Nos résultats suggèrent ainsi que les femmes afro- américaines et hispaniques jouent un rôle de premier plan dans la diffusion des formes innovantes de la CMC. iv Abstract Title : lol thats how reddit talks ;) : variation in English on the American community website Reddit. A quantitative and intersectional study of ele- ven non-standard variables through the lens of gender, age, and ethnicity This thesis studies the relationships between non-standard online wri- ting practices and gender on the American community website Reddit. It is based on a corpus of nearly 20 million tokens which contains the com- ments written in English by 1,044 internet users, including 300 trans- gender and non-binary people. Using an intersectional sociolinguistic ap- proach, it examines the interaction of gender with age and ethnicity. Eleven non-standard variables were investigated : six additive processes (emoti- cons, emojis, letter lengthenings, punctuation lengthenings, all caps and interjections) and five reduction processes (abbreviations, phonetic spel- lings, g-droppings, apostrophe omissions and lower case spellings of the pronoun “I”). In addition to these linguistic analyses, the thesis explores how Internet users construct their virtual identities and occupy the Red- dit space, by focusing on the most visible markers of Redditors’ activity in the community : pseudonyms, interests, “karma”, longevity of the accounts and forum moderation. The analyses, which are mainly based on the mul- tiple regression method, provide a nuanced account of the way Redditors use non-standard language to index their gender identity. They show, in particular, that transgender women and men rarely align with cisgender women and men. They also suggest that Hispanic and African-American women play a major role in the spread of non-standard spelling and typo- graphy. vi Remerciements Mes remerciements vont tout d’abord à ma directrice de thèse Sophie Bailly, pour son accompagnement bienveillant, pertinent et enthousiaste pendant ces quatre années. Ils vont aussi aux membres du jury, qui ont accepté de lire mon travail. Je remercie ensuite tou·tes les collègues de l’ATILF qui m’ont écoutée, encouragée, et dont les remarques ont permis de faire progresser ma thèse. Je remercie tout particulièrement Bertrand Gaiffe, l’architecte du corpus, dont les conseils m’ont été très précieux ; Alex Boulton, mon directeur de mémoire de Master 2, dont cette thèse est une continuation ; Guillaume Nassau, pour son travail de codage des pseudo- nymes ; et Véronique Lemoine-Bresson, pour son enthousiasme et son in- vitation à présenter mon travail à ses étudiant·es. Je remercie également les collègues de l’Espace Quanti et plus particulièrement Simon Paye, pour m’avoir motivée à apprendre R, et Jean-Luc Kop, pour ses explications éclai- rantes sur la régression. Je remercie mes amies Samantha Ruvoletto pour ses relectures, et Sarah Kremer pour ses conseils sur la mise en page et la typographie. Je remercie aussi tou·tes mes ami·es et mes proches, et en particulier mes parents, mes frères, ma grand-mère, et Philippe, Pénélope et Constantin, pour leur patience et leur soutien tout au long de ce long voyage. viii À Hélène et Marie-Paule x Table des matières Introduction 5 I Cadre théorique 11 1 L’approche intersectionnelle du genre et du langage 13 1.1 La construction du genre . 13 1.2 La recherche sur le genre et la langue . 19 1.3 L’intersectionnalité : une nouvelle approche du genre . 31 1.4 Les intersections du genre, de l’âge et de l’ethnicité . 38 2 La CMC : un terrain fertile pour la sociolinguistique 51 2.1 Un nouvel objet d’étude . 51 2.2 Qui sont les internautes ? . 54 2.3 De quoi parlent les internautes ? . 59 2.4 Comment écrivent les internautes ? . 62 3 Reddit 87 3.1 Présentation de Reddit . 87 3.2 Fonctionnement du site . 89 3.3 Reddit, un espace emblématique de la culture geek . 97 II Méthodologie 107 4 Le corpus RedditGender 109 4.1 Origine du projet . 109 4.2 Méthode de recueil des données . 111 4.3 Composition du corpus . 118 4.4 Construction du corpus . 120 4.5 Structure du corpus . 124 4.6 Exploitation du corpus . 124 4.7 Mise à disposition du corpus et éthique . 129 5 Les variables 131 5.1 Les variables sociales . 131 5.2 Les variables de la « Reddidentité » . 136 5.3 Thèmes des subreddits . 138 2 Table des matières 5.4 Les variables linguistiques . 140 6 Les méthodes statistiques 151 6.1 Statistiques descriptives présentées dans la thèse . 151 6.2 Analyse des corrélations . 153 6.3 Tests statistiques . 159 6.4 La régression . 160 6.5 Organisation des analyses linguistiques . 168 6.6 Tableau récapitulatif des méthodes utilisées . 169 III Identités et itinéraires 173 7 La Reddidentité 175 7.1 Hypothèses . 175 7.2 Pseudonymes . 176 7.3 Âge Reddit . 177 7.4 Profils supprimés : étude longitudinale . 178 7.5 Modération . 180 7.6 Analyse du karma : étude longitudinale . 182 7.7 Discussion . 188 8 Mobilité et centres d’intérêt des Redditors 195 8.1 Hypothèses et questions de recherche . 195 8.2 Étude de la mobilité des Redditors . 196 8.3 Longueur des commentaires . 198 8.4 Centres d’intérêt . 200 8.5 Discussion . 202 IV Analyses linguistiques 207 9 Production de Netspeak 209 9.1 Hypothèses et questions de recherche . 209 9.2 Données . 209 9.3 Effets du genre et de l’âge sur la production de Netspeak . 211 9.4 Effet de l’ethnicité sur la production de Netspeak .
Details
-
File Typepdf
-
Upload Time-
-
Content LanguagesEnglish
-
Upload UserAnonymous/Not logged-in
-
File Pages411 Page
-
File Size-