La Subjectivité Dans Le Discours
Total Page:16
File Type:pdf, Size:1020Kb
Ecole doctorale V « Concepts et Langages » Equipe « Sens Texte Informatique et Histoire » (STIH, EA 4509) LA SUBJECTIVITÉ DANS LE DISCOURS Entre linguistique et traitement automatique des langues Agata Jackiewicz Dossier en vue de l’Habilitation à Diriger des Recherches Volume 1 : Synthèse Jury : Jacques Bres, Pr, Université Paul-Valéry (Montpellier 3), examinateur Michel Charolles, Pr, Université Sorbonne Nouvelle (Paris 3), examinateur Béatrice Daille, Pr, Université de Nantes, rapporteur Patrick Dendale, MC HDR, Université d’Anvers, examinateur Patrice Enjalbert, Pr, Université de Caen, examinateur Béatrice Lamiroy, Pr, Université Catholique de Louvain (KUL), rapporteur Franck Neveu, Pr, Université de Paris-Sorbonne, rapporteur, président Olivier Soutet, Pr, Université de Paris-Sorbonne, directeur Paris, le 26 novembre 2011 2 Remerciements Mes premiers et plus sincères remerciements vont à Olivier Soutet, directeur de l’équipe STIH, qui a accepté de diriger ce projet d’HDR. Sa confiance et son soutien ont été aussi précieux que déterminants. J’exprime mon plus grand respect et mes profonds remerciements aux rapporteurs qui m’ont fait l’honneur d’évaluer ce travail de recherche et de participer à sa soutenance : à Franck Neveu, en qualité du rapporteur interne, ainsi qu’à Béatrice Daille et à Béatrice Lamiroy, en tant qu’experts extérieurs. Je suis reconnaissante à Patrice Enjalbert, Michel Charolles, Patrick Dendale et à Jacques Bres qui ont chaleureusement accepté de participer à ce jury. Je dois à Patrice Enjalbert des conseils avisés sur les premières versions de mes manuscrits. J’exprime ma gratitude à Jean-Pierre Desclés pour son accueil au laboratoire LaLIC et ces longues années de collaboration. Mes différents travaux se sont nourris de collaborations et d’échanges d’idées notamment avec Brigitte Grau, Jean-Luc Minel, Antoine Blais, Michel Charolles, Denis Vigier, Stéphane Ferrari, Thierry Charnois, Dominique Legallois, Frédérik Bilhaut, Max Silberztein… Qu’ils en soient tous remerciés. Je dois beaucoup à l’ensemble des partenaires du projet ANR OntOpiTex qui ont apporté un nouveau souffle à mon travail de recherche. Je les remercie très sincèrement pour cette collaboration à la fois passionnante, fructueuse et agréable. Merci à l’ensemble des collègues et du personnel de l’ISHA pour leur présence chaleureuse et leur gentillesse. J’ai une pensée pour mes étudiants, source d’énergie, d’enthousiasme et de stimulation. Je m’estime chanceuse de pouvoir croiser leurs chemins. Enfin, j’adresse un mot affectueux à mes proches, ceux qui partagent mes états d’âme et illuminent ma vie: mes parents, mon mari Luc, mes fils Boris et Tom, mes amis : Dominique D., Anita, Véronique, Dominique S., Renn, Laure, Annick, Pascale, Karine, Marzena, Leila, Franco, Laurent, Jean-Paul, Lucine, Emmanuel… et tant d’autres. Votre présence et votre soutien me sont si chers ! 3 4 SOMMAIRE SOMMAIRE 5 INTRODUCTION 7 1. Présentation du mémoire 7 2. Formation et parcours de recherche 8 3. Enseignement 10 4. L’énonciation : l’axe de l’intelligibilité des discours 11 QUESTIONS DE MÉTHODOLOGIE 13 1. Regard interdisciplinaire et démarche onomasiologique 13 2. Ce qu’ils sont : leur nature, leurs fonctions et leurs marques 14 3. Entre l’empirique et le théorique 15 4. Corpus, normes et usages 16 5. Des notions aux marques, des marques aux ressources 18 6. Pour une capitalisation des données linguistiques 19 7. Vers une « ontologie » de l’énonciation 20 REGARDS SUR LA SUBJECTIVITÉ, AU TRAVERS DES… 23 I. CONNAISSANCES CAUSALES 25 A. BREF ÉTAT DES LIEUX 25 B. LA CAUSALITÉ PRISE EN CHARGE 26 1. Problématique 26 2. Une lecture en contexte 27 3. Prendre en charge une connaissance causale 29 4. Double dimension de la causalité « langagière » 35 5. Conclusion 36 II. ORGANISATIONS TEXTUELLES 37 A. ETAT DES LIEUX 37 B. LES SÉRIES LINÉAIRES DANS LE DISCOURS 40 1. Introduction 40 2. Les séries linéaires : observation en corpus 41 3. Les séries linéaires à la lumière des analyses linguistiques 42 4. Nature cognitive et logique de l’objet « série » 44 5. Opérations, structures et configurations de marques 46 6. Conclusion 47 III. DISCOURS RAPPORTÉS 49 A. ETAT DES LIEUX 49 B. RESPONSABILITÉ ET PRISE EN CHARGE DANS LE DISCOURS RAPPORTÉ 52 1. Problématique 52 2. Choix préliminaires 52 3. De la prise en charge à la responsabilité 54 4. Responsabilité énonciative dans différents modes d’intervention de l’énonciateur rapportant 56 5. Typologie des citations 59 5 6. Pour conclure 60 IV. JUGEMENTS D’ÉVALUATION 61 A. BREF ÉTAT DES LIEUX 61 B. CONSTITUANTS DÉTACHÉS ET JUGEMENTS D’ÉVALUATION 63 1. Expressions qui ciblent des personnes 63 2. Des expressions aux patrons 64 3. Explorations outillées 66 4. Caractérisation ontologique, branchée sur le social et le culturel 69 5. Conclusion 70 BILAN ET PERSPECTIVES 71 BIBLIOGRAPHIE 73 ANNEXES 81 6 INTRODUCTION 1. Présentation du mémoire Le présent mémoire a pour principal objet de présenter de manière synthétique mon parcours de recherche et d’enseignement mené en linguistique appliquée au traitement automatique des langues (TAL). Il prend également acte d'un certain nombre d'incursions dans les champs voisins du TAL que sont la recherche d’information (RI), le Web sémantique (WS), l’ingénierie des connaissances (IC). Mon cheminement a abouti, l’évolution propre des disciplines concernées aidant, à la thématisation d'un objet, encore relativement peu étudié en linguistique et longtemps resté implicite dans les travaux appliqués du TAL, il s’agit de l’énonciation textuelle. Dans cet espace, je dégage une perspective de recherche autant que les grandes lignes d'une démarche originale. Il s’agit d'une élaboration en cours de constitution, aux influences et aux héritages multiples, dont je chercherai à montrer la cohérence, les retombées méthodologiques, ainsi que des prolongements envisagés. Comme la plupart des recherches à caractère appliqué, mes travaux ne se situent pas à l’intérieur d’un cadre théorique unique, mais empruntent à divers champs de savoir et croisent plusieurs méthodes. Je me réclame à la fois de la linguistique de l’énonciation, de la linguistique textuelle et de la linguistique informatique. Je pratique une linguistique « outillée », sur corpus, qui propose des contributions linguistiques à des problématiques et à des applications informatiques qui relèvent du traitement automatique des langues. Reconstituer mon itinéraire de recherche sur une quinzaine d’années, jalonné d’expériences variées, au sein des laboratoires CAMS (Centre d’Analyse et de Mathématiques Sociales) et LaLIC (Langage, Logique, Informatique et Cognition) et souvent en collaboration avec des chercheurs provenant d’autres laboratoires (LATTICE, GREYC, CRISCO, PRAXILING…), m’est apparu comme un exercice stimulant mais parfois difficile. Cette forme de synthèse oblige à revenir aux motivations premières, parfois enfouies, souvent résultant des opportunités de projets ou de rencontres, et à reconstruire le fil conducteur de ces années de recherche. Le travail de synthèse de l’HDR inclut également une auto-évaluation du parcours accompli. Et de ce fait permet de revenir sur ses difficultés et certaines de ses lacunes, auxquelles j’ai souhaité apporter une réponse. Il est important de considérer le travail accompli à la lumière des conditions scientifiques, matérielles et humaines dans lesquelles il s’est déroulé. Le spectre large des problématiques abordées va de concert avec des parcours sélectifs, où la problématisation n’est jamais exhaustive et où la contribution proposée doit être située dans un contexte scientifique et temporel précis. Je tenterai également de réinterroger ces différentes expériences à la lumière de mes travaux récents. A plusieurs titres, l’approche linguistique des jugements d’évaluation soulève des questions proches à celles que j’ai rencontrées en travaillant sur la causalité. Dans les deux cas, le caractère interprétatif des contenus analysés est avéré. La formule choisie ici est une synthèse sélective de mes travaux, focalisée essentiellement sur les contributions à l’étude de la subjectivité dans le discours. J’ai fait le choix de présenter en les détaillant les résultats les plus significatifs. Ce document permet en effet de réunir des études n’ayant jamais été mises en perspective ensemble. A chaque étape, je mentionne brièvement les travaux qui ne font pas l’objet d’un développement. Apres une brève présentation de mon parcours universitaire, j’exposerai ce qui constitue le fil conducteur de mon travail de recherche et les principaux choix théoriques effectués. Les réflexions méthodologiques précèdent et « indexent » quatre sections qui présentent quatre regards particuliers sur la texture énonciative des discours. L’ensemble s’achève par un bref bilan et l’exposé des directions que je souhaite prendre dans les années à venir. La section des Annexes inclut mon curriculum vitae détaillé. 7 2. Formation et parcours de recherche Arrivée en France en juin 1986, après avoir validé ma première année de Statistiques et d’économétrie à l’Université de Gdansk (Pologne), j’ai préparé un DUT d’informatique à l’IUT de Rodez (en Aveyron). J’ai opté ensuite pour les Sciences du Langage (en licence et en maîtrise) alliées à un Diplôme Universitaire des Sciences Cognitives pour l’ingénierie de la Connaissance, à l’Université de Toulouse-Le Mirail. C’est Andrée Borillo qui m’a accueillie dans ces deux formations et initiée à une linguistique tournée vers le formel et le TAL. J’ai réalisé sous sa direction une première étude linguistique sur les adverbiaux temporels et programmé un outil informatique permettant de systématiser le codage de ces adverbiaux. Cette formation a fortement orienté mon parcours ultérieur et ma manière de travailler. Premièrement, j’y ai découvert l’intérêt des approches pluridisciplinaires (alliant linguistique, psychologie cognitive, informatique, neuropsycho- linguistique). Deuxièmement, j’ai bénéficié d’un enseignement de l’informatique conçu pour le public de sensibilité littéraire. Cette expérience a influencé ma propre manière de travailler avec les étudiants littéraires, des années plus tard, notamment dans le cadre de la licence Langue française et Techniques informatiques (à Paris 4).