Corpus

12 | 2013 Dialectologie : corpus, atlas, analyses

Rita Caprini (dir.)

Electronic version URL: http://journals.openedition.org/corpus/2287 DOI: 10.4000/corpus.2287 ISSN: 1765-3126

Publisher Bases ; corpus et langage - UMR 6039

Printed version Date of publication: 1 January 2013 ISSN: 1638-9808

Electronic reference Rita Caprini (dir.), Corpus, 12 | 2013, « Dialectologie : corpus, atlas, analyses » [Online], Online since 12 May 2014, connection on 24 September 2020. URL : http://journals.openedition.org/corpus/2287 ; DOI : https://doi.org/10.4000/corpus.2287

This text was automatically generated on 24 September 2020.

© Tous droits réservés 1

TABLE OF CONTENTS

Présentation Rita Caprini

Les atlas linguistiques sont-ils des corpus ? Esther Baiwir and Pascale Renders

Parole e testi : l’esperienza di un atlante Sabina Canobbio

Le Baiser de la Belle au bois dormant ou : des péripéties encourues par la géographie linguistique depuis Jules Gilliéron Hans Goebl

Concordances géolinguistiques et anthroponymiques en Bretagne Daniel Le Bris

Le Thesaurus Occitan : entre atlas et dictionnaires Patrick Sauzet and Guylaine Brun-Trigaud

Perception catégorielle et pertinence référentielle. Le cas des animaux domestiques en domaine occitan Albert Malfato

La trajectoire de la dialectologie au sein des sciences du langage. De la reconstruction des systèmes dialectaux à la sémantique lexicale et à l’étymologie Jean-Philippe Dalbera

Aréologie de la réduction vocalique incompatible avec le RF induit par l’accent dans les variétés italo-romanes Jonathan Bucci

Stratégies de topicalisation en occitan Richard Faure and Michèle Oliviéri

Testing linguistic theory and variation to their limits: The case of Romance Adam Ledgeway

Compte rendu

Alain CHEVRIER — Le Décasyllabe à césure médiane. Histoire du taratantara. Paris : Classiques Garnier, coll. « Etudes romantiques et dix-neuviémistes » 18, 2011, 405 pages, 49 €. Gérald Purnelle

Corpus, 12 | 2013 2

Présentation

Rita Caprini

1 L’édition scientifique de la revue CORPUS, que le comité de rédaction m’a confiée (et je le remercie de sa confiance), porte le titre de « Dialectologie : corpus, atlas, analyses » qui exprime bien la complexité de la tâche que certains linguistes (mes linguistes préférés…) abordent, non seulement pour composer ce numéro de la revue, mais aussi dans leur travail quotidien. Comme il fallait s’y attendre, mon appel, diffusé il y a une année, a obtenu un bon pourcentage de soumissions qui regardent les atlas linguistiques, étant donné que mon nom est désormais connu surtout pour mon travail dans le domaine de la géographie linguistique.

2 Ce numéro contient donc dix interventions, parmi lesquelles trois (Baiwir & Renders, Canobbio et Goebl) concernent strictement les atlas linguistiques (considérés comme corpora) ; un (Le Bris) est dédié à l’onomastique (autre discipline que j’aime beaucoup) ; Sauzet & Brun-Trigaud participent au débat sur la codification graphique de l’occitan, à partir des données du Thesaurus Occitan, base de données qui est l’objet aussi d’autres articles de ce numéro de CORPUS ; la contribution de Malfatto porte sur le recueil et l’analyse des données en dialectologie, à partir d’exemples lexicaux précis empruntés justement au Thesaurus Occitan ; Dalbera pose le problème général de la place de la dialectologie au sein de la linguistique générale et analyse la méthode de reconstruction qui a permis de rénover les études lexicales. Enfin, ce numéro se termine par trois études linguistiques appliquées à des données dialectales : l’une (Bucci) s’intéresse à deux processus phonologiques de certains dialectes d’Italie ; les deux autres sont des études de syntaxe, avec un article (Faure & Oliviéri) consacré à la topicalisation en occitan et un article (Ledgeway) qui montre l’importance du rôle des données romanes, et surtout de celles tirées des variétés non-standard, dans l’évaluation et dans l’enrichissement des théories syntaxiques actuelles.

3 Je vais à présent discuter brièvement les résultats du travail des auteurs.

4 Esther Baiwir et Pascale Renders, chargées de recherches FNRS à l’Université de Liège, présentent un projet d’informatisation des atlas linguistiques pour les rendre plus accessibles à la communauté scientifique. Un tel projet est à l’étude pour l’Atlas linguistique de la Wallonie (ALW), un atlas interprétatif, dans lequel les matériaux bruts ont été enrichis par l’apport de diverses informations, de types phonétique,

Corpus, 12 | 2013 3

étymologique, historique et ethnographique. Pour les auteurs, la même chose vaut pour les atlas basés sur des sources secondaires, tels que l’Atlas Linguistique Roman. L’atlas informatisé deviendrait ainsi un corpus pour des études portant sur le(s) dialecte(s) considéré(s). Un des problèmes du projet est constitué par la transcription phonétique des formes, étant donné que chaque système de transcription est en lui-même une interprétation. Le problème de la transcription est affronté par d’autres auteurs de ce numéro de CORPUS, et les solutions proposées sont différentes. A propos de l’informatisation des atlas linguistiques, je dois ajouter, et je parle par expérience, que les atlas linguistiques sont en général des objets peu maniables et très coûteux. Il faut y penser.

5 Sabina Canobbio (Università di Torino) nous parle de son travail à l’ALEPO (Atlante linguistico ed etnografico del Piemonte occidentale, trois volumes déjà parus chez les Edizioni dell’Orso, Alessandria : I. La fauna, II. Caccia e pesca, III. Il mondo animale). Canobbio esquisse un bilan de son expérience, du recueil des données à la constitution d’un corpus « imposant et complexe », dans lequel les ethnotextes jouent un rôle particulier. Ces textes sont des chansonnettes d’enfants, des devinettes etc., qui ont fait la différence par exemple entre des grandes œuvres de la géographie linguistique comme l’Atlas Linguistique de France et l’Atlante Italo Svizzero. Dans l’AIS, la partie ethnographique est souvent imposante (il suffit de revoir la carte des noms de coccinella septempunctata littéralement couverte par des ethnotextes qui ont déjà fait l’objet de nombreuses études).

6 Le but de l’article de Hans Goebl (Université de Salzburg) est d’analyser le substrat méthodique et idéologique de l’ALF et de son créateur Jules Gilliéron, mort en 1926. L’auteur se demande pourquoi les atlas linguistiques ont vu la lumière en France et pas ailleurs. La réponse se trouve dans la départementalisation de la France survenue après la Révolution Française, qui a créé une nouvelle conscience de l’espace national basée sur l’idée de quadrillage, de l’équidistance et de la parité fondamentale des nouvelles subdivisions territoriales et a offert des nouvelles possibilités pour les intellectuels œuvrant au service de l’administration nationale. La différence avec d’autres pays, comme l’Italie, et d’autres atlas, comme l’AIS, est bien évidente. Il suffit de regarder, dans les atlas comme l’ALiR ou l’ALE auxquels nous travaillons aujourd’hui, la différence entre le quadrillage français et celui des autres pays… Pour Goebl, la bipartition linguistique de la France en Oc et Oïl a fini par devenir une pomme de discorde scientifique et presque un risque pour l’unité de la nation. En Allemagne, la même question s’est posée pendant le XIXe siècle pour la frontière linguistique entre Hoch- et Niederdeutsch, question qui a aussi aidé la géographie linguistique à se développer comme science autonome au sein de la linguistique. Goebl souligne que pour faire d’un atlas un corpus utilisable par tous il faut s’en tenir aux principes de la collecte sélective de données, en laissant de côté les réponses doubles trop nombreuses (« Qui trop embrasse, peu étreint »). De ce principe s’est inspiré l’ALD (Atlante linguistico del ladino dolomitico e dei dialetti limitrofi) de Goebl.

7 Daniel Le Bris (CRBC Brest, UBO-UEB) prend en compte les patronymes des personnes nées entre 1891 et 1990 dans les cinq départements de la Bretagne historique, à partir de l’ensemble des fichiers patronymiques conservés par l’INSEE (Institut National de la Statistique et des Etudes Economiques). Un nouveau logiciel permet maintenant de cartographier tous ces fichiers. Le territoire considéré par Le Bris constitue la zone celtique de la péninsule armoricaine, et les cartes produites par l’auteur nous

Corpus, 12 | 2013 4

permettent de constater la longue durée des frontières linguistiques : voir par exemple la carte 2 « Anciens territoires gaulois en Armorique ». Le Bris constate en conclusion la relative inertie de la population bretonne sur plusieurs siècles, et la concordance entre aires linguistiques et aires culturelles dans la péninsule armoricaine. Cette concordance pourrait bien s’inscrire dans le paysage depuis l’Age des Métaux. Je souligne que le travail de Le Bris nous aide encore une fois à hausser les dates de l’histoire linguistique d’Europe. En ce qui concerne l’étude des noms de famille, il faut noter que ce champ de travail n’est fouillé, avec une certaine régularité, que depuis quelques dizaines d’années. Nous disposons certainement d’un travail séculaire des linguistes surtout sur l’étymologie des noms de famille en Europe, mais depuis peu seulement les données onomastiques sont abondamment mises à la disposition des chercheurs, grâce surtout au traitement informatique des données, qui demandait jadis une grande fatigue manuelle.

8 Patrick Sauzet (Université Toulouse-Le Mirail) et Guylaine Brun-Trigaud de l’UMR 7320 « Bases, Corpus, Langage » déjà citée ci-dessus, se proposent de présenter la logique de la codification graphique « classique » de l’occitan, en partant des données du THESOC. La graphie « classique » et celle « mistralienne » ont des traits en commun et des différenciations que l’article se propose d’illustrer.

9 Albert Malfatto de l’Université Nice Sophia Antipolis travaille sur des corpora lexicaux dialectaux et participe à des enquêtes de terrain. Le corpus utilisé pour cette étude est issu de la base dialectale occitane Thesaurus Occitan (THESOC) qui regroupe les données dialectales occitanes qui se trouvent dans les Atlas linguistiques et ethnographiques de France par régions, avec les données supplémentaires recueillies par l’équipe de dialectologie du laboratoire dans lequel Malfatto travaille (UMR 7320 « Bases, Corpus, Langage », CNRS / Université Nice Sophia Antipolis). Les localités présentes dans la base sont au nombre de 845. Malfatto nous présente une réflexion sur le thème de l’élevage, il examine en particulier les dénominations dialectales du système notionnel des ânes, ce qui lui permet de conclure que les catégorisations établies par les communautés des locuteurs sont souvent plus complexes que le niveau de détail sollicité par le questionnaire lexical.

10 Jean-Philippe Dalbera, de l’Université Nice Sophia Antipolis, nous offre une discussion sur la dialectologie comme science. Il se demande si elle est devenue « une discipline vieillotte, passéiste, folkloriste, un savoir superflu », une discipline mineure pour les linguistes, l’étude des parlers locaux moribonds, qui semble s’occuper parfois seulement de favoriser la diffusion et promouvoir l’enseignement de telles langues à des générations qui ne la connaissent plus. En réponse à ces questions, Jean-Philippe Dalbera souligne le maître-mot-clé définitoire de la dialectologie qui est reconstruction. En effet, ce qui caractérise la dialectologie c’est la prise en compte conjointe du temps et de l’espace.

11 Le principe de la reconstruction a été bien appliqué aux domaines de la phonologie et de la morphologie. Le secteur du lexique l’a beaucoup moins sollicité. Nous avons essayé, Dalbera, moi et quelques autres, de remédier à ce manque, suivant surtout le sillage de Mario Alinei. La grande difficulté de cette démarche est que les chercheurs doivent travailler avec leur esprit et leurs représentations modernes, c’est-à-dire exactement avec l’outil qui a le plus changé au cours des derniers siècles… Il est difficile pour le chercheur qui se penche aujourd’hui sur la reconstruction sémantique dans le domaine des parlers locaux de comprendre comment les locuteurs pouvaient autrefois

Corpus, 12 | 2013 5

croire qu’un oiseau sauvage soit l’ancêtre ou bien le père nourricier des hommes et des femmes de son village, mais c’est pourtant bien cela dont on a la trace. Et c’est ainsi que l’on trouve un père-loriot et une « tante renarde » etc. un peu partout dans la Romania, comme on peut le voir dans les données des atlas linguistiques. Et qui se souvient encore qu’autrefois on offrait sur une petite table du pain et du fromage à la belette, comme à un dieu, pour l’adorer ou bien pour détourner son inimitié ? Qui pourrait aujourd’hui craindre qu’une chenille puisse sucer le sang d’un homme jusqu’à sa mort ? Je cite ici des croyances qui ont donné origine à plusieurs noms romans des petites bêtes citées. Autant de dénominations qui ont constitué de notoires cruces de la recherche étymologique.

12 Dalbera propose donc ici un outil très performant pour la reconstruction sémantique, le cycle qui va de la motivation, à la convention, à l’arbitraire, pour recommencer avec une nouvelle motivation (remotivation), et cela sans fin. La démarche étymologique classique constate que la forme phonique est opaque, qu’il n’y a pas un mot latin auquel la relier, et tourne court. Seule la reconstruction sémantique, avec son cycle, permet de trouver l’explication de nombreux mots opaques des langues romanes.

13 La dialectologie n’est donc pas la discipline « défaite, moribonde » que ses voisins rognent de toutes parts, mais elle a retrouvé une place de choix au sein des sciences du langage avec l’idée d’une double reconstruction des deux plans du signe, en proposant la reconstruction du signifié à partir du motif utilisé comme clef.

14 Jonathan Bucci de l’Université Nice Sophia Antipolis nous offre la seule intervention phonologique de ce numéro. Il se propose d’étudier deux processus phonologiques bien distincts qui sont la réduction des voyelles atones à schwa que l’on trouve dans certains dialectes italiens et le redoublement phono-syntaxique induit par l’accent (Raddoppiamento Fonosintattico). L’enquête est conduite sur le coratin, un dialecte de l’aire apulo-barese parlé dans la ville de Corato située dans la région des Pouilles à environ 40 km au nord de Bari. Le raddoppiamento fonosintattico induit par l’accent est un processus de sandhi externe qui consiste, dans une séquence [mot1+mot2], à redoubler la consonne initiale du second lorsque la voyelle finale du premier est tonique (ex : città ppulita vs casa pulita). L’objectif de l’article de Bucci est de montrer que les deux phénomènes sont incompatibles, i.e. qu’aucun système ne peut les combiner.

15 Richard Faure et Michèle Oliviéri (Université Nice Sophia Antipolis) placent leur intervention dans le cadre de la grammaire générative, dont les dernières avancées permettent de repenser un problème d’ordre syntaxique comme la topicalisation en occitan. Le matériel linguistique sur lequel les auteurs travaillent est fourni par les études de Lahne et Sauzet et également par la base de textes du Thesaurus Occitan, qui est exploité aussi par d’autres auteurs de ce numéro de CORPUS. Les divers types de dislocation / topicalisation dans les langues romanes ont été bien décrits depuis les années 1980 et Faure & Oliviéri observent que les dialectes occitans modernes ont développé une stratégie particulière : dans la périphérie gauche de la proposition, on trouve une tête fonctionnelle porteuse d’un trait fort entraînant une topicalisation « suspendue » dans les subordonnées, et les dialectes occitans montrent une partition en fonction de ce paramètre. Cette « troisième topicalisation » en occitan pourrait faire de cette langue un isolat parmi les langues romanes, malgré des phénomènes ressemblants dans certains dialectes italiens.

Corpus, 12 | 2013 6

16 Adam Ledgeway (University of Cambridge) dans son imposant article se propose de mettre en relief, en puisant dans les données des variétés dialectales romanes, l’importance de leur rôle dans l’enrichissement des théories syntaxiques actuelles. Ledgeway travaille sur des corpora rassemblés par lui-même pendant ses recherches surtout en Italie et discute de nombreux exemples sur le problème du sujet nul, l’ordre des mots, la position du verbe ou de l’adjectif dans la phrase, etc. Il constate que la variation typologique dans les langues romanes (et dans l’indo-européen) est plus grande que celle que la tradition admet. En conclusion, il démontre encore une fois la grande importance de la linguistique romane pour les études de linguistique générale. En effet, les corpora recueillis dans les dictionnaires (comparés et dialectaux) et les atlas linguistique de l’aire romane, ajoutés à la grande histoire du latin, nous aident à comprendre la variation dans le temps et l’espace qui dans d’autres traditions linguistiques (en Europe et ailleurs) est plus difficile à discerner.

AUTHOR

RITA CAPRINI Università di Genova

Corpus, 12 | 2013 7

Les atlas linguistiques sont-ils des corpus ?

Esther Baiwir and Pascale Renders

1 Les atlas linguistiques, qui recueillent une part plus ou moins grande des lexèmes dialectaux d’une région donnée, peuvent-ils être considérés comme des corpus et exploités comme tels ? Cette interrogation survient inévitablement dès qu’il est question d’informatiser ces atlas afin de les rendre accessibles à la communauté scientifique, car les fonctionnalités offertes – et, donc, le traitement informatique de départ – doivent être pensées en fonction des objectifs de l’informatisation et de ce que l’on souhaite proposer à l’utilisateur. Un tel projet est à l’étude pour l’Atlas linguistique de la Wallonie (ALW) avec, dans un premier temps, l’intégration d’échantillons des publications dans des bases de données, exploitables via une interface de consultation en ligne. La question d’une exploitation comme corpus se révèle particulièrement délicate dans le cas de cet atlas, qui a la particularité de proposer une analyse des matériaux qu’il rassemble en les structurant au sein de notices. Pour rendre ces matériaux atteignables par des moteurs de recherche, il est nécessaire de les transformer en séries de listes sur lesquelles peuvent porter des requêtes, traitement qui a pour conséquence directe la perte des informations apportées par l’analyse. La question se pose, dès lors, de savoir si la réduction ainsi opérée est pertinente et si certaines de ces informations ne doivent pas être conservées. Par ailleurs, l’analyse a pu modifier le corpus initial d’une façon qui ne permet plus l’accès aux données brutes de départ. Après quelques considérations d’ordre général, nous donnerons deux exemples de cas qui posent question dans une optique de création d’un corpus atlantographique informatisé.

1. L’atlas comme corpus

2 Il semble légitime de considérer qu’un atlas linguistique, qui recueille une part plus ou moins grande des lexèmes dialectaux d’une région donnée, puisse servir de corpus pour des études portant sur le dialecte considéré. Pourtant, catégoriser ce type de corpus atlantographique n’est pas évident. Il s’agit, certes, d’un corpus d’unités de langue et

Corpus, 12 | 2013 8

non d’un corpus de textes, mais ces unités sont atteintes via des réalisations concrètes qui sont de l’ordre du discours. Ces matériaux relèvent de l’oralité, mais ne peuvent être édités qu’à travers leur transcription. Le corpus n’est jamais exhaustif, mais il tend parfois à l’exhaustivité, selon l’ambition de l’enquête de départ. Il n’est pas nécessairement construit pour être représentatif, mais il l’est en pratique. Les données sont de caractère brut au départ, mais peuvent être présentées sous une forme traitée, selon le type d’atlas. La question de savoir si le corpus contitué par l’atlas est de l’ordre du donné ou du construit n’est pas simple : elle dépend également du type d’atlas.

3 La cause de ces problèmes de catégorisation provient en partie du fait que l’atlas lui- même est le résultat de l’exploitation et de l’analyse d’un corpus. La plupart des atlas linguistiques, à l’exception des atlas se basant sur des sources secondaires (tels que l’ALiR), sont établis à partir d’une enquête dialectale sur le terrain, destinée à recueillir un ensemble le plus complet possible de faits linguistiques propres à la région considérée. Cette enquête préalable est généralement constituée d’unités plus ou moins complexes, soit à traduire, soit à susciter chez le témoin. Quelle que soit la méthode d’enquête, l’ensemble des matériaux recueillis constitue un corpus proprement dit, qui peut être considéré comme représentatif en ce qu’il devrait permettre de se faire une idée assez complète et précise des particularités linguistiques propres aux parlers de la région. Evidemment, nul n’ambitionne de recueillir l’ensemble d’un parler et représentativité ne signifie pas prédictibilité ; les unités du lexique qui n’auront pas été intégrées à l’enquête ne pourront que rarement être déduites des autres unités appartenant au même champ sémantique ou à la même famille lexicale, eu égard à l’inscription de notre objet dans l’humain et dans l’histoire. Notre postulat est pourtant que le corpus constitué par l’enquête offre bien un échantillon représentatif de faits linguistiques. Il s’agit d’un corpus brut, non encore remodelé par l’analyse (v. Dalbera 2002 : 2) ; il s’agit d’un corpus relevant de l’oralité, mais néanmoins soumis à une transcription écrite, ce qui peut poser, en pratique, certains problèmes sur lesquels nous reviendrons.

4 Les atlas, qui éditent et publient les matériaux récoltés par l’enquête, sont-il également susceptibles de servir de corpus ? La réponse est différente selon le type d’atlas pris en compte. Une distinction est généralement opérée entre les atlas proposant des matériaux d’enquête bruts, non interprétés, et ceux dits interprétatifs, dont l’ambition est de guider le lecteur en lui fournissant les clés de la matière. Les premiers proposent une reproduction exacte – sous une forme principalement cartographique, même si des franges de matériaux annexes sont souvent relégués en marge des cartes – des matériaux de l’enquête : ils peuvent de ce fait (et moyennant un encodage des formes) être considérés comme un corpus au même titre que cette dernière. Quand il y a eu soit une transcription, soit une homogénéisation des pratiques des enquêteurs, soit encore une sélection des matériaux (par exemple l’extraction d’un mot du contexte phrastique de l’enquête ou l’exclusion d’un individu peu sûr), on peut déjà considérer ce corpus comme légèrement différent du corpus initial, un filtrage s’étant opéré au sein de la masse des matériaux, mais le corpus est toujours de l’ordre du donné.

5 Le second type d’atlas constitue un cas plus complexe. Les matériaux publiés dans un atlas interprétatif tel que l’ALW ont en effet été enrichis par l’apport de diverses informations, de type phonétique, étymologique, historique, voire ethnographique (v. Boutier 2008 : 309-310). Les notices qui en résultent constituent des monographies onomasiologiques, rédigées, proposées à la lecture linéaire, qui ne constituent pas

Corpus, 12 | 2013 9

stricto sensu un corpus, mais une analyse du corpus constitué par les enquêtes initiales. Un atlas interprétatif se situe donc à un second niveau par rapport au corpus. Cependant, au-delà de l’aspect monographique, l’atlas est aussi perçu comme un thesaurus, rassemblant tous les lexèmes d’un ou de plusieurs dialectes. Cette perception comme thesaurus explique qu’il puisse être considéré comme un corpus au même titre que l’enquête et ce malgré sa présentation monographique, peu apte à permettre cette fonction.

6 Dans le cadre d’un projet d’informatisation qui vise à mettre les données linguistiques wallonnes à la disposition des utilisateurs sous une forme plus accessible et, éventuellement, comme un corpus utilisable en tant que tel, on peut se demander si ce n’est pas la liste des mots recueillis par l’enquête qui devrait être informatisée, plutôt que les notices de l’ALW. Considérant (1) que l’atlas a pour objectif initial et premier d’éditer l’enquête et de la présenter au lecteur de façon accessible ; (2) qu’il n’y a aucune différence quantitative entre l’enquête et l’atlas, la totalité des unités lexicales de l’enquête étant reprises dans ce dernier ; (3) que le traitement effectué dans l’atlas ajoute à ce contenu lexical des informations sans en retrancher aucune, la réponse nous semble évidente. La publication des matériaux récoltés par l’enquête fait effectivement de l’ALW, malgré sa forme monographique, un véritable thesaurus des dialectes belgoromans. Le chercheur qui refuserait à l’ALW le statut de corpus se priverait du seul matériau assuré pour ce champ d’étude.

7 Il apparaît donc pertinent de permettre à l’ALW d’être utilisé comme un corpus d’unités de langue, en gardant à l’esprit le fait que l’édition des matériaux bruts fournis par l’enquête y a été accompagnée d’un enrichissement et que les deux niveaux, celui des matériaux et celui de l’analyse, sont intimement mêlés dans la structure même des notices de l’atlas. Cette particularité rend nécessaire l’informatisation de l’atlas, cette informatisation étant le seul moyen efficace de donner accès à ce corpus en l’extrayant de la couche d’analyse.

2. L’accès au corpus atlantographique

8 Donner accès au corpus revient, en pratique, à extraire de l’atlas la liste des mots de l’enquête accompagnés de leur localisation (l’enquête associant à chaque forme le point d’enquête où elle a été recueillie). Cette extraction n’est pas triviale, la présentation monographique de l’atlas ayant pour conséquence de rendre implicite cette relation.

[1] Ainsi, à la notice BAVARDER (ALW 17, not. 113), après l’introduction et les divers renvois bibliographiques, l’un des paragraphes de matériaux se présente comme suit : F. 1. +calôder…:33 kalṓdḗ Mo 1, 42, 79; S 19, 31, 37; Ch 16, 26, 63, ‘64, 72 (arch.); […].

9 L’opération consistant à extraire de l’ALW le corpus de matériaux revient à effectuer une réduction par rapport à l’enrichissement opéré par l’analyse. En particulier, l’introduction explicative située en tête de notice a été perdue, ainsi que la note 33 ou la classification (F.1.) intégrant cette forme dans une vision globale des verbes édités dans la notice. En outre, l’automate devra restituer la totalité de la localisation géographique, pour partie perdue dans la version papier ; si le premier point est bien Mo 1, le deuxième est Mo 42 (et non 42), puis Mo 79, etc.

Corpus, 12 | 2013 10

10 Dans ce processus de réduction informatisée, il nous semble toutefois qu’une part de l’analyse gagnerait à être conservée. Nous en donnons ci-dessous deux exemples, à propos de la graphie des formes et à propos de leur étymologisation.

2.1 Transcription phonétique des formes

11 Les listes de formes dialectales sont, dans les atlas de faits, simplement transcrites dans des systèmes phonétiques. La transformation de ces atlas en corpus informatiques semble à la portée de tout informaticien, et pourtant. De telles entreprises, en France par exemple, ont rapidement été confrontées à diverses difficultés, parmi lesquelles la saisie des formes, eu égard à la multiplicité des signes diacritiques : [L]a disparité des notations phonétiques a amené à la création pour chacun des atlas de son propre alphabet phonétique avec codage particulier. Une comparaison attentive de plusieurs atlas a en effet révélé que chaque auteur a apporté pour son propre usage des modifications au système Rousselot, non seulement en fonction des particularités de son terrain d’enquête, mais aussi à partir de ses propres conceptions de la notation et donc, en dernière analyse, de sa personnalité. (Le Dû 1992 : 304)

12 Il n’en va guère autrement des enquêtes pour l’ALW. Celles-ci furent menées par de multiples enquêteurs, sur une longue période (entre 1924 et 1959). Chacun, comme au sein des atlas de France par régions, a forgé son petit système personnel. Il suffira pour s’en convaincre de comparer les documents ci-dessous, représentant la même réalisation phonétique :

Illustration 1. Exemple de fiches d’enquête : question 1820 « pile ou face »

13 L’expression est traduite, dans les quatre cas, par une locution composée de type . Le premier élément se prononce de la même façon dans les quatre cas. Deux enquêtes (To 37 et To 99) conservent un e, uniquement graphique, issu de la connaissance que les enquêteurs ont du français ; ces enquêteurs utilisent un système graphique qui vogue entre précision phonétique et représentation plus intuitive par rapport à la graphie de la langue source qui, en l’occurrence, est aussi une langue sœur. En revanche, la partition est différente pour l’indication de brièveté du -i- : ce sont les enquêteurs de To 37 et de B 22 qui sont plus précis. Ce signe de brièveté n’est pourtant

Corpus, 12 | 2013 11

pas nécessaire ; par défaut, les -i- de l’enquête sont toujours brefs. Si aucune des deux divergences n’est problématique pour un lecteur rompu à l’exercice, il est intéressant de constater quatre graphies distinctes pour une seule réalisation phonétique. Au passage se voit encore, pour la traduction de la conjonction, l’opposition entre notation phonétique (un u spécifiquement en usage parmi les dialectologues wallons) et analogie avec le français (ou). L’accolade ajoutée à l’enquête de To 99, où l’enquêteur mentionne les deux versions, montre bien l’instabilité du système.

14 Comment, dès lors, envisager des requêtes informatiques transversales sur des listes aussi disparates ? N’est-ce pas conduire l’utilisateur dans un mur ? Diverses options se présentent pour l’informatisation. La première, qui est exploitée dans la rétroconversion du FEW (v. Renders 2011 : 137), est celle de longues listes de pseudo- équivalences permettant la neutralisation d’oppositions graphiques. La machine peut par exemple ignorer les diacritiques ou considérer « β » et « b » comme interchangeables. Cette solution permet une certaine souplesse d’utilisation ; même l’utilisateur maîtrisant mal les conventions phonétiques de tel ou tel enquêteur peut espérer une réponse à sa requête.

15 Dans un atlas interprétatif comme l’ALW, ces divergences ont pour particularité d’être neutralisées par les rédacteurs eux-mêmes. Les données de l’enquête sont en effet transcrites dans le système orthographique d’usage pour les dialectes belgo-romans : l’orthographe dite Feller, du nom de son inventeur (v. Feller 1905 ; Pierret 1992 ; il s’agit de la forme en caractère gras de l’exemple 1). Ce système graphique est basé sur un double principe : il s’appuie sur l’orthographe française, mais tente de noter précisément la prononciation. Les variantes phonétiques minimes sont neutralisées – par exemple, la différence de timbre entre API a, ä et ɑ, de même que des différences graphiques représentant le même son, comme ḗ, ḗÚ ou ÈÚ. Simplification, réduction d’un côté, mais enrichissement de l’autre : le système Feller intègre, comme l’orthographe du français, des signes muets donnant des informations morphologiques ou permettant de distinguer des homophones.

[2] Ainsi, Nos-èstans fîrs d’èsse Lîdjwès correspond à la notation phonétique suivante : noz èstã fi:r d ɛs li:dzwɛ. Le -s de nos permet l’identification du pronom personnel, mais également la liaison avec le verbe qui le suit. Le -s de celui-ci identifie le morphème -ans comme un morphème verbal de première personne du pluriel (comp. fr. -ons) ; le -s de fîrs est la marque du pluriel. Quant au -s de Lîdjwès, il permet de subodorer la forme de l’adjectif féminin (Lîdjwèse).

16 On le voit, le système Feller est en lui-même une interprétation. Il convient d’analyser l’énoncé avec justesse pour pouvoir le graphier. Ce traitement modifie le corpus de départ, mais il améliore la lisibilité des unités, tant au niveau visuel que morphologique. Prendre pour départ d’une informatisation une version en orthographe Feller des matériaux belgo-romans écarte le problème des habitudes individuelles des enquêteurs, mais aussi la question des signes diacritiques complexes des transcriptions phonétiques (en italique dans l’ALW ; v. exemple 1), inexistants en Feller. Remarquons que l’existence de cette orthographe normalisée n’interdit pas de mettre en place un système informatique de neutralisation des oppositions graphiques. Dans le cas d’une variété de tradition orale, le public n’est guère rompu à l’exercice d’écriture et il n’est pas raisonnable de demander à l’utilisateur d’une interface de

Corpus, 12 | 2013 12

consultation informatique d’introduire correctement les accents sur les voyelles, par exemple.

2.2 Etymologisation des formes

17 Au point de vue technique et dans nos disciplines, un corpus informatisé prend généralement la forme de documents textuels électroniques qui sont interrogeables par ordinateur. En fonction des interrogations prévues, les divers types d’information contenus dans ces documents textuels peuvent être balisés, c’est à dire annotés, de façon à permettre à un automate de les identifier et de les retrouver. Ce balisage permet également d’élaborer des index, qui optimisent la recherche d’informations dans le corpus en fonction des besoins de l’étude.

18 Une recherche de matériaux dans une base de données textuelles (le terme « base de données » étant ici à comprendre au sens large) nécessite donc que soient définis les types d’information pertinents pour l’analyse. Dans le cas de l’ALW, il s’agit par exemple de la liste des unités lexicales éditées dans l’atlas, ainsi que les points d’enquête (localisation géographique) où ont été relevées ces formes. Ces deux types d’information correspondent aux matériaux de l’enquête initiale ; leur annotation (ou balisage) permet d’accéder au thesaurus lexical qu’est l’atlas. Que penser, en revanche, des types d’information ajoutés par l’analyse aux matériaux de l’enquête, tels que les étymons, qui relèvent de l’analyse et du mode monographique de l’atlas ? Ils ne font pas partie du corpus proprement dit, mais ils constituent une voie d’entrée permettant d’accéder aux matériaux selon un angle d’étude particulier ; à ce titre, ils sont évidemment d’un grand intérêt pour l’utilisateur. En outre, ils sont facilement balisables et constituent une facette précieuse des matériaux.

19 Le travail d’étymologisation des formes effectué par les rédacteurs de l’ALW peut donc être intégré dans l’ensemble des informations offertes par le corpus. L’apport de cette intégration est important, car il donne une visibilité plus grande au travail d’étymologisation. En effet, en l’état actuel, cette information est donnée au fil du texte et se découvre, pour le lecteur, uniquement dans une consultation de type monographique de l’ouvrage. L’outil que constituent les index étymologiques, présents dans les volumes les plus récents, permet de dépasser cette lecture, mais pas complètement ; il reste en effet cantonné aux seuls domaines sémantiques traités dans le volume consulté. Une informatisation intégrant cette analyse permet de porter un regard plus large sur la matière.

[3] Examinons par exemple l’étymon latin GAMBA, traité FEW 2, 111 sous CAMBA. Si l’on peut assez facilement soupçonner qu’une requête informatique pointera vers le sens ‘jambe’ (dont toutes les variantes phonétiques sont présentées ALW 1, not. et c. 52 JAMBE), on sera plus surpris de trouver un sens ‘lobe ou cuisse de noix’ (v. ALW 6, not. 80 AMANDE DU NOYAU, n. 3 et not. 123 BROU DE LA NOIX, β et n. 57), ayant parfois évolué en ‘amande du noyau (d’un fruit)’ (v. ALW 6, not. 80, H). Un automate permettra même au non initié de faire le lien avec le type , signifiant parfois ‘bébé’ (ALW 17, not. 26 BEBE, J et n. 12), plus souvent ‘enfant’ (ALW 17, not. 34 GARÇON, E, not. 38 gamin, D, etc.) ou avec le collectif ‘marmaille’ (ALW 17, not. 33, D et n. 7). Un autre type suffixé en <-illon> apparaît ALW 15, sous la forme gambiyons ‘mal aux cuisses, d’avoir marché’ (ALW 15, not. 53 «ENTREFESSON», n. 8). L’étymon est encore illustré par des formations verbales, telles que

Corpus, 12 | 2013 13

, apparaissant sous plusieurs réalisations phoniques (ALW 17, not. 99 je les ai fait DÉGUERPIR, n. 65 ou not. 105 SANS HÉSITER, SANS TORTILLER, SANS DÉTOUR, R’ 12) ou s’ingåmbier ‘trébucher’ (ALW 15, not. 29, L et n. 16).

20 Nul doute que les utilisateurs d’une base de données produisant en temps réel une telle liste de formes issues du même étymon découvriront rapidement l’intérêt de l’outil.

Conclusion

21 Parmi les sources géolinguistiques, les corpus exploitables informatiquement sont à l’image des atlas : divers, plus ou moins construits, bruts ou enrichis. On l’aura compris, la richesse des corpus informatisés et consultables émanant des divers atlas linguistiques dépendra donc de la conception même de ces atlas ; il revient à chaque équipe la responsabilité de s’interroger sur les données utiles, voire nécessaires à une « corpus‑isation » de leur atlas.

22 Les deux types d’enrichissements présentés ci-dessus, l’étymologisation des formes et la transcription en orthographe Feller, ne sont que des exemples d’informations intégrables dans le cadre de l’informatisation de l’Atlas linguistique de la Wallonie, qui rendent le corpus plus riche que le corpus constitué par les enquêtes initiales. D’autres apports des rédacteurs mériteraient certainement d’être analysés en vue d’une intégration dans le projet d’informatisation.

23 Il reste à souhaiter que ces nouvelles voies d’accès à l’ALW en tant que thesaurus incitent les utilisateurs à entrer dans la dimension monographique de l’œuvre.

BIBLIOGRAPHY

ALiR = Contini M. et al. (éd.) (1996-). Atlas Linguistique Roman. Roma : Istituto Poligrafico e Zecca dello Stato.

ALW = Remacle L., Legros E. et al. (1953-.). Atlas linguistique de la Wallonie (10 volumes). Liège : Université de Liège.

Boutier M.-G. (2008). « Cinq relations de base pour traiter la matière géolinguistique : réflexions à partir de l’expérience de l’Atlas linguistique de la Wallonie », Estudis Romànics 30 : 301-310.

Dalbera J.-P. (2002). « Le corpus entre données, analyse et théorie », Corpus [En ligne], 2|2002, mis en ligne le 15 décembre 2003, consulté le 1er mars 2013. URL : http://corpus.revues.org/10.

Feller J. (1905). Règles d’orthographe wallonne. Liège : Vaillant-Carmanne (BSW 41/2 : 45-96).

Le Dû J. (1992). « L’informatisation des atlas linguistiques de la France », in Actes du Congrès International de Dialectologie, IKER 7. Bilbao : Académie de la langue basque, 299-317.

Pierret J.-M. (1992). « La notation courante des langues romanes : “l’orthographe Feller” », in W. Bal (coord.) Līmēs I. Les langues régionales romanes en Wallonie. Bruxelles : Traditions et Parlers populaires Wallonie-Bruxelles, 25-33.

Corpus, 12 | 2013 14

Pop S. (1950). La dialectologie. Aperçu historique et méthodes d’enquêtes linguistiques. Louvain : chez l’auteur, 1950.

Renders P. (2011). Modélisation d’un discours étymologique. Prolégomènes à l’informatisation du Französisches Etymologisches Wörterbuch. Liège : Université de Liège (thèse de doctorat).

ABSTRACTS

Are linguistic Atlases Corpora ? It is a common practice to use linguistic atlases as corpora in the context of dialectal studies. However, some atlases feature a particular structure preventing them to be used as such. For example, the Atlas linguistique de la Wallonie (ALW) mixes the materials and additional analyses. In this contribution, we show that the computerization of the ALW might enable it to be used as a corpus by easing the access to the materials. We also show the part of analysis that should still be available.

Les atlas linguistiques sont-ils des corpus ? Nous voudrions ici montrer pourquoi certains atlas ne sont pas des corpus et comment leur informatisation pourrait, néanmoins, permettre de les exploiter comme tels. Le questionnement auquel font écho ces lignes est celui de la possibilité d’une informatisation de l’Atlas linguistique de la Wallonie (ALW), envisagée dans un premier temps comme l’intégration d’échantillons des publications dans des bases de données, exploitables via une interface de consultation en ligne. Ce travail consisterait à réduire la matière de l’enquête qui avait été enrichie lors de l’édition des matériaux. Cependant, nous voudrions montrer la part d’analyse qu’il est souhaitable de conserver lors de cette réduction.

INDEX

Keywords: linguistic atlases, dialectology, computarization, corpus, publication Mots-clés: atlas linguistique, dialectologie, informatisation, corpus, édition

AUTHORS

PASCALE RENDERS FNRS / Université de Liège

Corpus, 12 | 2013 15

Parole e testi : l’esperienza di un atlante

Sabina Canobbio

1 Colgo volentieri l’opportunità offerta da questo numero della rivista Corpus, in cui si dà voce a esperienze di ricerca che si sono confrontate con insiemi complessi di dati, per proporre alcune riflessioni nate nel cantiere di lavoro di una impresa subregionale italiana, l’Atlante Linguistico ed Etnografico del Piemonte occidentale – ALEPO. Sarà questa l’occasione per richiamare brevemente le caratteristiche di questo atlante che ha iniziato ormai da un decennio le pubblicazioni e per fare un bilancio delle sue prime realizzazioni in rapporto non solo alle finalità per cui il progetto è nato ma anche a certi aspetti del suo corpus di materiali.

1. Il progetto e i suoi sviluppi

2 Il progetto per l’ALEPO nasce nei primi anni '80 dalla collaborazione tra la Regione Piemonte e l’Università di Torino, con l’intento di documentare le sopravvivenze galloromanze, francoprovenzali e occitane, nelle vallate del Piemonte e per completare dunque anche sul versante italiano delle Alpi la ricerca degli atlanti regionali francesi1 che si erano sostanzialmente arrestati ai confini di stato. Indubbio dunque il suo legame, con questi atlanti, ma altrettanto evidenti rispetto ad essi numerose innovazioni prodotte dal maturare della riflessione teorica e metodologica2 e dalla stessa maggior complessità repertoriale della nostra area3 rispetto a quella transalpina, e inoltre dalle nuove possibilità di trattamento e di presentazione dei dati offerte dalle tecnologie informatiche4.

3 Quando si apre il cantiere di lavoro per questa nuova impresa atlantistica, l’auspicio è che essa possa in prospettiva proporre strumenti di lettura aggiornati di un territorio cruciale, cerniera di collegamento tra area linguisticamente galloromanza e area galloitalica, ma poi interessato sempre più compiutamente, tra i diversi aspetti del suo cambiamento, dall’affermarsi della lingua nazionale. Un’area insomma della cui fisionomia linguistica e culturale non possono più dare sufficiente conto le pur

Corpus, 12 | 2013 16

straordinarie documentazioni, raccolte però in una diversa dimensione di ricerca e in anni ormai troppo lontani, dell’ AIS (Sprach- und Sachatlas Italiens und der Südschweiz) e dell’ALI (Atlante Linguistico Italiano).

4 Pur essendo l’impianto dell’ALEPO quello di un atlante, come si dice, « di scavo », destinato a documentare attraverso le parole locali i diversi aspetti della vita e del lavoro tradizionali delle comunità del Piemonte montano5, in buona parte ormai obsoleti, è chiaro che i materiali raccolti non potranno che essere il riflesso delle profonde trasformazioni sociali, culturali e linguistiche che hanno, in particolare dal secondo Dopoguerra, interessato anche questo territorio.

5 Entro i primi anni '90 vengono completate e trascritte le inchieste sul campo6, comprensive di rilievi etnofotografici7 e l’équipe di lavoro si trova di fronte alle delicate scelte connesse con l’archiviazione e il trattamento di un corpus di materiali non solo di ingentissime proporzioni ma anche, ancor più di quanto fosse previsto, complesso e articolato (spesso più risposte per ciascun punto, illustrazioni, etnotesti, informazioni pragmatiche e metalinguistiche, annotazioni di vario tipo, ecc.). Non a caso in quegli stessi anni viene avviata nel cantiere dell’ALEPO la prima sperimentazione dell’informatizzazione dei dati ; una svolta che si rivelerà assai fruttuosa, anche se non certo indolore per le difficoltà di riconvertire alle regole rigide dello strumento informatico materiali raccolti, e sottoposti alle elaborazioni preliminari, nella prospettiva di archiviazione e sbocchi editoriali del tutto tradizionali e « cartacei ». Grazie a questo impegnativo processo8 l’ALEPO si è dotata della ben articolata struttura di una banca dati, funzionale alle esigenze di archiviazione dei suoi complessi dati, e anche del software in grado di farne uscire (in buona parte automaticamente) oltre alle tavole dell’atlante, i materiali complementari e gli apparati.

6 Alla pubblicazione, nel 2003, di un volume di presentazione della ricerca e dei suoi sviluppi hanno fatto seguito (tra il 2004 e il 2007) quelle dei tre moduli del I Volume dell’atlante, tutto dedicato al Mondo vegetale (I-I. Alberi e arbusti ; I-II Erbacee ; I-III Funghi e licheni), completato nel 2008 dall’Indice dei tipi lessicali e da una prima proposta di consultazione interattiva dei dati.

7 Dell’inizio del 2013 è l’edizione del Volume III, dedicato al Mondo animale (III-I Fauna ; III-II Caccia e pesca), che si è deciso di pubblicare di seguito al I, forzando l’ordine previsto dal Piano editoriale, per completare in questo modo la presentazione dei materiali raccolti dall’ALEPO attorno alla fitonimia e alla zoonimia popolari. Queste ultime costituiscono, infatti, settori del lessico dalle caratteristiche peculiari, espressione di saperi naturalistici e linguistici complessi e profondamente radicati nelle culture locali che appaiono però oggi in una fase particolarmente critica di destrutturazione e presentano dunque analoghi problemi teorici e metodologici, sia nel trattamento dei dati sia nella loro lettura.

8 Attualmente sono in fase di preedizione i materiali per il Volume V, dedicato a Lo spazio e il tempo.

9 Quali sono le caratteristiche di questo oggetto, che continuiamo a chiamare atlante linguistico, ma che indubbiamente è qualche cosa di ben diverso da quei modelli da cui eravamo partiti, dando così ragione del percorso compiuto nel cantiere dell’ALEPO nel suo ormai trentennio di attività9? Ogni volume, cui fa capo un numero variabile di moduli10, consta in primo luogo di una componente cartacea, che presenta però solo una selezione delle voci generate dalla redazione dei materiali. Queste ultime sono formate

Corpus, 12 | 2013 17

da tavole (cioè dalle carte linguistiche vere e proprie11, sulle quali sono riportate per ogni punto solo le risposte individuate come principali) e dai tabulati dei materiali integrali di quelle stesse voci (risposte puntuali, etnotesti, apparati di note), preceduti da una nota redazionale. Questa componente cartacea è accompagnata da un CD-Rom, che presenta in forma di libro elettronico12 il complesso di tutte le voci del modulo, oltre agli indici e agli altri strumenti di accesso ai dati. A conclusione del I volume, nel CD-Rom allegato ad ALEPO I/Indice, è stata proposta, in via sperimentale, una modalità più interattiva di lettura delle carte13, con la possibilità di ricerche incrociate ed elaborazioni areali dei dati, sulla base della tipizzazione delle forme linguistiche14.

10 Questo modello di atlante, in parte cartaceo e in parte elettronico, sperimentato nei volumi I e III, viene incontro a una delle principali preoccupazioni dell’ALEPO, quella cioè di non perdere nulla della complessa ricchezza che caratterizza il corpus dei dati raccolti nelle sue inchieste. Esso tenta nei fatti di superare almeno in parte, grazie alla natura composita della voce, gli angusti limiti della carta linguistica tradizionale, sulla quale è ben difficile, senza comprometterne la leggibilità, non solo riportare in corrispondenza di ciascuno dei punti indagati più di un dato, ma anche accompagnarlo con l’insieme delle informazioni che lo contestualizzano e lo qualificano. Le voci dell’ALEPO infatti non solo accostano immediatamente alla rappresentazione cartografica delle risposte principali il listato sintetico di tutte le altre risposte, ma poi le pagine dei materiali propongono in forma tabulare 15 l’insieme integrale e completo dei contenuti, primari e di complemento, archiviati nella banca dati e correlati con quella voce, compresi gli etnotesti e le loro traduzioni italiane. Il corredo informativo che accompagna ogni dato raccolto comprende in primo luogo la stringa identificativa dell’informatore che, oltre a collegarlo con la località di inchiesta tramite il relativo codice, dà indicazione del suo sesso, grado di scolarità, anno di nascita16, permettendo così di collegare immediatamente il dato stesso ad alcuni parametri fondamentali per la sua valutazione.

11 L’apparato di note prevede le due serie distinte di quelle prodotte da interventi degli informatori (oltre che dalle specificazioni di tipo pragmatico, che rimandano a gesti, esitazioni, ecc.) e di quelle prodotte dalla redazione. Proprio la ricchezza delle note che raccolgono le osservazioni dei parlanti permette, insieme alla disponibilità dei loro dati personali, di rilevare non di rado, anche se non specificamente indagati, anche aspetti sociolinguistici e percettivi.

12 Una delle soluzioni che si sono rivelate più fruttuose per la salvaguardia e la valorizzazione del patrimonio documentario emerso dalle inchieste è quella del cosiddetto « Questionario a posteriori », che permette di recuperare (codificandoli e inserendoli nell’archivio, dunque rendendoli disponibili alla consultazione), dati emersi non dalle domande del questionario bensì da interventi spontanei degli informatori17. Questa modalità di trattamento e di archiviazione si è rivelata preziosa proprio nel trattamento dei materiali relativi alla flora e alla fauna, dal momento che una parte non indifferente dei relativi etnosaperi è, come ricorderemo ancora qui sotto, destinata a sfuggire alla pur minuta griglia di qualunque questionario. In molti casi dati recuperati in questo modo costituiscono ora nelle relative voci importanti tasselli informativo per la lettura del quadro areale o come integrazioni di tipo etnoculturale18.

Corpus, 12 | 2013 18

2. Primo bilancio

13 Qual è dunque un provvisorio bilancio che si può fare dell’impresa sulla base di queste sue prime realizzazioni, in rapporto alle aspettative generali ma anche alla specificità degli argomenti fino ad ora trattati ?

14 L’ALEPO ha scelto, come abbiamo visto, per mettere alla prova i propri materiali e il proprio metodo due settori del lessico popolare assai scivolosi per gli atlanti linguistici, quello fitonimico e quello zoonimico. Che sono tali principalmente per la difficoltà, messa bene in luce dalle acquisizioni dell’etnolinguistica19, di ricostruire tramite le domande di un questionario, e dunque quasi inevitabilmente sulla base delle categorie previste dalle classificazioni scientifiche, l’effettivo patrimonio delle denominazioni popolari e la trama di rapporti su cui esse si basano.

15 A questo problema di fondo è venuto negli ultimi decenni sempre più decisamente ad aggiungersi, complicando ulteriormente l’elicitazione dei dati, l’impoverimento delle competenze specifiche, sia linguistiche sia culturali, dei parlanti, anche di quelli delle nostre vallate alpine.

16 Questi diversi ordini di difficoltà emergono indubbiamente dalle voci dei due primi volumi dell’ALEPO e sono messi in evidenza dalle note di presentazione che illustrano e valutano, modulo per modulo e voce per voce20, la produttività delle domande del questionario, la qualità dei dati raccolti, le difficoltà specifiche incontrate nel loro trattamento, le loro valenze culturali.

17 Indubbiamente molte delle voci (e delle carte) di tutti i moduli appaiono lacunose e la simbologia che dà conto della motivazione dell’assenza di risposta riproduce sinteticamente i molti « forse », « non so », « conosco ma non dire un nome », « non ricordo » con cui si è manifestata nel corso dei rilievi l’attuale, generalizzata insicurezza da parte dei nostri informatori attorno a saperi e a settori della lingua ormai marginali nella vita delle loro comunità21. L’insicurezza del sapere si incrocia insomma nelle testimonianze con quella del saper (ancora) dire.

18 Anche dove le risposte ci sono, non di rado esse sono accompagnate da note che segnalano dubbi redazionali sulla loro « attendibilità ». Però a rassicurarci sull’opportunità della scelta di riportare comunque il complesso delle risposte delle nostre fonti, anche nelle sue componenti più critiche e magari contraddittorie, è sempre utile ricordare22 le parole scritte da Vittorio Bertoldi in rapporto alla ricerca fitonimica, cui il grande studioso ha dedicato studi fondamentali, ma valide naturalmente anche a proposito dei nomi di animali : Ho detto tutto questo per dare un’idea delle difficoltà che incontrerebbe non tanto il botanico, ma lo stesso linguista che volesse fare distinzioni troppo rigide del suo materiale e propendesse troppo sovente agli ostracismi di nomi ritenuti d’origine sospetta. Quello che il nostro empirismo retrospettivo chiama voce popolare e voce letteraria come, del resto, anche quello, che esso chiama voce indigena e voce d’accatto, neologismo e voce antiquata, evoluzione normale e anormale non sono che fasi fuggitive nella storia dei linguaggi, non sono che riflessi della vita interiore dei parlanti, fatta di contrastanti tendenze ed esposta a continui influssi. Dunque nel compiere la raccolta, nessun segno di stupore, nessuna prevenzione, nessun partito preso. Tutto ci interessa quanto rispecchia fedelmente la realtà linguistica di quel dato momento e in quel dato luogo, anche quello che ad altri può sembrare artificioso, improbabile, accidentale, poiché tutto appartiene a una materia in

Corpus, 12 | 2013 19

perenne formazione ed evoluzione, la quale s’arresta e s’irrigidisce appena quand’è giunta nei nostri libri. (1927 : 30).

19 Parole che (a giustificare questa lunga citazione) sembrano ancora attualissime, come è confermato da molte altre riflessioni maturate negli ultimi decenni a proposito delle attribuzioni di veridicità e/o di falsità a etichette denominative che hanno per molti motivi, come ha scritto Jean-Philippe Dalbera un carattere « del tutto fluido » (2002 : 836-838), e inoltre motivazioni profonde che sfuggono spesso alla nostra attuale capacità interpretativa23. Basti pensare all’esempio offerto dalle denominazioni dei rapaci notturni che sembrano mostrare, nelle voci dell’ALEPO24 come del resto negli altri atlanti e repertori, con il loro continuo sovrapporsi e scambiarsi di posto in rapporto ai referenti, un quadro caotico e apparentemente privo di logica e ragionevolezza per lo studioso che deve ordinarli e studiarli25.

20 In ogni caso il contributo che i materiali dall’ALEPO, nonostante i loro aspetti problematici, possono portare a una migliore conoscenza della fisionomia plurilingue del Piemonte occidentale nelle sue complesse dinamiche in continua evoluzione, appare da queste prime uscite promettente. Anzi nelle parti del lessico sin qui trattate rimaste, proprio per la loro marginalità, relativamente più al riparo di altre nel processo di italianizzazione delle parlate locali, sembra potersi leggere ancora bene l’articolarsi dei rapporti tra i tre principali domini a contatto nell’area, quello francoprovenzale, quello occitanico e quello pedemontano.

21 Un esempio molto interessante è offerto, tra gli altri, dalla voce Nocciolo (Corylus avellana, ALEPO I-I.80), che mostra apparentemente una distinzione chiara tra le tre aree, con le forme dei lessotipi AVELLANA soprattutto nelle vallate occitane, quelle da CORYLU prevalenti nelle valli francoprovenzali e quelle da NUCEOLA a caratterizzare l’area pedemontana galloitalica. Ma come ha mostrato bene Riccardo Regis (2006 e 2008)26 l’analisi puntuale dei dati nell’intera rete dei punti mostra un sistema in movimento in cui i lessotipi prevalenti nei domini galloromanzi appaiono in via di cedimento27 sotto la pressione del tipo pedemontano, peraltro probabilmente rinforzata dal fatto che esso è condiviso, sia pure con esiti diversi, dall’italiano. Non a caso, nota Regis, l’area in cui « sembra consumarsi l’agone più stimolante » (2006 :157) tra i tre lessotipi è la Valle di Susa28, in cui i domini francoprovenzale e occitanico si incernierano tra loro, ma in cui anche il piemontese, soprattutto nel fondovalle, si è addentrato più precocemente che altrove29.

22 In molte voci, in molte carte, a emergere è una perdurante ricchezza di lessotipi, la cui sopravvivenza forse non ci si sarebbe attesi nell’attuale indebolimento delle parlate locali. Un caso molto significativo in questo senso è ad esempio quello del vivissimo polimorfismo lessicale che emerge dalla voce Narciso (ALEPO I-II.8, narciso selvatico- Narcissus poeticus), riconducibile addirittura a 16 tipi30, alcuni motivati dalla morfologia della pianta ma più frequentemente nati da processi culturali.

23 Di non minore interesse sono peraltro, nell’economia dell’opera, anche le voci caratterizzate dalla presenza di un solo tipo lessicale (ad esempio quella dedicata al Lupo, ALEPO III-I 267 lupo-Canis lupus), ma di contro ricchissime di testimonianze su tradizioni e storie locali.

24 In qualche caso il fatto che l’attestazione, magari isolata, di una denominazione sia accompagnata da una spiegazione di valenza etnografica offre una traccia preziosa per ipotesi interpretative altrimenti impraticabili. Penso ad esempio al nome dame d’aigo attestato nel P. 630 Monterosso Grana (in alternativa a cavalot) per l’Opilionide (ALEPO

Corpus, 12 | 2013 20

III-I.51 opilionine-Phalangium opilium). Come già osservato (Canobbio 2003 : 51-52) la spiegazione viene dal collegamento di questo nome (« dammi dell’acqua ») a una filastrocca che si recitava, tenendolo fermo per una delle lunghe zampe, perché il falangio emettesse una goccia d’acqua dall’addome : cavalin, cavalot, dame d’aigo snu ses mort (« cavallino, cavalot, dammi dell’acqua altrimenti sei morto »).

25 Spesso le osservazioni che accompagnano i nomi attestati per una specie ribadiscono con convinzione, nonostante il riscontro contrario della realtà, le credenze che li motivano, com’è nel caso del povero Orbettino (ALEPO III-I 320 orbettino-Anguis fragilis), che voci e detti popolari vogliono cieco, o addirittura privo di occhi, oltre che pericolosissimo31.

26 E’ evidente l’interesse delle voci che risultano collegate tra di loro da diversi tipi di legami e i cui significati linguistici e culturali dunque si completano nel confronto, come è nel caso di quelle dedicate a specie arboree e arbustive e ai loro frutti. Così è, ad esempio, per le voci dedicate al Ginepro (ALEPO I-I 85 ginepro-Juniperus communis)32 e alle sue bacche (ALEPO I-I 86 bacche di ginepro) ma anche a una particolare composta da esse ricavato in alcune località della Val di Susa (ALEPO I-I 86/s composta di bacche di ginepro). È quest’ultimo uno di quei casi in cui alle voci prodotte da domande del questionario se ne è aggiunta un’altra, supplementare, generata dalle attestazioni spontanee di alcuni informatori. In essa si è potuto segnalare una specificità lessicale e culturale che non avrebbe avuto adeguato rilievo (e non sarebbe stata indicizzata) se semplicemente inserita nelle note di un’altra voce ; in questo caso specifico, confusa tra i numerosi impieghi, officinali e alimentari, delle bacche del ginepro.

3. Gli Etnotesti

27 Abbiamo visto che oltre che con dati puntuali, con parole, l’ALEPO si trova a confrontarsi con un tipo di materiale meno usuale nei corpora degli atlanti e meno funzionale alla loro struttura, cioè con dei testi, anzi con quelli che abbiamo già prima citato come etnotesti33 Essi hanno avuto e hanno, per questa ricerca un ruolo determinante sia come strumento euristico nelle fasi di inchiesta sia poi come componente preziosa e qualificante, ma anche cruciale, del suo corpus di dati.

28 Alcune scelte fatte fin dall’inizio, sono risultate accorte, a partire da quella di trattare come etnotesti34 tutti quei materiali che, nel corso dei rilievi non siano stati ottenuti come traduzioni da parola a parola ma che rappresentino l’espressione autonoma della cultura dei parlanti (testimonianze di usi e tradizioni ; descrizioni di oggetti e pratiche ; forme brevi quali proverbi, detti, formulette e filastrocche ; storie ; opinioni e valutazioni anche metalinguistiche, ecc.). Ma anche quella di conservare integralmente le interazioni raccoglitore-informatore, riconoscendo dunque esplicitamente il ruolo della situazione-inchiesta nella genesi degli etnotesti. Collegata in buona misura a questa la scelta inoltre, maturata in seguito, di restituire nelle trascrizioni il discorso orale delle nostre fonti nel suo complesso multilinguismo, compresi i molti segmenti in italiano35. Proprio le ragioni pragmatiche e le modalità dell’alternarsi nelle testimonianze dei diversi codici – italiano36, piemontese, parlata locale – sembrano poter costituire una delle più interessanti piste future di lettura degli etnotesti dell’ALEPO (Regis 2001). Soprattutto mettendoli in rapporto con le risposte alle domande puntuali che, come più volte notato, sottopongono il parlante a un più serrato

Corpus, 12 | 2013 21

autocontrollo nell’uso delle componenti del suo repertorio rispetto a quanto avviene nel discorso libero.

29 Altre scelte fondamentali e qualificanti dovranno però ancora essere fatte perché le potenzialità di questa parte del corpus dell’ALEPO prendano forma. La redazione sta in realtà ancora cercando soluzioni convincenti al problema, solo apparentemente tecnico, di inserire al meglio queste centinaia di testi orali nella struttura dell’atlante, sfruttandone appieno le molteplici valenze e mettendone in luce tutti gli specifici significati, non solo genericamente linguistici, ma etnolinguistici, sociolinguistici, testuali. Un problema che nel I e nel III volume è stato affrontato in modo solo parziale e provvisorio collocando gli etnotesti, anche perché il loro numero e le loro dimensioni lo permettevano, in uno spazio dedicato tra i materiali che accompagnano le carte37. È però evidente che in questo modo gli etnotesti vengono presentati solo come contesti dei dati puntuali, ed eventualmente come fonte di ulteriori informazioni, senza alcuna possibilità di analizzarli, annotarli, indicizzarli nella loro specificità. Questo modello non può evidentemente che apparire inadeguato in rapporto al numero e all’estensione di tutti quegli altri etnotesti prodotti, ad esempio, attorno ai temi del lavoro agricolo e artigiano, agli usi sociali e alle tradizioni delle comunità. La complessa ricchezza dei loro significati meriterà e richiederà una lettura più puntuale e più analitica.

30 Le soluzioni allo studio a questo proposito38 prevedono per gli etnotesti interventi quale l’introduzione di un sistema di trascrizione fono-ortografica, per facilitarne la lettura anche da parte di utenti non specialisti, e inoltre di notazioni di tipo conversazionale che mettano meglio in luce la loro natura di « testi orali ». Ma anche, nella prospettiva di un più esteso impiego del supporto informatico, lo sviluppo di applicazioni di tipo ipertestuale, che possano interconnettere efficacemente, e immediatamente, etnotesti, dati cartografati, apparati di note, iconografia. Sembra necessario comunque un cambio di prospettiva, che porti al superamento dell’attuale presentazione degli etnotesti come meri supporti informativi ed esplicativi e permetta, grazie a un adeguato trattamento (in primo luogo la tokenizzazione dei testi stessi) di analizzarli compiutamente nelle loro diverse componenti e sui diversi piani linguistici e culturali.

31 Già fin d’ora, comunque, gli etnotesti si mostrano luogo privilegiato di osservazione non solo di fatti linguistici ma dei molti processi dialettici in evoluzione che caratterizzano il territorio interessato dalla nostra ricerca39. Un territorio, per una buona parte montano, assai diversificato al suo interno, non solo da valle a valle, ma da paese a paese perché così lo hanno disegnato vicende storiche secolari e poi sviluppi socioeconomici e culturali che hanno interessato proprio le generazioni da noi incontrate nelle nostre inchieste. Si pensi, ad esempio, all’incidenza di fatti dirompenti quale lo spopolamento che, smembrando e disperdendo i gruppi umani originari, ha svuotato in molti paesi di significato la stessa parola « comunità » e ha visto la sostanziale scomparsa di molte delle attività attorno a cui ruotava l’economia locale. Oppure la riconversione turistica, per cui molte vallate hanno subito massicciamente l’impatto di fenomeni, interessi, flussi provenienti da altrove.

32 Questo territorio è inoltre terra di frontiera, interessata dalla presenza di minoranze linguistiche. La coscienza identitaria dei nostri informatori, come spesso emerge dalle testimonianze, sembra tuttora molto attenta (nonostante il sempre più deciso spostamento dei centri di influenza al di fuori dalle vallate) a marcare la diversità nei confronti della pianura piemontese, e l’affinità con l’Oltralpe.

Corpus, 12 | 2013 22

33 Proprio il collasso dei tradizionali assetti territoriali, umani e culturali, ha fortemente condizionato anche il rapporto tra passato e presente. Un segnale ce ne danno gli etnotesti dei volumi I e III, ad esempio con l’impiego generalizzato da parte dei parlanti dei verbi al passato (diffusissimo l’imperfetto), anche quando essi si riferiscono a oggetti, pratiche, elementi della natura che pure fanno parte ancora del presente, ma il cui significato culturale si pone evidentemente in un tempo altro. Del resto le evoluzioni socioeconomiche e/o la riconversione del territorio hanno effettivamente trasformato l’ambiente naturale e il rapporto degli uomini con esso, e non caso spesso in queste testimonianze si riferisce dei saperi tradizionali, ereditati dalla memoria comunitaria, con un atteggiamento tra il divertito e lo scettico, alla luce di altre conoscenze e di altre convinzioni nel frattempo maturate.

34 Gli etnotesti sono poi il luogo in cui vistosamente si manifestano anche le incrinature nella memoria della « letteratura orale » tradizionale ; lo si vede bene nelle attestazioni di forme brevi quali proverbi, detti, formulette, la cui formulazione risulta spesso ormai esitante, imprecisa e lacunosa40.

35 Insomma il discorso del parlante che incontriamo oggi sul campo indica sempre più spesso la natura ormai composita della sua « visione del mondo » e della sua enciclopedia, oltre che delle sue competenze, costruite attraverso la rete complessa delle sue appartenenze a diverse comunità, ristrette e allargate, reali e magari anche virtuali.

4. Prospettive

36 In definitiva, abbiamo visto che sono ancora numerose le scelte, non solo tecniche e organizzative, che dovranno maturare nei prossimi anni nel cantiere dell’ALEPO, anche in rapporto al susseguirsi di moduli e di volumi dai contenuti molto diversi. Basti pensare alle difficoltà connesse con l’inserimento nel tessuto dell’atlante del repertorio fotografico originale, che nei due volumi pubblicati non ha ancora avuto occasione di essere utilizzato che marginalmente41 ma che sarà elemento sostanziale, ad esempio, dai volumi dedicati al lavoro agricolo e all’allevamento.

37 Sia per l’inserimento adeguato degli etnotesti e delle fotografie sia per l’individuazione di modalità di consultazione dei dati più interattiva potranno rivelarsi risolutive, come accennato, le possibilità offerte da un maggior impiego delle tecnologie informatiche e dalla disponibilità sempre più ampia e incisiva dei materiali in formato elettronico. La pubblicazione direttamente in rete potrebbe rendere inoltre l’atlante più facilmente accessibile sia alla comunità scientifica sia a un pubblico allargato di lettori interessati, primi tra tutti coloro che vivono nell’area toccata dalla ricerca.

38 Tuttavia se l’apporto della tecnologia potrà forse farci superare, con il contributo di una adeguata équipe di collaboratori informatici, molti dei vincoli che oggi ci condizionano, e magari anche indicarci strade nuove per interpretare i nostri dati e metterli a disposizione di più utenti, il lavoro di archiviazione e di elaborazione dei materiali non potrà che passare attraverso il lavoro minuzioso di una redazione qualificata. E certo spaventa, guardando il piano editoriale dell’opera che prevede complessivamente 9 volumi, l’entità dei dati ancora da trattare, immane rispetto alle nostre sempre sottodimensionate forze redazionali. Non va taciuto insomma che gli sviluppi dei lavori dipenderanno in una buona parte, per questa come per tutte le altre

Corpus, 12 | 2013 23

imprese collettive che richiedono strutture organizzative onerose, dal verificarsi delle condizioni per un regolare sostentamento del cantiere di lavoro e per la pubblicazione dei suoi risultati di ricerca.

39 Ma il rischio più grosso che l’ALEPO42 corre è quello che le sue carte e gli altri suoi materiali rimangano muti, non siano letti, interpretati, interrogati43 ; che nessuno cerchi di rispondere alle molte domande che essi pongono. Noi stessi che nel suo cantiere lavoriamo, oberati dalla mole di lavoro e di problemi che l’allestimento dell’atlante comporta, siamo tornati fino ad ora troppo poco a esercitare il « mestiere del geolinguista » sulle sue voci, per sfruttarne il tesoro.

Annexes

Corpus, 12 | 2013 24

BIBLIOGRAPHY

AIS = Jaberg K. & Jud J. (1928-40), Sprach- und Sachatlas Italiens und der Südschweiz, Zofingen : Ringier u. C.

ALEPO / Questionario = Canobbio S. & Telmon T. (éd.) (1993-94), Atlante Linguistico ed Etnografico del Piemonte Occidentale. Questionario, I, Introduzione ; II, Testo ; III, Indice lemmatizzato. Torino : Regione Piemonte.

ALEPO / Presentazione = Canobbio S. & Telmon T. (éd.) (2003), Atlante Linguistico ed Etnografico del Piemonte occidentale-ALEPO. Presentazione e guida alla lettura. Pavone Canavese : Priuli & Verlucca Editori.

ALEPO I-I = Atlante Linguistico ed Etnografico del Piemonte occidentale – ALEPO (2005). Volume I, Il mondo vegetale, Modulo I, Alberi e arbusti, Pavone Canavese : Priuli & Verlucca Editori [volume, carte, CD- Rom].

ALEPO I-II = Atlante Linguistico ed Etnografico del Piemonte occidentale - ALEPO. Volume I, Il mondo vegetale, Modulo II, Erbacee. (2007). Scarmagno : Priuli & Verlucca Editori [volume, carte, CD-Rom].

ALEPO I-III = Atlante Linguistico ed Etnografico del Piemonte occidentale - ALEPO. Volume I, Il mondo vegetale, Modulo III, Funghi e licheni (2004). Pavone Canavese : Priuli & Verlucca Editori [volume, carte, CD-Rom].

ALEPO I/Indice = Indice dei tipi lessicali e altre modalità di consultazione (2008). Scarmagno : Priuli & Verlucca Editori [volume ; CD-Rom].

ALEPO III = Atlante Linguistico ed Etnografico del Piemonte occidentale - ALEPO. Volume III, Il mondo animale ; Modulo I, Fauna selvatica ; Modulo II Caccia e Pesca (2013). Alessandria : Ed. dell’Orso [volume, carte, CD-Rom].

Corpus, 12 | 2013 25

ALI = Atlante Linguistico Italiano (1995 e sgg). Roma : Istituto Poligrafico e Zecca dello Stato.

ALiR = Atlas Linguistique Roman, Volume I (1996), Présentation, Commentaires ; Volume II.a (2001), Commentaires ; Volume II.b (2009), Commentaires, Roma : Istituto poligrafico e Zecca dello Stato, Libreria dello Stato.

ALJA = J.B. Martin - G. Tuaillon, Atlas Linguistique et Ethnographique du Jura et des Alpes du Nord (1971-1978). Paris : CNRS.

ALP = J.C. Bouvier - C. Martel, Atlas Linguistique et Ethnographique de la Provence (1975 e sgg). Paris : CNRS.

Baratto G. (2011). « Il trattamento degli etnotesti. Prime riflessioni e proposte per la realizzazione dei moduli di carattere etnografico dell’ALEPO », Bollettino dell’Atlante Linguistico Italiano 35 : 43-77.

Bertoldi V. (1927). « Per la storia del lessico botanico popolare. A proposito di una recente pubblicazione », Archivum Romanicum XI/1 : 14-30.

Bouvier J.-C. (1992) « La notion d’ethnotexte », in J.-N- Pelen & C. Martel (éd.) Les voies de la parole. Ethnotextes et littérature orale. Approches critiques. Aix-en-Provence : Publications de l’Université de Provence, 12-21.

Bouvier J.-C., Bremondy H. P., Joutard P., Mathieu G. & Pelen J.-N. (1980). Tradition orale et identité culturelle. Problèmes et méthodes. Parigi : Ed. CNRS

Calleri D. (1990). « Messa a punto di un questionario per la raccolta di fitonimi dialettali », in G. Berruto & A. Sobrero (éd.) Studi di sociolinguistica e dialettologia italiana offerti a Corrado Grassi, Galatina : Congedo, 77-94.

Calleri D., Canobbio S. & Telmon T. (2001). « I fiori dell’ALEPO », in G.L. Beccaria & C. Marello (éd.) La parola al testo. Scritti per Bice Mortara Garavelli. Alessandria : Edizioni dell’Orso, I, 95-118.

Canobbio S. (1985). « Testi dialettali ed etnotesti nell’atlante linguistico ed etnografico del Piemonte occidentale : appunti per una classificazione », in T. Telmon & S. Canobbio (éd.), 207-343.

Canobbio S. (1989). « Al di là della raccolta dialettale : etnotesti e documentazione ergologica nell’ALEPO », in AA.VV., Atlanti regionali : aspetti metodologici, linguistici e etnografici, Atti del XV Convegno del CSDI (Palermo 7-11 ottobre 1985). Pisa : Pacini, 83-106.

Canobbio S. (1999). « I saperi naturalistici e gli atlanti linguistici : l’esperienza dell’ALEPO », Quaderni di semantica XX/1 : 159-168.

Canobbio S. (2001). « Le rapport dialectique entre Passé, Présent et Futur dans les Ethnotextes de l’Atlas Linguistique et ethnographique du Piémont Occidental », in Le temps bricolé, n. monografico Le monde alpin et Rhodanien 3-4 : 189-202.

Canobbio S. (2002). « L’Atlante linguistico come strumento di ricerca ? A proposito di alcune esperienze italiane », in M.-R. Simoni-Aurembou (éd.), 905-929.

Canobbio S. (2003). Le ‘bestiole’ dell’ALEPO, in R. Caprini (éd.) Parole romanze. Scritti per Michel Contini. Alessandria : Edizioni dell’Orso, 43-55.

Canobbio S. (2004). « Funghi e licheni nell’ALEPO », in ALEPO I-III : 39-54.

Canobbio S. (2005). « Alberi e arbusti nell’ALEPO », in ALEPO I-I : 45-60.

Canobbio S (2007). « Erbe e fiori nell’ALEPO », in ALEPO I-II : 45-57.

Corpus, 12 | 2013 26

Canobbio S. (2011). « Etnotesti », in AA.VV. Per i linguisti del nuovo millennio. Scritti in onore di Giovanni Ruffino. Palermo : Sellerio, 114-117.

Canobbio S. (2012). « Elementi di ornitonimia piemontese : i rapaci notturni dell’ALEPO » in M. Oliviéri, G. Brun-Trigaud & P. Del Giudice (éd.) La leçon des dialectes. Hommages à Jean-Philippe Dalbera. Alessandria : Edizioni dell’Orso, 97-105 (con 3 tavole fuori testo).

Canobbio S. (2013). « Il mondo animale nell’ALEPO », in ALEPO III : 41-52.

Canobbio S. & Raimondi G. (2004). « Fitonimi e fitotoponimi nel Piemonte alpino », in J.-C. Ranucci & J.-P. Dalbera (éd.) Toponymie de l’espace alpin : regards croisés, Corpus. Les Cahiers 2 : 177-201.

Cerruti M. & Regis R. (2007). « Language change and areal Linguistics : notes on Western Piedmont », Dialectologia et Geolinguistica 15 : 23-43

Cerruti M. & Regis R. (2008). « La tipizzazione lessicale : problemi e metodi », in ALEPO I/Indice : 15-49.

Dalbera J.-P. (2002). « Géolinguistique : un nouveau souffle ? », in M.-R. Simoni-Aurembou (éd.), 831-849.

Dalbera J.-P (2006). Des dialectes au langage. Une archéologie du sens. Paris : Honoré Champion Editeur.

Dalbera J.-P. (2009). « Quel avenir pour la dialectologie ? », in B. Horiot (éd.) La dialectologie hier et aujourd’hui (1906-2006). Lyon : Centre d’études linguistiques Jacques Goudet, 455-468.

Duberti N. & Miola E. (2012). Alpi del mare tra lingue e letterature. Pluralità storica e ricerca di unità. Alesssandria : Edizioni dell’Orso.

Evans D. (1960). « Noms et folklore des oiseaux de proie nocturnes dans le Midi de la France », Revue de langue et littérature provençales 3 : 5-25.

Matranga V. & Sottile R. (éd.) (2007). Esperienze geolinguistiche. Percorsi di ricerca italiani e europei, ALS, Materiali e ricerche 18, Palermo.

Mendicino A., Prantera N. & Maddalon M. (éd.), (2004). Etnolinguistica e zoonimia. Le denominazioni popolari degli animali. Rende : Università della Calabria.

Ortalli G. & Sanga G. (éd.), (2004). Nature Knowledge. Oxford : Berghahn

Prantera N., Mendicino A. & Citraro C. (éd.), (2010). Parole. Il lessico come strumento per organizzare e trasmettere gli etnosaperi. Università della Calabria, Centro editoriale e librario, Volume con CD.

Raimondi G. (2003). « L’Atlante », in ALEPO/Presentazione : 53-97.

Regis R. (2001). « Il mistilinguismo nei materiali dell’ALEPO : un approccio funzionale », Bollettino dell’Atlante Linguistico Italiano 25 : 67-80.

Regis R. (2006). « Incontri, scontri, reazioni : il prestito nei materiali dell’ALEPO », in Diglossie et interférences linguistiques : néologismes, emprunts, calques. Actes de la conférence annuelle sur l’activité scientifique du Centre d’Etudes francoprovençales. Aosta, 155-169.

Regis R. (2008). « Il Tipo corylus : origine, riscontri, fortuna (con particolare riferimento al territorio italiano », Vox romanica 67 : 11-33.

Simoni-Aurembou M. R. (éd.), (2002). « Nouveaux regards sur la variation diatopique », Revue belge de Philologie et d’Histoire LXXX.

Corpus, 12 | 2013 27

Telmon T. (2009). « La geografia linguistica : una scienza ambigua o una scienza duplice ? », Rivista italiana di dialettologia 33 : 17-25.

Telmon T. & Canobbio S. (éd.), (1985). Atlante Linguistico ed Etnografico del Piemonte occidentale. Materiali e Saggi 1984. Torino : Regione Piemonte.

Varotto M. (éd.), (2013). La montagna che torna a vivere. Testimonianze e progetti per la rinascita delle Terre Alte. Portogruaro : Nuova Dimensione.

NOTES

1. In particolare dell’ALJA e dell’ALP. 2. In conformità anche, nel nostro caso, ad alcune linee di sviluppo proprie della « scuola torinese » di matrice terraciniana. 3. In cui le parlate occitane e francoprovenzali si incontrano con il piemontese (non solo con quello di koinè, modellato sul torinese, ma con le sue diverse varietà locali) e in alcune località con il francese oltre che con l’italiano. 4. Per tutti gli aspetti di metodo e per una compiuta presentazione del progetto e del suo percorso di sviluppo si rimanda a ALEPO / Presentazione, cioè al volume che nel 2003 ha avviato le pubblicazioni dell’atlante. 5. Da qui la scelta come strumento di inchiesta di un questionario di tipo enciclopedico tarato su questo tipo di realtà geoantropica, il Questionnaire pour enquêtes en Pays alpin di Gaston Tuaillon, tradotto in italiano e adattato all’ambiente cisalpino da Tullio Telmon. Un repertorio ricco di circa 6000 domande, organizzate in una struttura a griglia che, alternando quesiti chiusi a quesiti aperti, favorisce tra raccoglitore e informatore lo sviluppo di quella che si chiama una « conversazione guidata ». 6. In 42 località, una almeno per ciascuna delle vallate riconosciute come galloromanze dalla letteratura scientifica ; in alcune vallate particolarmente estese o linguisticamente complesse le inchieste sono state più numerose ; sono stati indagati inoltre alcuni punti « fuori territorio » sia in senso linguistico sia in senso culturale, località cioè linguisticamente galloitaliche e culturalmente pianigiane. L’impresa ha visto l’impiego di più raccoglitori, per la cui scelta è stata privilegiata, quando possibile, l’appartenenza alle comunità indagate (su questo aspetto, oltre che a ALEPO / Presentazione, si rimanda a Regis 2001 che ne rileva l’importanza nelle dinamiche di inchiesta). Per quanto riguarda gli informatori (hanno collaborato alla ricerca più di 200 parlanti nativi), la loro scelta non si è basata su criteri di rappresentatività sociolinguistica ma sulla competenza linguistica e culturale rispetto alle caratteristiche dell’area. I rilievi sono stati integralmente registrati su supporto analogico (l’archivio sonoro, poi riprodotto su supporto digitale, assomma a circa 1300 ore). I materiali raccolti sono stati trascritti dagli stessi raccoglitori in grafia fonetica, originariamente secondo una versione semplificata del sistema ALF-Rousselot proprio della tradizione geolinguistica francese, in seguito però poi sostituita per le pubblicazione dell’atlante dal sistema IPA. La trascrizione non ha interessato solo le risposte puntuali e l’articolarsi più o meno complesso delle testimonianze in etnotesti (sui quali ritorneremo dopo), ma anche le loro componenti pragmatiche, paralinguistiche e metalinguistiche (gesti, risate, esitazioni, ripensamenti, autocorrezioni, pause, osservazioni degli informatori). 7. I rilievi fotografici sono stati poi quasi sempre ripresi e completati da alcuni collaboratori specializzati. L’ALEPO dispone a tutt’oggi di circa 3000 schede etnofotografiche (relative ad attrezzi, strutture abitative, masserizie) che costituiscono oggi un prezioso collegamento tra i referenti oggettuali indagati e le parole che, secondo le testimonianze dei parlanti locali, li significano.

Corpus, 12 | 2013 28

8. Tuttora in divenire, non solo per i normali motivi di manutenzione e di aggiornamento del software, ma perché i problemi posti dal trattamento di alcuni tipi di dati non sono stati, come vedremo, ancora compiutamente affrontati. 9. Indubbiamente uno degli aspetti più critici, e più criticati, delle ricerche per gli atlanti, e anche dell’ALEPO, è proprio il tempo che essi impiegano, per la complessità della loro realizzazione, a rendere disponibili alla consultazione i dati raccolti. 10. Tre ad esempio, come si è visto, nel I volume (e oggetto ciascuno per la loro entità, di pubblicazioni autonome) ; due nel III volume (pubblicati insieme). 11. Come già più volte osservato, cfr. ad esempio Canobbio 2003, è evidente la difficoltà di descrivere i nostri nuovi atlanti con la metalingua tradizionale della geolinguistica. 12. Da sfogliare in modo molto simile a un libro normale con qualche possibilità interattiva ; si possono, ad esempio, ingrandire le carte o i dettagli dei materiali di complemento, si possono stampare le voci che interessano, anche in formato A4 e in bianco e nero, ecc. 13. Uno sviluppo ne è attualmente in progettazione anche per i materiali del III volume, forse (è una delle ipotesi allo studio) da rendere disponibile in rete. 14. Un passaggio questo molto delicato che ha imposto scelte cruciali di cui si dà ampio conto in Cerruti, Regis 2008. 15. La struttura di questa parte delle voci si può cogliere, per quanto parzialmente, nei particolari di alcune voci riportati nelle Figure allegate. Il formato di questa pubblicazione sconsiglia evidentemente qui la riproduzione integrale di carte e/o di pagine dei materiali dell’atlante che risulterebbero non facilmente leggibili. 16. Si veda la terza colonna da sinistra nei particolare dei materiali di alcune voci, riportati nelle Figure allegate. 17. Si veda a questo proposito (e più in generale sull’organizzazione dei dati nella Banca dati) Raimondi 2003. 18. Come nel caso della carta supplementare relativa a un prodotto ricavato dalle bacche di ginepro di cui si dice qui sotto al punto 2. 19. La letteratura specifica a questo riguardo ormai talmente ampia che non se ne può dare qui che qualche minimo cenno, a partire dalla riflessione maturata nel cantiere dell’ALEPO ; si vedano in particolare Calleri 1990, Canobbio 1999, 2004, 2005, 2007, 2012a, 2012b ; Calleri, Canobbio, Telmon 2001 ; Canobbio, Raimondi 2004 e le rispettive bibliografie. Tra i contributi più recenti alla speculazione collettiva su queste tematiche si rimanda a Ortalli, Sanga 2004 ; Mendicino, Prantera, Maddalon 2004 ; Prantera, Mendicino, Citraro 2010. Doveroso infine segnalare ancora una volta la rivista Quaderni di semantica, come sede di pubblicazione negli ultimi anni di moltissimi lavori che hanno ben messo in luce questi aspetti. 20. Cfr. per le note introduttive dei moduli Canobbio 2004, 2005, 2007, 2013 ; inoltre le note redazioni premesse a ogni voce. 21. Anche se gli ultimi anni hanno indubbiamente visto anche nelle nostre vallate un riaccendersi di attenzione di tipo naturalistico (ad esempio in rapporto alla medicina tradizionale) e lo svilupparsi di iniziative di recupero perché la montagna « torni a vivere » (cfr. per lacune di queste esperienzeVarotto 2013), questo non corrisponde necessariamente anche a un recupero in termini di specificità linguistica locale. 22. Ancora una volta ; cfr. Canobbio2005 : 57. 23. Un ulteriore invito alla prudenza nella valutazione di dati apparentemente « inspiegabili » che ci viene dalle preziose sintesi romanze che ai nomi di molte animali sta dedicando l’ALiR. 24. Cfr. per ALEPO III.I tre voci principali, 147 Civetta (Athene noctua), 149 Gufo comune(Asio otus), 153 Barbagianni (Tyto alba) e alcune altre in cui sono confluiti dati attribuibili ad altri strigidi : 145/s Allocco (Strix aluco), 146/s Assiolo (Otus scops), 151 Gufo di palude (Asio flammeus), 152/s Gufo reale (Bubo bubo).

Corpus, 12 | 2013 29

25. Si veda a questo proposito Canobbio 2012 ; Dalbera 2006 (in particolare alle pp. 275-338, dedicato appunto a queste specie e ai loro nomi) ; Evans 1960. 26. Cfr. anche Cerruti, Regis 2007 ; Canobbio, Raimondi 2004. 27. Per ora più vistosi, come prevedibile, nel nome del frutto (che rappresenta un prodotto pregiato oggetto di commercio per varie zone del Piemeonte) che in quello della pianta. 28. I materiali pubblicati hanno già contribuito in realtà anche ad alimentare il vivace dibattito in corso per una migliore definizione delle caratteristiche linguistiche di un’altra parte molto delicata del territorio interessato dalla ricerca, cioè la sua sezione più meridionale, in cui accanto a tratti pedemontani e occitanici si fanno evidenti, e in alcuni casi forse preponderanti, quelli di tipo ligure (cfr. ad esempio alcuni contributi nel recente Duberti, Miola 2012). 29. Si veda a questo proposito nella Fig. 1 il particolare che mostra i dati di una parte di questo territorio nei materiali della Voce I.I.60. 30. Cfr. Calleri, Canobbio, Telmon 2002 :95-116 ; e la nota redazionale della voce, firmata da T. Telmon. 31. Si veda un particolare dei materiali della voce ALEPO nella Fig. 3 ; per i nomi dell’orbettino e per le credenze relative cfr. Canobbio 2003. 32. Si veda un piccolo particolare dei materiali della voce nella Fig. 2. 33. Per l’impiego degli etnotesti nell’ALEPO cfr. Canobbio 1985, 1989, 2011 ; per le esperienze francesi da cui la ricerca per l’ALEPO lo ha mediato, cfr. almeno Bouvier et Alii 1980, Bouvier 1992. 34. Canobbio 1985 :210. 35. Come si vede ad esempio nella Fig. 3, al P : 380 Bardonecchia. 36. Quando verranno editati materiali etnotestuali più numerosi ed estesi, essi potranno costituire indubbiamente una sede importante di analisi dell’italiano regionale di questa parte del Piemonte. 37. Come si può notare dagli esempi delle Figure allegate. 38. Cfr. a questo proposito Baratto 2011. 39. Cfr. Canobbio 2001. 40. Come si nota nelle due attestazioni di un detto sull’orbettino presenti nella Fig. 3. 41. Alcune fotografie appartenenti al repertorio iconografico raccolto dall’ALEPO sono state introdotte (secondo modalità del tutto provvisorie e sperimentali) solo in voci del II modulo del III volume, relative a strumenti di cattura di animali. 42. Come ogni altro atlante linguistico e forse come ogni altra impresa scientifica che allestisca e tratti corpora di dati. 43. Cfr. a questo proposito le condivisibili considerazioni di Telmon 2009 e gli interventi di Alberto Sobrero, cui egli fa ampio riferimento, a una tavola rotonda palermitana su « Il mestiere di geolinguista oggi » pubblicata in Matranga, Sottile 2007 : 2005-235. Ma medesime preoccupazioni sono state espresse anche da Jean-Philippe Dalbera, cfr. ad esempio Dalbera 2009.

ABSTRACTS

Words and Texts : the Experience of an Atlas This paper deals with some questions that have arisen while we were carrying out research for the ALEPO – « Linguistic and Ethnographic Atlas of the Western Piedmont Region » (Atlante

Corpus, 12 | 2013 30

linguistico ed etnografico del Piemonte Occidentale). After collecting the data, we examined what resulted in a vast and complex quantity of information destined to a peculiar scientific object such as an atlas. After publishing the first volumes we can start to draw some conclusions concerning the options that have guided our study and begin interpreting the results. With regards to future developments in considering and presenting the information, we noted that folklore texts are among the most essential and atypical parts of the collected data still in need of being fully appreciated in order to extract their ethnographical linguistic, sociolinguistic and textual meanings.

Il contributo propone alcune riflessioni maturate nel cantiere di ricerca per l’Atlante linguistico ed etnografico del Piemonte occidentale (ALEPO), lavorando dunque prima alla raccolta, poi all’elaborazione di un corpus di dati complesso e imponente, destinato a un oggetto scientifico peculiare qual è un atlante. Alla luce delle prime pubblicazioni dell’ALEPO è possibile tentare un bilancio delle scelte che hanno guidato la ricerca e iniziare a leggerne i risultati. Per quanto riguarda le prospettive di sviluppo nel trattamento e nella presentazione dei dati, tra le più importanti quelle che riguardano gli etnotesti, componente importante e peculiare del corpus di materiali raccolti per l’ALEPO, che va ancora pienamente valorizzata per metterne in luce i significati etnolinguistici, sociolinguistici e testuali.

Mots et textes : l’expérience d’un atlas Cet article présente quelques réflexions conçues durant l’élaboration de l’Atlante linguistico ed etnografico del Piemonte occidentale (ALEPO), du recueil des données jusqu’à la constitution d’un corpus imposant et complexe destiné à la création d’un objet scientifique d’un genre particulier, un atlas linguistique. A la lumière de la publication des premiers volumes de l’ALEPO, on peut esquisser un bilan des choix qui ont guidé la recherche et commencer à en tirer des conclusions. Il reste à développer les modalités de traitement et de présentation des données, en particulier des ethnotextes qui constituent une composante importante et originale du corpus de l’ALEPO, afin de mettre en évidence leur intérêt pour l’ethnolinguistique, la sociolinguistique et les analyses textuelles.

INDEX

Mots-clés: atlas linguistique, géographie linguistique, ethnolinguistique, Piémont Keywords: linguistic atlas, geographical linguistics, ethnographical linguistics, Piedmont

AUTHOR

SABINA CANOBBIO Università di Torino

Corpus, 12 | 2013 31

Le Baiser de la Belle au bois dormant ou : des péripéties encourues par la géographie linguistique depuis Jules Gilliéron

Hans Goebl

1. Remarque préliminaire

1 Le but de cet article1 est d’analyser de plus près le substrat méthodique et aussi idéologique sur lequel reposent l’ALF et la pensée géolinguistique de son créateur Jules Gilliéron (1854-1926). J’ajoute, en guise de préambule, que l’ALF remplit, de par sa structure bidimensionnelle très claire (6382 points d’enquête fois 1421 cartes d’atlas de la série A3) tous les prérequis d’une base de données classique et aussi – à cause de sa finalité linguistique bien définie – ceux d’un corpus (dialectal), dont il est couramment question dans ce volume. A la lumière de la rigueur des choix méthodiques sur lesquels repose la genèse de l’ALF, l’auteur estime que l’histoire post-gilliéronienne de la géographie linguistique est marquée par des tendances qui, en dernière analyse, sont allées à l’encontre des intentions générales de Gilliéron et du plan méthodique de l’ALF.

2. En vainquant le choléra par voie cartographique : l’exploit du docteur John Snow en 1854

2 Nous sommes au début du mois de septembre de 1854; la scène a lieu à Londres où le choléra sévit dans les quartiers populaires, en particulier dans celui de Soho. Quant à l’origine et aux modes de diffusion de cette maladie épidémique, les avis des médecins de l’époque sont partagés. Les uns favorisent la thèse selon laquelle la contamination par le choléra dépend du contact des humains avec les mauvaises odeurs (appelées

Corpus, 12 | 2013 32

alors miasmes) circulant dans l’atmosphère, alors que les autres pensent que c’est la consommation d’eau infectée qui provoque l’apparition de la maladie en question.

3 Le district de Soho, un des quartiers londoniens les plus touchés par le choléra, est placé sous la responsabilité du docteur John Snow (1813-1858). C’est un esprit éclairé qui, quant à la diffusion du choléra défend l’idée de la contamination par l’eau insalubre. Devant la nécessité d’enrayer d’urgence la propagation du choléra dans un triangle situé entre Broad Street, Golden Square and Work House, il décide de cartographier avec précision les trois facteurs suivants : • le réseau des ruelles du quartier, • les emplacements des pompes à eau utilisées avec régularité et • le nombre et les endroits des décès survenus quotidiennement.

4 Pour ce faire, il organise un réseau d’informants et de collaborateurs tout en les sommant à lui fournir les informations nécessaires jour après jour et à une heure établie à l’avance. La mise en carte des données recueillies sera effectuée par lui-même.

5 La préparation et le résultat de cette opération ont reçu une notoriété universelle. On en trouve des mentions dans tous les manuels de cartographie thématique4 et aussi dans beaucoup d’ouvrages épistémologiques.

6 En effet, le docteur Snow a réussi, moyennant cette mise en carte méticuleuse, à repérer une pompe à eau située au coin entre la Broad Street et la Cambridge Street autour de laquelle le nombre des décès dus au choléra culminait. Sans tarder, il en fit enlever la manivelle, après quoi le nombre des morts du choléra diminua rapidement.

7 La démarche et l’expérience du docteur John Snow sont exemplaires à plus d’un égard : • du point de vue théorique : il avait une théorie precise qui lui servait de fil conducteur intellectuel : c’était, d’un côté, la contagion de l’eau et, de l’autre, la conviction que la diffusion de la maladie dût obéir aux impératifs de l’espace. • du point de vue méthodique : étant au courant, de loin ou de près, de la cartographie thématique de son temps, il savait que l’utilisation réfléchie de cartes pouvait résoudre des problèmes qui autrement s’avéraient comme insolubles. • du point de vue opérationnel : il savait comment organiser la collecte des données dont il avait besoin.

8 Les actions de Snow étaient dictées par une finalité très claire – ciblée sur la découverte du secret de la propagation du choléra – et par les nécessités pratiques de la récolte de données empiriques et de leur mise en carte successive.

9 Dans l’optique de l’historien qui, en ce moment, est la nôtre, il appert donc que la victoire sur le choléra à Londres en 1854 dépendait de trois facteurs : • de la théorie épidémique correcte du docteur Snow, • de ses connaissance cartographiques et • de son habilité opérationnelle.

10 Evidemment, ce sont trois prérequis dont dépend également le bon maniement de n’importe quel corpus (géo)linguistique digne de ce nom.

11 Le lecteur attentif comprendra aisément que la Belle au bois dormant que le docteur Snow a réussi à trouver, réveiller et embrasser, est représentée par le noyau correct de sa théorie relative à la propagation du choléra. Nous verrons par la suite que le monde des dialectes offre de semblables chances aux linguistes animés de penchants théorisants similaires.

Corpus, 12 | 2013 33

3. Un regard critique sur la proto-histoire de l’ALF

12 Alors que pour l’AIS de Karl Jaberg (1877-1958) et Jakob Jud (1882-1952) et aussi pour beaucoup d’autres atlas linguistiques nationaux (comme l’atlas roumain ALR ou l’atlas ibérique ALPI) ou régionaux publiés après l’ALF, nos connaissances sur leurs conceptions et réalisations sont relativement bonnes, les informations dont nous disposons sur la proto-histoire, la collecte des données et l’impression de l’ALF sont plutôt limitées. Elles dépendent entièrement de ce que Jules Gilliéron a confié aux pages introductives de la fameuse « Notice servant à l’intelligence des cartes » (de 1902), de quelques brèves observations disséminées dans ses nombreuses publications géolinguistiques basées sur les données de l’ALF5 et des observations supplémentaires, pieusement réunies et publiées par Sever Pop (1901-1961) et sa fille Rodica Doina, longtemps après la mort du maître, survenue en 1926.

13 Il s’y ajoute les travaux historiques de la regrettée Marie-Rose Simoni-Aurembou, basés, entre autres, sur l’introspection du legs Gilliéron déposé à la Bibliothèque Nationale à Paris6, et aussi les apports de l’ « Ecole de Louvain », placée sous la direction de Pierre Swiggers7.

14 En 2005, ce bilan a été complété par l’ouvrage, richement illustré, de Jean Le Dû, Yves Le Berre et Guylaine Brun-Trigaud, qui, en dernière analyse, repose sur l’usage fait des cartes de l’ALF par un grand admirateur non romaniste de ce chef d’oeuvre de la romanistique, à savoir par le chanoine François Falc’hun (1909-1991), jadis professeur de Philologie Celtique aux Universités de Rennes (1951-1967) et de Brest (1967-1981).

15 C’est surtout de la somme dialectologique bien connue de Sever Pop, publiée en deux volumes en 1950, qu’il ressort avec netteté que, durant toute la durée du XIXe siècle, les intérêts dialectologiques ne cessaient de se concrétiser, certes, dans les majeures cultures d’Europe, mais que c’était surtout la France où cet essor d’idées était « général » puisqu’il était intimement lié à l’éclosion d’une conception particulière de l’espace national.

16 Nous entendons par là une riche gamme de préoccupations empiriques et analytiques déployées autour des territoires du Roi (ou de l’Empereur) de France d’abord et de la République française par la suite, de la part d’économistes, géographes, cartographes, géodètes, militaires et ingénieurs de toute sorte, visant toutes à maîtriser les multiples avatars de l’espace de la France par l’accumulation et le raffinement du savoir relatif à ses propriétés, fonctions, richesses et aussi à ses limitations et contraintes8.

17 On connaît l’intérêt du XVIIIe siècle et aussi de l’administration napoléonienne (et post- napoléonienne) pour la cueillette (systématique) de traductions de la Parabole de l’Enfant Prodigue9 qui servaient à déceler la bigarrure linguistique (mieux : dialectale) de la France et des pays récemment conquis par les armes. Rappelons, à ce propos, les noms de Charles-Etienne Coquebert de Montbret (1755-1831) et de son fils Eugène- Barthélémy (1785-1849) à qui l’on doit la première collecte systématique et standardisée de données dialectales pour des espaces tant très étendus que bien circonscrits. Malheureusement, le résultat de la mise en carte de ces recherches dont Coquebert le Jeune parle explicitement en 183110, n’a pas été conservé.

18 Un autre fait doit être évoqué avec insistance. C’est la départementalisation de la France, survenue très peu de temps après l’éclatement de la Révolution française11. La mise en

Corpus, 12 | 2013 34

place – réalisée avec beaucoup d’aplomb administratif et politique – du nouveau réseau départemental en substitution de l’ancienne bigarrure enchevêtrée des provinces, comtés et duchés de type féodal, a créé non seulement une nouvelle conscience de l’espace national basée sur l’idée du quadrillage, de l’équidistance et de la parité fondamentale des nouvelles subdivisions territoriales, mais a également fourni de nouvelles possibilités empiriques pour l’administration nationale et tous les intellectuels oeuvrant à son service.

19 En effet, la liste des 75 premiers départements représente, en dernière analyse, un échantillon standardisé de premier ordre de l’espace total de la France auquel s’est superposé plus tard un échantillon supplémentaire comprenant un nombre – d’ailleurs fort limité – d’agglomérations majeures de chaque département. Or, il est peu connu parmi les linguistes que durant tout le XIXe siècle il s’est formé en France une cartographie officielle très développée qui, d’un côté, reposait sur d’intenses recherches empiriques thématiquement très diversifiées, réalisées sur la base du réseau départemental élargi par les lieux centraux de chaque département, et, de l’autre, sur une visualisation de plus en plus élaborée et efficace des données recueillies. En 1996, le géographe français Gilles Palsky en a fait le point dans une synthèse richement documentée et illustrée.

20 De toutes ces activités géographiques et cartographiques il est né une sensibilisation universelle pour l’espace de la France dont on trouve bien sûr des retombées aussi sur le plan de la dialectologie. Mentionnons à ce propos les débats relatifs au parcours précis de la frontière entre les domaines d’Oïl et d’Oc dans le cadre duquel s’inscrivent les recherches empiriques sur le terrain qui – ayant le rang d’une mission officielle subventionnée par le Ministère de l’Intérieur même – ont été effectuées par Charles de Tourtoulon (1836-1913) et Octavien Bringuier (1829-1875) entre 1873 et 1875, suivies en 1876 – c’est-à-dire déjà après la mort d’O. Bringuier – de la publication d’un rapport et d’une carte qui n’englobait malheureusement que la partie occidentale de l’espace parcouru12.

21 Signalons en outre que la bipartition linguistique de la France en Oc et Oïl, bien connue depuis longtemps, a fini par devenir une pomme de discorde scientifique d’un côté et un « risque » pour l’unité de la Nation de l’autre, surtout en temps de crise. Ce conflit, surgi entre les philologues Paul Meyer (1840-1917) et Gaston Paris (1839-1903) d’un côté, et le dialectologue italien Graziadio Isaia Ascoli (1829-1907) de l’autre. portait sur la question de savoir si l’articulation dialectale de la France comportait seulement deux compartiments (= Oc + Oïl) comme le voulaient P. Meyer et G. Paris, ou même trois (= Oc + Oïl + franco-provenzale), comme le prétendait G. I. Ascoli13 à l’appui de preuves dont le bien-fondé est de nos jours universellement reconnu14.

22 Pour la date de l’éclatement de ce conflit (cf. Meyer 1875) le contexte historico- politique n’est pas sans importance : elle se situe quatre ans après la fin de la guerre franco-prussienne de 1870/71, donc dans une période riche en soubresauts nationalistes de toute sorte, et où l’idée de cohésion et de l’indivisibilité du sol national avait le rang d’une obsession omniprésente.

Corpus, 12 | 2013 35

4. Un coup d’œil rétrospectif dans l’atelier de Jules Gilliéron

23 Jules Gilliéron est né en 1854 dans la Suisse romande (à La Neuveville, aux bords du Lac de Bienne), fut élevé dans sa patrie et s’est installé définitivement à Paris en 1876, donc à l’âge de 22 ans. En 1886, à 32 ans, il a sollicité et reçu la citoyenneté française en tant que Maître de conférences à l’Ecole Pratique des Hautes Etudes, charge qu’il occupa à partir de 1882 jusqu’en 1926, l’année de sa mort. En outre, il enseigna comme professeur d’allemand au Lycée Chaptal entre 1878 et 1897.

24 Grâce à ces deux fonctions, il était en contact étroit et permanent avec les élites intellectuelles de la France et pouvait donc se familiariser avec tous les acquis intellectuels, culturels et administratifs de la France impériale, royale et républicaine du XIXe siècle. Quant au penchant indéniable de Gilliéron pour la géographie, il ne faut non plus oublier que son père Jean Victor (1826-1890) était géologue15. Il est donc tout à fait probable que la rigueur géo- et cartographique de l’ALF dépend, chez Gilliéron, à parts égales, de l’héritage spirituel de son père et de ce dont il a pu prendre acte à Paris à partir de 1876.

25 Il est bien connu que Gilliéron, fort de son expérience juvénile avec le « Petit atlas phonétique du Valais roman » (publié en 1881) a mûri l’idée de l’ALF dans un perpétuel échange d’idées avec le célèbre philologue G. Paris qui a fini par lui en fournir les subsides nécessaires voire indispensables, tant pour la réalisation des enquêtes que pour l’impression effectuée à Mâcon par les soins de l’imprimerie Protat Frères16.

26 Quant à la maturation des idées de Gilliéron relatives à l’ALF, il faut admettre, chez lui, la genèse de deux « convictions » qui, dans la rétrospective, peuvent également être qualifiées de théories :

27 1) que l’espace de la France – mieux : de la Galloromania – est une espèce de « machine » régie, entre autres, par les mécanismes du langage dialectal. Toutes les expériences antérieures, faites au cours du XIXe siècle par les géographes, économistes, démographes et « statistiques » ont démontré que tel était le cas pour beaucoup de variables d’origine humaine, économique ou technique.

28 2) que les locuteurs dialectophones – bilingues (dialecte local et français) déjà à des pourcentages très élevés à la fin du XIXe siècle – sont capables d’extraire, au moment de l’enquête, de leur compétence multiple la composante dialectale, et de la présenter à l’enquêteur sous une forme qui, dans une optique moderne, peut être qualifiée comme étant « métrologiquement décantée ». C’est justement ce processus de « décantation » pragmalinguistique qui se déroule pendant l’acte de traduction, faite par le sujet interviewé, auquel on doit attribuer le haut degré d’intercomparabilité des données répertoriées sur les 1421 planches de l’ALF.

29 N’oublions pas que la plus sévère des consignes qu’avait reçues E. Edmont de J. Gilliéron pour la réalisation des enquêtes, était de toujours enregistrer la première réponse et d’éviter toute extorsion des répliques.

30 C’est à cette sobriété discursive qu’est due, entre autres, la rapidité des enquêtes faites pour l’ALF. En effet, E. Edmont a employé, tout compte fait, seulement 1351 jours pour réaliser les 639 enquêtes de l’ALF17. Ceci donne la moyenne de 2,11 jours pour chaque enquête, dont la longueur variait entre 1421 (pour la série A) et 1920 (pour la série C)

Corpus, 12 | 2013 36

questions. Etant donné le haut degré de fiabilité des réponses ainsi recueillies – et qui avait été démontré très souvent – l’expéditivité inégalable d’Edmont a depuis toujours suscité ma plus haute admiration.

31 A partir de 1902, les dialectologues – tant en France qu’à l’étranger – pouvaient donc se servir d’un corpus qui présentait les atouts suivants : 1) relevé hautement standardisé des réponses auprès de sujets interviewés à l’aide d’un questionnaire soigneusement préparée et préalablement testée, par les soins d’une personne dotée d’une fiabilité personnelle et d’une ténacité physique extraordinaires,

32 2) intercomparabilité parfaite des données transcrites,

33 3) données très complètes et, de ce fait, peu lacunaires.

34 Tout compte fait, je n’hésite pas à qualifier l’entreprise de l’ALF comme une sorte de géodésie faite avec des moyens linguistiques, et de l’appeler ainsi glotto-géodésie18.

35 J. Gilliéron et son imprimeur Georges Protat ont en outre ouvert la voie à un dépouillement efficace des planches de l’ALF par la mise à disposition de cartes muettes19 en format A3 dont l’utilité pratique a tout de suite été reconnue par les spécialistes. C’est ainsi que le romaniste suisse Karl Jaberg en a fait une description détaillée déjà en 1906 dans la « Zeitschrift für romanische Philologie ».

36 N’oublions pas non plus que l’entier « système ALF » comprenait, surtout après la publication des premiers fascicules à partir de 1902, aussi l’enseignement « magnétique » de Jules Gilliéron à l’Ecole Pratique des Hautes Etudes auquel participait la fine fleur des romanistes et linguistes européens de l’époque20.

37 Le propre de cet enseignement et aussi de la productivité scientifique de J. Gilliéron lui- même était la prise en compte « enveloppante » des données de l’ALF qui, de ce fait, ont toujours été perçues non seulement comme « systémiques » en tant que telles, mais aussi comme reflets d’un « système » extérieur, que ceci soit réel, sous-jacent ou même caché. Rares étaient ceux qui se bornaient à voir, dans les données de l’ALF, un amas de données dialectales hétéroclites dont le seul avantage était leur datation et localisation excellentes.

5. La fortune ultérieure de l’ALF

38 L’usage qui a été fait des données publiées de l’ALF s’est développé dans deux directions : dans celle d’un dépouillement intégral de planches isolées ou – très rarement – combinées de l’ALF, et dans celle de l’utilisation particulière de ses données telle qu’elle était, entre autres, la pratique courante dans l’établissement du FEW21.

39 Il est curieux de voir que Jules Gilliéron lui-même – qui pourtant venait de rassembler un corpus ultra-systémique – se limitait, dans ses propres travaux géolinguistiques, à des analyses psychologisantes de cartes-ALF isolées alors que des chercheurs germanophones – à commencer par Karl Jaberg22 – ont très tôt cédé à la tentation globalisante pour dresser des synthèses isoglottiques et des cartes à densité dont on ne trouve aucune trace en France avant les années 50 du XXe siècle23.

40 Les reproches n’ont pas tardé à pleuvoir sur l’ALF. Mais ces reproches ne visaient pas son caractère systémique comme tel, mais une prétendue défectuosité des transcriptions, des lacunes dans le questionnaire et surtout le maillage trop lâche de

Corpus, 12 | 2013 37

son réseau. C’étaient des voix qui culminaient dans la revendication d’une plus grande « authenticité » documentaire des données de l’atlas24.

41 On connaît les résultats de ces tentatives : c’est la splendide série des « Nouveaux Atlas Linguistiques de la France » (NALFs)25 qui tous ont été faits pour étudier « de plus près » les patrimoines dialectaux de provinces et régions historiquement typées, tant par le resserrement du réseau d’exploration, la « popularisation » des méthodes d’enquête (moyennant l’usage du patois local, la conversation dirigée ou même libre à la place de l’application d’un questionnaire standardisé) que par l’adaptation du contenu du questionnaire respectif aux exigences (factuelles, linguistiques, ethnographiques etc.) de la région concernée.

42 Malheureusement l’écrasante majorité des quelque 30 NALFs ainsi établis a été réalisée dans l’oubli presque complet des consignes données au départ par Albert Dauzat, l’instigateur de l’idée des NALFs. Comme les questionnaires des différents NALFs ne disposent même pas de 10 questions communes26, il est complètement impossible de s’en servir pour vérifier, à l’aide d’un réseau plus serré, la persistance, à la distance de quelque 50 ans, des structures dialectales globales et, partant, sous-jacentes de la Galloromania dont l’existence a été révélée par l’ALF et prouvée dans les détails par les apports de la dialectométrie27.

43 J’ajoute, entre parenthèses, que la dialectométrie considère les structures de profondeur citées ci-dessus comme émanation directe d’une activité langagière particulière des locuteurs visant à s’approprier linguistiquement l’espace dans lequel ils vivent. Pour la saisie terminologique de cet effet, j’utilise, depuis un certain temps, le concept de la « gestion basilectale de l’espace par l’homo loquens »28.

44 L’on sait que K. Jaberg et J. Jud ont remplacé, dans la rédaction du questionnaire de leur atlas italo-suisse AIS, la sobriété sémantique du questionnaire de l’ALF par une allure beaucoup plus ethnographique, tout en répondant, de cette manière, au filon de recherche « Wörter und Sachen » de trempe onomasiologique29. Ce faisant, Jaberg et Jud – qui n’ont jamais cessé de se considérer comme élèves de J. Gilliéron – n’ont d’ailleurs pas forcé la dose. Ce qui fait que les planches de l’AIS révèlent, comme celles de l’ALF, l’existence de structures dialectales de profondeur très nettes30.

6. De l’atlas basilectal à l’atlas de répertoire

45 Rappelons d’entrée de jeu que malgré la frénésie documentaire (ou faudrait-il dire : documentaliste ?) déployée dans la période des NALFs, la volonté de déceler, à côté de la documentation « réelle », « positive » et audible, aussi des structures systémiques de profondeur ne s’est pas éteinte. C’est justement dans le cadre de l’atlas linguistique gascon (ALG) et sous l’impulsion d’un fourmillement inouï de variantes dialectales y ayant trait, qu’est née, dans la tête de son auteur Jean Séguy (1914-1973) l’idée de synthétiser cet apparent chaos et de le mettre en formule. Xavier Ravier, son compagnon de travail de longue date, a relaté à ce sujet les propos suivants de Jean Séguy : « Désormais je peux crever tranquille. L’idée fixe qui me hantait depuis trente ans est réalisée ; à partir de 47 millions de chiures de mouche scrupuleusement intégrées, arriver, par une série d’abstractions à la fois mathématiques et réalistes, à faire tenir le gascon dans une formule ou un schéma. » (Ravier 1976, 390).

Corpus, 12 | 2013 38

46 Depuis 1971 ou 197331, la dialectométrie a fait d’énormes progrès, et ceci aussi en dehors de la romanistique. Mais c’est également la dialectométrie – mieux : l’essai d’appliquer les méthodes dialectométriques à proprement parler – qui a révélé certaines faiblesses de recueils de données plus récents qui, à l’instar de l’ALF ou de l’AIS, se décorent du qualificatif d’ « atlas » ou « atlante » (etc.). Beaucoup de ces entreprises ont abandonné les principes de la collecte sélective de données en se proposant de ne pas se limiter à des réponses jugées dialectales par les locuteurs eux- mêmes, mais de s’adonner allègrement à la documentation de toute l’ampleur des compétences – forcément multiples – des sujets. C’est de là qu’est née l’idée de l’ « atlante repertorio », cultivée surtout en Italie. Je cite à ce propos les entreprises du « Nuovo Atlante del Dialetto e dell’Italiano per Regioni » (NADIR) conçu par Alberto Sobrero, de l’ « Atlante linguistico siciliano » (ALS)32, promu par Giovanni Ruffino, et de l’ « Atlante linguistico della Campania » (ALCam)33, dirigé par Edgar Radtke.

47 Une des conséquences pratiques de l’élargissement programmatique du rayon d’action de la collecte des données était la multiplication – souvent de forme carrément incontrôlable – de variantes (réponses multiples). Ce qui a échappé complètement aux promoteurs de cette nouvelle stratégie était le fait qu’avec l’élargissement de la vertu documentaire des enquêtes allait de pair la diminution de l’ intercomparabilité des données recueillies et, partant, de leur caractère systémique, et qu’ils emboîtaient, de ce fait, le chemin dictionnairique que Gilliéron qualifiait avec mépris de la façon suivante : « dictionnaire – cimetière ».

48 « Qui trop embrasse, peu étreint » : il y a des vérités scientifiques aussi dans les proverbes les plus banals.

49 Evidemment, une documentation faite sous le signe de l’ « atlante repertorio » est plus authentique ou naturaliste34 qu’une enquête réalisée sur le modèle de l’ALF. Je ne nie aucunement l’utilité de l’authenticité et du naturalisme pour certains propos. Mais j’insiste sur le fait que ces propos ne sauront jamais répondre aux exigences théoriques d’une base de données compilée à la gilliéronienne.

50 Depuis quelque temps je suggère aux tenants de l’ « atlante repertorio » de ne plus utiliser le qualificatif d’atlas (ou atlante) pour leurs recueils afin d’éviter des confusions malencontreuses35.

51 Le même scepticisme concerne l’outil empirique des ethnotextes dont il existe, dans différents pays européens, des collections très riches qui permettent de couvrir l’étendue entière des pays en question. Certes, la valeur documentaire des ethnotextes est hors de doute ; mais ils obéissent à des impératifs empiriques très différents de ceux d’une enquête standardisée à la façon de l’ALF si bien qu’il est complètement vain de vouloir créer, à partir d’un grand nombre d’ethnotextes éparpillés sur le terrain, l’équivalent fonctionnel d’un atlas linguistique à proprement parler de la même région36.

52 Quant à la collecte de données linguistiques structurées – et partant capables de servir de base de données ou de corpus –, il y a – depuis quelque 20 à 30 ans – dans la tête des linguistes, la conviction, complètement erronée, qu’il y en a deux espèces : la soi-disant « bonne » qui consiste à tendre le micro à qui que soit tout en l’invitant à s’exprimer entièrement à son gré, et la « mauvaise » qui prévoit, durant l’enquête, l’observation directe et indirecte de principes et contraintes empiriques préalablement définies37.

Corpus, 12 | 2013 39

53 L’engouement général pour la « bonne » des deux méthodes et le rejet actuel de la « mauvaise » vont à l’encontre de tous les principes de l’observation scientifique tant dans les sciences naturelles que dans les sciences humaines. Toute observation revient à une distanciation de l’objet observé et aussi à un réajustement de ce dernier dans un univers théorique préalablement défini. Or, distanciation et réajustement ne sont ni authentiques ni naturalistes. Toujours est-il que les expériences du bon rendement et de la fécondité de la démarche « contraignante », faites dans beaucoup de sciences au cours de quelque 2 500 ans de pratique scientifique, montrent qu’avec une approche moins romantique et plus réfléchie l’on progresse plus vite et avance plus loin.

7. L’atlas basilectal à l’ère des corpus et des bases de données : l’exemple de l’ALD

54 En ce qui concerne notre atlas ALD (résolution italienne du sigle ALD : « Atlante linguistico del ladino dolomitico e dei dialetti limitrofi »), il a été réalisé entre 1985 et 2012 en deux tranches comme le montre le tableau suivant.

55 Inutile de dire que sa conception est entièrement gilliéronienne. Les principes en sont donc éminemment « géométriques » ou carrément « glotto-géodétiques » Notre propos central n’était donc pas d’augmenter nos connaissances « positives » des dialectes en question ou de dénicher des mots et tournures tout particulièrement « intéressants », mais de rassembler des informations dialectales suffisamment fiables pour permettre l’étude serrée des multiples enchevêtrements et relations qui existent entre les locolectes de l’espace en question. En bref, il s’agissait de préparer tout pour en savoir plus sur la « gestion basilectale de l’espace-ALD » par ses habitants.

Descriptif des deux parties de l’atlas linguistique ALD

Propriété ALD-I ALD-II

Morphologie (nominale et Contenu du Phonétique et morphologie 1 verbale) élaborée, syntaxe et questionnaire (nominale et verbale) élémentaire lexique

Nombre des items 2 linguistiques du 806 1063 questionnaire

Items non Oui : de nature géographique, Oui : de nature géographique, 3 linguistiques dans le administrative, ethnographique et administrative, ethnographique questionnaire historiques et historiques

Registre linguistique 4 basilecte basilecte visé

Interviews standardisées sur le Interviews standardisées sur le 5 Mode d’enquête terrain conduites par des terrain conduites par des linguistes linguistes

Corpus, 12 | 2013 40

Mode d’élicitation des Invitation à ne produire que des Invitation à ne produire que des 6 réponses énoncés jugés « dialectaux » énoncés jugés « dialectaux »

Nombre minimal de 2 7 sujets interviewés par 1 (sociologiquement différenciés) localité

Nombre total des 8 488 833 sujets interviewés

Système de 9 AIS (Ascoli-Böhmer) AIS (Ascoli-Böhmer) transcription

Transcriptions, enregistrements des Transcriptions, enregistrements Données collectées sur 10 interviews, documentation des interviews, documentation le terrain ethnophotographique ethnophotographique

Durée totale des 217 11 relevés effectués sur le 1985-1992 2001-2007 terrain

Rapports de travail 12 Oui (dans la revue « Ladinia ») Oui (dans la revue « Ladinia ») périodiques

Dates de la publication 13 1998 2012 de l’ouvrage imprimé

Composition de 4 volumes in-folio, trois volumes 5 volumes in-folio, trois volumes 14 l’ouvrage imprimé avec des index avec des index

Nombre des planches 15 884 1066 linguistiques

« Atlas sonore » (sur DVD et en Base de données sonore39 (SDB), ligne38), base de données sonore 16 Outils informatiques moteur de recherche et triage (SDB), moteur de recherche et (IRS)40 triage (IRS)

Site web 17 http://ald1.sbg.ac.at/ http://ald2.sbg.ac.at/ multifonctionnel

Accès ouvert (public) à 18 la documentation Non (accès seulement sur demande) Oui imprimée

56 Précisons que le réseau d’enquête comprend 217 points d’atlas qui embrassent une superficie de quelque 25 000 km2 qui, elle, couvre les régions et cantons italiens et suisses suivants : Lombardie orientale, Grisons orientaux, Trentin, Ladinie dolomitique, Vénétie centrale et septentrionale ainsi que le Frioul occidental. Les enquêtes ne visaient que les prestations basilectales des indigènes telles qu’elles ont été définies par eux-mêmes.

Corpus, 12 | 2013 41

57 Une autre propriété d’un corpus – dont on parle d’ailleurs peu – est le fait qu’il doit être utilisé (et réutilisé) plus d’une fois, non seulement par son créateur, mais aussi par d’autres chercheurs, aujourd’hui et surtout dans l’avenir. La deuxième de ces deux possibilités suppose une préparation adéquate des structures du corpus en question évidemment en recourant à toutes les possibilités de l’informatique moderne. Sur ce plan, l’atelier de l’ALD a fourni un certain nombre de solutions informatisées dont nous espérons qu’elles pourront servir pour un laps de temps pas trop circonscrit.

58 Evidemment, quand on prépare un corpus il faut songer aux besoins d’éventuels utilisateurs ce qui, en dernière analyse, est un travail de « théorisation » anticipée. C’est ainsi que pour l’ALD l’utilisateur idéal qui nous a servi de modèle, est non seulement un dialectologue-linguiste animé d’intérêts traditionnels – visant donc à la consultation, ponctuelle et globale, mais toujours limitée, de la documentation visuelle et acoustique de l’atlas – mais aussi quelqu’un qui soit prêt à entreprendre des recherches plus avancées et à se servir directement des deux bases de données (contenant les transcriptions) elles-mêmes41.

59 Malheureusement, devant la caducité notoire de tous les gadgets de l’informatique il est vain de vouloir spéculer sur un avenir lointain. A long terme, la fonctionnalité « tous azimuts » des bases de données sonores (SDB) et des moteurs de recherche (IRS) des deux volets de l’ALD dépendra avant tout du bon fonctionnement des serveurs de l’Université de Salzbourg et de la persistance de la compatibilité – aussi générale que possible – de certaines composantes des logiciels respectifs.

60 Toujours est-il que, dans 50 ou 100 ans, des deux parties de l’ALD il ne subsistera que les deux éditions d’atlas en papier, reliées en bleu marin (ALD-I) et en rouge Bordeaux (ALD-II).

61 Espérons qu’alors leur caractère initial de « corpus » sera toujours évident.

8. Réflexions finales

62 Revenons encore une fois sur la trame métaphorique du réveil de la Belle au bois dormant provoqué par l’intercession d’un prince épris de sa beauté. Les deux pivots substantiels de ce conte sont, d’un côté, l’existence d’un secret qui demande à être découvert, et, de l’autre, celle d’un explorateur qui est poussé par sa curiosité, donc par quelque chose d’inné.

63 Le prince n’est pas quelqu’un qui flâne d’une façon irréfléchie dans une grande forêt dont il n’a aucune idée, mais, au contraire quelqu’un qui, de la forêt où il s’aventure, a déjà une « certaine idée ». Il en a une théorie.

64 La Belle au dormant est la cible de cette théorie ; ce n’est qu’au moment de sa découverte qu’elle peut révéler toute son essence au prince qui en sera ravi ou déçu, selon le cas. Elle assumera le rôle de la justification d‘une vision ou théorie.

65 Ni Charles Perrault ni les frères Grimm n’en parlent : mais je parie que le prince se servait, dans sa recherche du château de la princesse endormie, d’une bonne carte, d’un compas et d’une paire de jumelles, et qu’il avait raconté, après, son exploit à ses amis pour que d’autres traversées de forêts obscures puissent être faites avec moins de risques.

66 C’est là le secret de la linguistique de corpus, appliquée à la géographie linguistique.

Corpus, 12 | 2013 42

BIBLIOGRAPHY

AIS = Jaberg K. & Jud J. (1928-1940). Sprach- und Sachatlas Italiens und der Südschweiz. 8 vol. Zofingen : Ringier (réimpression : Nendeln : Kraus, 1971).

ALD-I = Goebl H., Bauer R., Haimerl E. et al. (éd.) (1998). Atlant linguistich dl ladin dolomitich y di dialec vejins, 1a pert/Atlante linguistico del ladino dolomitico e dei dialetti limitrofi, 1a parte/Sprachatlas des Dolomitenladinischen und angrenzender Dialekte, 1. Teil. 4 vol. in-folio (avec cartes), 3 vol. d’index, 3 CD-ROM. Wiesbaden : L. Reichert.

ALD-II = Goebl H. et al. (éd.) (2012). Atlant linguistich dl ladin dolomitich y di dialec vejins, 2a pert/ Atlante linguistico del ladino dolomitico e dei dialetti limitrofi, 2a parte/ Sprachatlas des Dolomitenladinischen und angrenzender Dialekte, 2. Teil. 5 vol. in-folio (avec cartes), 3 vol. d’index. Strasbourg : Editions de Linguistique et de Philologie.

ALF = Gilliéron J. & Edmont E. (éd.) (1902-1910). Atlas linguistique de la France. 10 vol. Paris : Champion (réimpression : Bologna, Forni, 1968).

ALG = Séguy J. (1954-1974). Atlas linguistique et ethnographique de la Gascogne. 6 vol. Paris : CNRS.

ALPI = Atlas lingüístico de la península ibérica (1962). Vol. I. Fonética. Madrid : CSIC.

ALR = Puşcariu S., Pop S. & Petrovici E. (éd.) (1938-1942). Atlasul lingvistic român. 2 vol. Sibiu : Muzeul Limbii Române, Leipzig : Harrassowitz.

Anderwald L. & Szmrecsanyi B. (2008). « Corpus linguistics and dialectology », in Lüdeling A. & Kytö M. (éd.) Corpus Linguistics. Berlin : Mouton de Gruyter, Handbücher der Sprach- und Kommunikationswissenschaft 29, vol. 2, 1126-1140.

Ascoli G.I. (1874). « Schizzi franco-provenzali », Archivio glottologico italiano 3 : 61-120.

Bauer R. (2009). Dialektometrische Einsichten. Sprachklassifikatorische Oberflächenmuter und Tiefenstrukturen im lombardo-venedischen Dialektraum und in der Rätoromania. San Martin de Tor : Istitut ladin Micurà de Rü (Ladinia monographica 01).

Billy P.-H. (1993). Index onomasiologique des Atlas linguistiques par régions (domaine gallo-roman), de l’Atlas linguistique de la France et du Französisches etymologisches Wörterbuch, XXI-XXIII. Toulouse : Presses Universitaires du Mirail.

Brun-Trigaud G., Le Berre, Y. & Le Dû J. (2005). Lectures de l’Atlas linguistique de la France de Gilliéron et Edmont. Du temps dans l’espace. Essai d’interprétation des cartes de l’Atlas linguistique de la France de Jules Gilliéron et Edmond Edmont augmenté de quelques cartes de l’Atlas linguistique de la Basse-Bretagne de Pierre Le Roux. Paris : CTHS.

Coquebert de Montbret B.-E. & Bouderie J. (1831). Mélanges sur les langues, dialectes et patois renfermant, entre autres, une collection de versions de la Parabole de l’Enfant Prodigue en cent idiomes ou patois différents, presque tous de France, précédés d’un essai de travail sur la géographie de la langue française. Paris : Delaunay.

Ettmayer K. von (1924). « Über das Wesen der Dialektbildung, erläutert an den Dialekten Frankreichs », Denkschriften der Akademie der Wissenschaften in Wien, philosophisch-historische Klasse, vol. 66/3, 1-56, 7 tableaux.

FEW = Wartburg W. von (1922 ss.). Französisches etymologisches Wörterbuch. Bonn, Berlin, Basel : Klopp, Teubner, Zbinden.

Corpus, 12 | 2013 43

Gilliéron J (1881). Petit atlas phonétique du Valais roman (Sud du Rhône). Paris : Champion (réimpression : Sion : Editions VP, 1997).

Gilliéron J. (1902). Notice servant à l’intelligence des cartes. Paris : Champion. (réimpression : Bologna, Forni, 1968).

Goebl H. (1984). Dialektometrische Studien. Anhand italoromanischer, rätoromanischer und galloromanischer Sprachmaterialien aus AIS und ALF. 3 vol. Tübingen : Niemeyer.

Goebl H. (2002). « Analyse dialectométrique des structures de profondeur de l’ALF », Revue de linguistique romane 66 : 5-63.

Goebl H. (2003). « Regards dialectométriques sur les données de l’Atlas linguistique de la France (ALF) : relations quantitatives et structures de profondeur », Estudis Romànics 25 : 59-96.

Goebl H. (2004). « Joseph Durand (de Gros), 1826-1900. Ein weitgehend unbekannter Protagonist in der Ascoli-Meyer-Debatte über die Existenz von Dialekten », in A. Gil, D. Osthus & Cl. Polzin- Haumann (éd.). Romanische Sprachwissenschaft. Zeugnisse für Vielfalt und Profil eines Faches. Festschrift für Christian Schmitt zum 60. Geburtstag. Frankfurt/Main, Berlin : Lang, vol. 1, 169-192.

Goebl H. (2006). « Warum die Dialektometrie nur in einem romani(st)ischen Forschungskontext entstehen konnte », in W. Dahmen, G. Holtus, J. Kramer J., M. Metzeltin, W. Schweickard & Winkelmann O. (éd.) Was kann eine vergleichende romanische Sprachwissenschaft heute (noch) leisten ? Romanistisches Kolloquium vol. XX. Tübingen : Narr, 291-317.

Goebl H. (2008). « La dialettometrizzazione integrale dell’AIS. Presentazione dei primi risultati », Revue de linguistique romane 72 : 25-113.

Goebl H. (2010). « La concezione ascoliana del ladino e del franco-provenzale », in Marcato C. / Vicario F. (éd.). Il pensiero di Graziadio Isaia Ascoli a cent’anni della scomparsa. Convegno internazionale, Gorizia-Udine, 3-5 maggio 2007. Udine : Società Filologica Friulana, 147-175.

Jaberg K. (1906). « Zum Atlas linguistique de la France », Zeitschrift für romanische Philologie 30 : 512.

Jaberg K. (1908). Sprachgeographie. Beitrag zum Veständnis des Atlas linguistique de la France. Aarau : Sauerländer (traduction espagnole : Geografía lingüística. Ensayo de interpretación del « Atlas lingüístico de Francia ». Traducción de A. Llorente y M. Alvar. Granada : Universidad de Granada, 1959).

Jaberg K. (1903). Aspects géographiques du langage. Paris : Droz.

Jaberg K. & Jud J. (1928). Der Sprachatlas als Forschungsinstrument. Kritische Grundlegung und Einführung in den Sprach- und Sachatlas Italiens und der Südschweiz. Halle : Niemeyer (réimpression : Nendeln : Kraus, 1973; traduction italienne : L’atlante linguistico come strumento di ricerca. Fondamenti critici e introduzione. Edizione italiana a cura di G. Sanga e S. Baggio. Milano : Unicopli, 1987).

Lauwers P., Simoni-Aurembou M.-R. & Swiggers P. (éd.) (2002). Géographie linguistique et biologie du langage. Autour de Jules Gilliéron. Leuven/Louvain. Paris, Dudley, M.A : Peeters.

Lequin G. (1924). Georges Protat (1857-1923). Mâcon : Protat frères.

Meyer P. (1875). Compte rendu de : Ascoli 1874, Romania 4 : 293-296.

NADIR = Sobrero A., Romanello M. T. & Tempesta I. (1991). Lavorando al NADIR. Un’idea per un atlante linguistico. Galatina : Congedo.

Corpus, 12 | 2013 44

Ozouf-Marignier M.-V. (1989). La formation des départements : représentions du territoire français à la fin du XVIIIe siècle. Paris : Editions de l’Ecole des Hautes Etudes en Sciences Sociales.

Palsky G. (1996). Des chiffres et des cartes. Naissance et développement de la cartographie quantitative française au XIXe siècle. Paris : CTHS.

Pop S. (1950). La dialectologie. Aperçu historique et méthodes d’enquêtes linguistiques. 2 vol. Louvain : chez l’auteur, Gembloux : Duculot.

Pop S. & Pop R. D. (1959). Jules Gilliéron. Vie enseignement, élèves, oeuvres, souvenirs. Préface de Pierre Chantraine. Louvain : Centre International de dialectologie générale.

Ravier X. (1976). « Jean Séguy et la traversée du langage gascon. Réflexions sur une topogenèse géolinguistique », Revue de linguistique romane 40 : 389-402.

Robinson A. H. (1982). Early thematic mapping in the history of cartography. Chicago, London : University of Chicago Press.

Roncayolo, M. (1992). « Le département », in Nora P. (éd.). Les lieux de mémoire. Vol. 3, 1 : Les France. Paris : Gallimard, 884-929.

Séguy J. (1971). « La relation entre la distance spatiale et la distance lexicale », Revue de linguistique romane 35 : 335-357.

Séguy J. (1973). « La dialectométrie dans l’Atlas linguistique de la Gascogne », Revue de linguistique romane 37 : 1-24.

Simoni-Aurembou M.-R (1989). « La couverture géolinguistique de l’Empire français : l’enquête de la Parabole de l’Enfant Prodigue », in Espaces romans. Etudes de dialectologie et géolinguistique offertes à Gaston Tuaillon. Grenoble : ELLUG, vol. 2, 114-139.

Storost J. (2008). In memoriam Vladimiro Macchi. Aspekte der Wissenschaftsgeschichte. Ausgewählte Sujets. Bonn : Romanistischer Verlag.

Szmrecsanyi B. (2013) Grammatical Variation in British Dialects. A Study in Corpus-Based Dialectometry. Cambridge. Cambridge University Press.

Tourtoulon Ch. de & Bringuier O. (1876). « Rapport sur la limite géographique de la langue d’oc et de la langue oïl », Archives des Missions scientifiques et littéraires III/3 : 544-605, 1 carte.

Tufte E. R. (1997). Visual Explanations. Images and Quantities, Evidence and Narrative. Cheshire, Connecticut : Graphics Press.

NOTES

1. Révison stylistique de mon texte français : Lily Ditz-Fuhrich, Université de Salzbourg. Qu’elle reçoive ici l’expression de ma parfaite reconnaissance. 2. Le nombre exact des points d’enquête de l’ALF est 638. Comme au point-ALF 284, Saint-Pol-sur- Ternoise, Edmond Edmont a fait deux enquêtes, le nombre des enquêtes faites pour l’ALF s’élève à 639. La confusion très fréquente entre ces deux chiffres est due à des imprécisions contenues déjà dans la fameuse « Notice servant à l’intelligence des cartes », publiée par J. Gilliéron en 1902, donc au moment de la parution du premier fascicule de l’ALF. 3. Pour les trois séries de cartes de l’ALF (A-C) voir les tableaux respectifs dans Pop/Pop 1959, 96-118. 4. Cf. Robinson 1982, 176-180, Palsky 1996, 81-84 et Tufte 1997, 27-37.

Corpus, 12 | 2013 45

5. Pour la bibliographie complète et une synopse thématique des travaux de Gilliéron cf. Pop/ Pop 1959, 128-146 et 20-33. 6. B.N. de Paris : cotes du legs de Gilliéron : NAF 11971-12030. 7. Cf. Lauwers/Simoni-Aurembou/Swiggers 2002, passim. 8. Voir l’historique que nous en avons fait en 2006 (passim). 9. Cf. Simoni-Aurembou 1989, passim. 10. « C’était au moyen de ces renseignemens recueillis avec soin et notés avec scrupule que l’on a marqué sur des cartes particulières des départemens, et par suite sur une carte générale de la France, les limites géographiques des différens idiomes, [notation en caractères gras : H. G.] et qu’on avait donné dans l’Annuaire des Longitudes le tableau qui y a figuré en 1809 et années suivantes, tableau qu’il ne sera pas inutile peut-être de reproduire ici. » (Coquebert de Montbret/ Labouderie 1831, 14-15). 11. Cf. Ozouf-Marignier 1989 et Roncayolo 1992. 12. Voir à ce sujet notre contribution de 2004 (passim) et Storost 2008 (124-152). 13. Cf. Ascoli 1874. 14. Pour une présentation critique de ces discussions cf. Goebl 2010, passim. 15. Cf. Pop/Pop 1959, 5. 16. L’impression de l’ALF a été réalisée sous la surveillance particulière de Georges Protat (1857-1923) et constitue, en tant que telle, un véritable chef d’œuvre de la typographie ; cf. Lequin 1924, 53 et Gilliéron 1902, 9-10. 17. Cf. Brun-Trigaud/Le Berre/Le Dû 2005, 21 où se trouvent les dates des huit missions exploratoires qu’Edmont avait accomplies entre le 1er août 1897 et le 10 août 1901. 18. Rappelons que le mot savant géodésie, d’origine grecque, signifie « subdivision du territoire » : < gr. gés « terre » et dáinymi « partager, diviser ». 19. La valeur heuristique des cartes muettes est inestimable. Ceci appert, entre autres, par un coup d’œil comparatif à d’autres philologies modernes qui, comme p. ex. les études germaniques et anglaises, ne connaissent pas cet instrument. Mais aussi au sein des études romanes les seules entreprises d’atlas à mettre à disposition des cartes muettes étaient l’ALF, l’AIS, l’ALR et – l’ALD (bien sûr). Pour toutes les autres, les utilisateurs devaient s’en procurer « avec les moyens du bord ». 20. Voir la liste y ayant trait dans Pop/Pop 1959, 53-63. 21. Ceci n’a nullement perturbé la bonne qualité de la coexistence du filon « néogrammairien » et de la géographie linguistique de J. Gilliéron dans la rédaction des articles du FEW. Une preuve tangible de ce fait est la double dédicace du premier volume du FEW à Wilhelm Meyer-Lübke (1861-1936) et à Jules Gilliéron par Walther von Wartburg (1888-1971), l’auteur du FEW. 22. Cf. l’excellente présentation de l’ALF rédigée par K. Jaberg dès 1908. 23. Voir à ce sujet aussi les ouvrages séminaux de Karl von Ettmayer (1924) et Karl Jaberg (1936). Pour un historique détaillé de cette évolution hétérogène cf. Goebl 2004, passim. 24. Cf. à cela Dauzat 1949, 5-30. 25. Sous les auspices du CNRS français, cette série fut rebaptisée, à partir de 1980, en « Atlas linguistiques de la France par régions ». 26. Cf. Billy 1993, passim. 27. Voir à ce sujet surtout mes travaux dialectométriques relatifs à l’ALF de 1984, 2002 et 2003. 28. J’évoque ce concept dans toutes mes publications dialectométriques depuis 2000 : cf. la liste bibliographique sous : https ://www.sbg.ac.at/rom/ people/prof/goebl/dm_publi.htm 29. Je renvoie, à ce sujet, à l’excellent volume introductif de l’AIS (Jaberg/Jud 1928). 30. Cf. Goebl 1984 et 2008. 31. Les deux articles séminaux de Séguy datent de 1971 et 1973. 32. Voir le site web de l’ALS : http://www.csfls.it/?id=34. 33. Voir le site web de l’ALCam : http://www.alcam.de/.

Corpus, 12 | 2013 46

34. Par naturaliste (et naturalisme) nous entendons « plus proche de la réalité directement observable ». 35. En italien il existe un certain nombre de dénominations usuelles (comme p. ex. tesoro, sportello, archivio, etc.), lesquelles, affublées du qualificatif diatopico, pourraient très bien être utilisées dans ce contexte. 36. C’est pourquoi je me trouve en complet désaccord avec la teneur louangeuse d’un article de deux anglicistes (Anderwald/Szmrecsanyi 2008) qui vantent la possibilité de réunir – sous le signe de la linguistique de corpus – un grand nombre d’ethnotextes (en l’occurrence : britanniques) d’origine géographique (et aussi textologique) diverse pour l’analyse « géolinguistique » à proprement parler, et même pour des analyses dialectométriques : cf. Szmrecsanyi 2013. 37. Je précise que parmi les facteurs « contraignants » il se trouve également le fameux « paradoxe de l’observateur ». 38. Lien : http://ald.sbg.ac.at/ald/ald-i/. 39. Les deux bases de données sonores (SDB < all. « Sound-Datenbank ») permettent l’accès acoustique direct aux interviews menées par l’insertion du numéro de la localité en question (entre 1 et 217) et de l’item respectif du questionnaire (entre 1 et 1063). 40. Les deux moteurs de recherche et de triage (IRS < angl. « Index Retrieval System ») permettent tant le triage alphabétique (A-Z et Z-A) traditionnel de toutes les formes dialectales figurant sur les planches d’atlas, que le repérage, dans toutes les transcriptions des deux volets de l’ALD, de nexus à librement définir, et ceci dans trois positions différentes à l’intérieur du mot : début, milieu, fin. A l’heure actuelle, les deux logiciels-IRS sont très efficaces et rapides. 41. Un tel travail a été réalisé par Roland Bauer dans le cadre de la dialectométrisation des données de l’ALD-I (Bauer 2009).

ABSTRACTS

The Adventures of linguistic Geography since Jules Gilliéron After the presentation of the intellectual and scientific underpinning of the French linguistic atlas ALF, published between 1902 and 1910 by Jules Gilliéron (1854-1926), the present article deals with the subsequent evolution of linguistic geography under Karl Jaberg (1877-1958), and Jakob Jud (1882-1952), the authors of the Italian linguistic atlas AIS, and the promoters of the new series of French regional linguistic atlases called « Nouveaux atlas linguistiques de la France » (NALFs), published after 1950. As a result one can see that the severe empirical principles of Jules Gilliéron have been replaced, over time, by an uncontrolled « empirical hunger » which represents a real threat for traditional linguistic geography and its corpus like orientation. Finally we did mention of the two parts of our linguistic atlas ALD (« Atlante linguistico del ladino dolomitico e dei dialetti limitrofi ») which have been elaborated under the strict observance of Gilliéronian principles and published in 1998 and 2012, each time in seven volumes.

Partant du substrat intellectuel et scientifique sur lequel repose, en dernière analyse, l’Atlas linguistique de la France (ALF : 1902-1910) de Jules Gilliéron (1854-1926), cet article envisage l’évolution ultérieure de la géographie linguistique « atlantiste », surtout sous l’égide de Karl Jaberg (1877-1958) et Jakob Jud (1882-1952), auteurs de l’atlas italo-suisse AIS, et des promoteurs des Nouveaux atlas linguistiques de la France (NALFs) à partir de 1950. Il en appert que l’orientation

Corpus, 12 | 2013 47

théorique de base et la recherche inconditionnée de l’intercomparabilité des données d’atlas collectées ont fini par céder devant une « faim empirique » générale qui risque de saper la raison d’être de la géographie linguistique à proprement parler. A la fin, il est fait mention des deux parties de l’atlas linguistique ladin ALD, publiées – chaque fois en 7 volumes – en 1998 et en 2012, qui ont été élaborées dans le plus strict respect des principes « atlantistes » de Jules Gilliéron.

INDEX

Keywords: ALF, ALD, linguistic atlas, intercomparison study of dialectal data, John Snow, Jules Gilliéron, Karl Jaberg, Jakob Jud, basic theory. Mots-clés: Atlas linguistique de la France, ALF, Atlante linguistico del ladino dolomitico e dei dialetti limitrofi, ALD, géographie linguistique, atlas linguistique, intercomparabilité des données dialectales, John Snow, Jules Gilliéron, Karl Jaberg, Jakob Jud, théorie de base

AUTHOR

HANS GOEBL Universität Salzburg

Corpus, 12 | 2013 48

Concordances géolinguistiques et anthroponymiques en Bretagne

Daniel Le Bris

1. Les sources

1 Cette étude1 est fondée sur la comparaison des données anthroponymiques et géolinguistiques de la Basse-Bretagne, la zone celtique de la péninsule armoricaine. Il ne s’agit pas ici de mettre au point une méthode pour déterminer le berceau d’une famille à partir d’un nom de famille (NF). Seule une recherche historique poussée et établie à partir d’informations généalogiques permettrait d’obtenir des résultats, sans garantie toutefois de pouvoir remonter à la source du NF.

2 Notre analyse essaie d’abord de montrer dans quelle mesure la représentation cartographique de la répartition des patronymes permet de compléter l’examen des variations morpho-lexicales et phonétiques d’une aire linguistique déterminée. Les cartes anthroponymiques sont constituées en utilisant les Fichiers des noms patronymiques de 1891 à 1990 – France entière de l’INSEE : Institut National de la Statistique et des Etudes Economiques (INSEE 1999). Ces fichiers contiennent pour chaque département de France métropolitaine les noms de famille de toutes les personnes nées de 1891 à 1990. Tout patronyme est donc répertorié par département en fonction de l’année de naissance et de la commune de naissance. Nos observations se limitent pour le moment aux cinq départements de la Bretagne historique à savoir : le Finistère, les Côtes-d’Armor, le Morbihan, l’Ille-et-Vilaine et la Loire-Atlantique.

3 Les fichiers patronymiques de l’INSEE regroupent les naissances selon quatre périodes de vingt-cinq ans chacune : 1891-1915, 1915-1940, 1941-1965 et 1965-1990. Seules les deux premières périodes s’échelonnant de 1891 à 1940 sont retenues. En effet, après la Seconde Guerre Mondiale, un nouveau système de protection sociale est mis en place en France : la Sécurité Sociale. Grâce à elle, les enfants vont progressivement tous naître dans les maternités au lieu d’être mis au monde au domicile de la mère ou des parents. Les naissances sont désormais répertoriées dans la commune de l’hôpital ou de la clinique la plus proche et ne sont plus comptabilisées dans la commune de la

Corpus, 12 | 2013 49

résidence parentale. C’est la raison pour laquelle nous avons seulement pris en compte les deux périodes antérieures à 1941 afin d’être quasi-certains que les naissances soient bien enregistrées dans la commune d’origine des parents.

4 Une telle base de données permet de cartographier tous les patronymes sur l’ensemble des cinq départements. Ce travail a été possible grâce à l’aide très précieuse de Michel Floch2, ingénieur informaticien, qui a développé un logiciel permettant de dresser des cartes à partir des fichiers patronymiques de l’INSEE. Le logiciel est toujours en cours d’élaboration puisque nous y intégrons de nouvelles données. Ainsi, dans le cadre de cet article nous utilisons également les naissances répertoriées par le Centre Généalogique du Finistère3. Cela permet de remonter dans certains cas jusqu’aux XVIe- XVIIe siècles et d’apporter davantage de densité historique aux visualisations cartographiques de ce département. Nous espérons pouvoir bientôt intégrer les fichiers patronymiques des autres départements bretons et intégrer ainsi l’enregistrement des naissances sur trois ou quatre siècles.

5 La cartographie des patronymes dessine des territoires parfois inattendus. Afin de tenter de les décrire et de les identifier nous les avons comparés aux cartes des atlas linguistiques suivants : l’Atlas Linguistique de Basse-Bretagne (ALBB) (Le Roux 1924-63), le Nouvel Atlas Linguistique de Basse-Bretagne (NALBB) (Le Dû 2001) et l’Atlas Linguistique de la Faune Marine de Bretagne (ALFMB) (Le Berre 2008).

2. La géographie linguistique de la Basse-Bretagne

6 Une première limite linguistique, marquée par une ligne de points noirs sur la carte 1, s’étire du nord au sud depuis l’ouest de Saint-Brieuc jusqu’à l’est de Vannes. Elle sépare à l’ouest l’aire celtique, la Basse-Bretagne, de l’aire gallo-romane, la Haute-Bretagne, située à l’est.

Carte 1. Dualité celtico-romane en Bretagne et zones dialectales de Basse-Bretagne

7 L’aire celtique ou zone bretonnante est caractérisée par une dualité dialectale entre les parlers du nord-ouest, qui correspondent aux territoires des anciens évêchés pré- révolutionnaires du Léon, Trégor et Cornouaille, et ceux du sud-est dont l’aire

Corpus, 12 | 2013 50

linguistique coïncide globalement avec l’ancien évêché de Vannes. Cette dualité s’établit selon une diagonale sud-ouest / nord-est qui s’étire depuis Quimper jusqu’à Paimpol. Plusieurs linguistes (Falc’hun 1981, Humphrey 1995, Plourin 1982), considèrent que cette transversale constitue elle-même une troisième zone de dialectes et évoquent une tri-partition de l’espace linguistique breton.

8 Falc’hun et Fleuriot, jusqu’à un certain point, voient dans la dualité dialectale nord- ouest / sud-est l’illustration de l’arrivée, durant la fin de l’Antiquité et le haut Moyen- Age, des immigrants bretons de Grande-Bretagne qui auraient débarqués par groupes successifs sur la côte ouest-septentrionale de la péninsule armoricaine.

9 Faisons également remarquer que la ligne de cette bi-partition dialectale (carte 2) concorde avec la limite qui séparait les territoires de deux tribus gauloises : les Ossismii au nord-ouest et les Veneti au sud-est (Merlat 1959, Fleuriot 1988, German 2007). Si cela était le cas, les variations dialectales s’inscriraient dans des schémas très anciens et les lisières lin guistiques mises en évidence remonteraient alors à l’Age des Métaux. La partie jaune sur la carte signale où se trouve la frontière ossismo-vénète selon Fleuriot (plus à l’ouest) ou selon Merlat (plus au sud-est).

Carte 2. Anciens territoires gaulois en Armorique

3. Dualité dialectale nord-ouest / sud-est

10 La carte 3 représente l’ensemble des naissances enregistrées de 1891 à 1940 sous les patronymes Riou et Rio. Tous les deux sont des formes hypocoristiques du vieux-breton ri « roi ». En rouge sur la carte, les naissances déclarées sous le NF Riou et en bleu, celles du NF Rio.

Corpus, 12 | 2013 51

Carte 3. Patronymes Riou / Rio

11 Manifestement, l’aire de Riou correspond au tracé des anciens évêchés de Léon, Trégor et Cornouaille. Elle cadre avec la zone dialectale du nord-ouest et vient épouser au nord la limite linguistique celtico-romane. Au sud-est sa démarcation est quasi contigüe avec celle de l’ancien évêché de Vannes. Le patronyme Rio, variante sud-est du NF Riou, est quant à lui circonscrit au territoire de l’ancien évêché vannetais.

12 Le débordement du NF Rio à l’est de la frontière linguistique rappelle la zone d’extension des noms de lieu en Ker-. La densité de ce NL en Haute-Bretagne correspondrait selon Tanguy à la limite orientale des parlers celtiques vers les XIIe-XIIIe siècles (Tanguy 1986).

13 Observons également que les deux NF sont en distribution complémentaire sur le territoire. Cette interdépendance de Riou et Rio est à rapprocher de la dualité dialectale de l’espace linguistique breton.

14 La carte 4 Jézéquel / Gicquel (en orange : Jézéquel, en bleu : Gicquel) visualise l’emplacement des variantes occidentale et orientale de l’anthroponyme vieux-breton Iudicael dont la plus ancienne attestation date du IXe-Xe siècle (Jackson 1967). Remarquons que la localisation de ces deux variantes concorde une nouvelle fois avec la dualité dialectale nord-ouest / sud-est de Basse-Bretagne. Selon Jackson (1953,1967), le « d » intervocalique reflétait un [ð]. La interdentale sonore évolue ensuite en fricative alvéolaire dans le NF Jézéquel du nord-ouest et elle devient muette dans le sud-est. Nous constatons une nouvelle fois que la répartition sur le territoire de ces deux variantes correspond à la dualité dialectale nord-ouest / sud-est.

Corpus, 12 | 2013 52

Carte 4. Patronymes Jézéquel / Gicquel

15 Le « d » intervocalique de IUDIC-HAEL reflétait peut-être déjà une fricative interdentale sonore qui évolue en fricative alvéolaire sonore dans la forme Jézéquel du nord-ouest et devient muette dans le sud-est.

16 La lisière est de la zone Gicquel nous rappelle à nouveau la limite orientale aux XIIe-XIIIe siècles des parlers celtiques.

4. Evolution de la spirante dentale [Ɵ] du vieux-breton

17 L’évolution de la spirante dentale [Ɵ] du vieux-breton est l’un des critères qui illustre le mieux la bipartition dialectale nord-ouest / sud-est en Basse-Bretagne. La fricative interdentale sourde devient [z] dans les parlers du nord-ouest et [h] dans le sud-est.

18 La carte 5 Mazé / Mahé met en lumière cette bipartition. En jaune, le NF Mazé est la variante nord-ouest du nom de l’apôtre Mattheus. Dans le sud-est, l’intervocalique de Mahé, en bleu, équivaut à une fricative glottale. L’existence de ces deux variations suppose une intervocalique ayant valeur de fricative interdentale au moment où Mattheus fut emprunté. La limite de bipartition dialectale est toujours évidente. Mais on la retrouve cette fois plus à l’ouest de la diagonale Quimper-Paimpol.

Corpus, 12 | 2013 53

Carte 5. Patronymes Mazé / Mahé de 1891 à 1940

19 Les informations fournies par la carte 6 permettent de reconsidérer la représentation cartographique des NF Mazé / Mahé sur la période 1701-1793. Il est frappant de constater que cette répartition est sensiblement la même à environ deux siècles d’intervalle.

Corpus, 12 | 2013 54

Carte 6. NF Mazé / Mahé 1701-1793

20 Sur la carte 7, nous avons reporté les données des NF continuateurs du nom vieux- breton Guethenoc.

Carte 7. NF apparentés à Guethenoc

21 Apparenté au vieux-gallois gueithenauc, il est composé à partir du radical vieux-breton uuethen, guethen « combat, bataille » (Jackson 1967, 518-520). Les patronymes issus de Guethenoc produisent un nouvel exemple de l’évolution de la fricative [Ɵ] du vieux- breton.

22 Au nord-ouest, le patronyme Guézenoc est localisé dans une seule commune du Finistère septentrional. Nous reviendrons plus loin sur ce suffixe –oc. Le NF Guézen(n)ec révèle lui aussi cette évolution du [Ɵ] en [z]. Lorsque nous basculons dans le sud-est, nous constatons à nouveau une prédominance très nette de formes où la fricative interdentale évolue en fricative glottale. Guézen(n)ec devient ainsi (Le) Guéhen(n)ec. Plus à l’est, on relève les NF Guéhenneuc et Guéhenneux dont le suffixe concorde avec les données toponymiques de la partie orientale de la Bretagne (Le Moing 1988).

23 Une nouvelle fois nous constatons que la répartition des patronymes souligne la bipartition dialectale de l’espace linguistique breton et l’ancienne limite orientale des parlers celtiques aux XIIe-XIIIe siècles. Les celtisants présentent habituellement les noms propres et les noms de lieux en –euc comme l’attestation d’un état de langue ancien remontant au vieux-breton. Ne faudrait-il pas considérer ses formes relevées en Haute- Bretagne comme les survivances de certains traits phonétiques des parlers celtiques continentaux d’Armorique orientale au haut Moyen-Age ?

Corpus, 12 | 2013 55

5. Patronymes en –oc et aire dialectale des suffixes en –og

24 L’observation de la variation phonique dans le suffixe de certains patronymes permet de révéler de nouvelles concordances géolinguistiques et anthroponymiques. Prenons le cas du suffixe –eg. En général, un syntagme doté de cette terminaison acquiert une valeur d’adjectif. Par exemple, au mot breton beg « pointe » correspond l’adjectif begeg « pointu, avancé ».

25 Le syntagme peut aussi prendre une valeur de substantif. Il désigne alors le terrain où prolifère le végétal nommé par ce syntagme. On peut citer le terme balan « genêt » et son dérivé balaneg « lieu où pousse du genêt », mesper « nèfles » et mespereg « endroit à nèfles », irin « prunelles » et irineg « terrain à prunelles », tali « laminaires (longues algues brunes) » et talieg « lieu où poussent ces laminaires ».

26 Dans le nord-ouest de l’espace linguistique breton, l’initiale [ɛ] du suffixe -eg s’arrondit et se prononce [ɔ] ou [o]. Ainsi, nous relevons beg-OG au lieu de begeg, balan-OG / balaneg, mesper-OG / mespereg, irin-OG / irineg, tali-OG / talieg, arne-OG / arneeg et arnew- OG / arneweg « orageux ».

27 Relevons également tousOG / touseg « crapaud » et amezOG / amezeg « voisin », tiOG / tieg « paysan, fermier », boutOG / bouteg « panier ». Ces appellations n’appartiennent pas aux catégories précédemment énoncées, mais elles attestent de la même variation vocalique. D’après Ernault et Jackson (Ernault 1905 : 116-118 et Jackson 1967 : 138), tousog s’explique à partir d’un ancien touseg qui aurait lui-même adopté par analogie le modèle du suffixe –oc propre au Léon. Touseg serait lui-même un emprunt au roman « tossec » dérivé du latin toxicum.

28 Passons à présent à l’examen des patronymes. Le logiciel des patronymes nous a permis de dresser la liste des NF dotés du suffice -oc. Il s’agit à l’origine de sobriquets réalisés à partir de substantifs auxquels on a ajouté le suffixe -og orthographié -oc 4. Nous avons ensuite retenus les 15 NF en -oc les plus portés dans l’ensemble des cinq départements afin de les cartographier : Bégoc, Bouzeloc, Bozoc, Croguennoc, Férelloc, Guennoc, Guélennoc, Guézenoc, Louédoc, Perchoc, Quioc, Taloc, Godoc, Lanvoc, Géleoc. Le résultat figure sur la carte 8.

29 Concernant la période 1891-1940, les NF en –oc sont concentrés pour l’essentiel et de manière assez compacte dans les deux tiers ouest de l’ancien évêché du Léon et de manière apparemment plus importante sur la bande littorale de ce territoire.

30 Comparons ce résultat à la carte 9 où figurent les naissances de ces mêmes quinze patronymes enregistrées entre 1701 et 1793. Des migrations de commune à commune peuvent manifestement s’être produites sur une distance qui demeure somme toute très réduite.

Corpus, 12 | 2013 56

Cartes 8 et 9

31 Mais, statistiquement la représentation cartographique nous informe surtout que l’ensemble des porteurs de NF en –oc se maintiennent dans la même zone géographique à plus de deux siècles d’intervalle. L’inertie des porteurs des patronymes en –oc est donc frappante à la lumière des cartes.

32 A titre de comparaison, consultons à présent les cartes du NALBB et de l’ALFMB où il est possible de relever cette variante phonique. Etudions tout d’abord la carte 10 « crapaud » (NALBB 229).

Corpus, 12 | 2013 57

Carte 10. Aire dialectale de tousog « crapaud »

33 Sur ce document, on constate que l’aire dialectale de tousog s’étend sur les 3/4 ouest du Nord-Finistère ; elle inclut aussi l’extrémité de la presqu’île de Crozon et englobe les îles de Molène et de Sein.

Carte 11. Aire dialectale d’arneog

Corpus, 12 | 2013 58

Carte 12. Aire dialectale de tousog-mor « chabot »

34 Sur la carte 11 (NALBB 148), l’aire Arneog « orageux » occupe globalement le même territoire que l’aire tousog et s’étend davantage au sud-est vers la zone centrale de Basse-Bretagne. La presqu’île de Crozon et l’île de Sein sont exclues de cet espace.

35 La carte 12 (ALFMB R373) représente l’étendue de l’aire correspondant à l’usage de tousog-mor « chabot », lat. cottus gobio. La zone s’étend de manière presque continue depuis l’ouest de l’Île de Batz jusqu’à la Pointe Saint-Mathieu en incluant à nouveau l’Île de Sein.

36 Le document 13 présente une synthèse des quatre cartes précédemment commentées. Elle permet de préciser la localisation des patronymes en –oc en fonction de la variante phonique [ɛ] / [ɔ] ou [o]. La distribution des NF en –oc concorde de manière évidente avec l’aire linguistique où ce suffixe est toujours en usage parmi les parlers bretons actuels.

Document 13.

6. Patronymes en –eur et aire dialectale des suffixes en –eur, -eureuz

37 En breton, le suffixe -er permet de constituer un nom d’agent masculin à partir d’un radical verbal. Dans le cas du verbe mag-añ [ˈma:ga] « nourrir », l’adjonction de –er à l’élément de base mag- permet de former mag-er [ma:gɛr] « (père) nourricier » masc. et mag-erez [maˈgɛ:rəz / s] « nourrice » fém. Le suffixe féminin –erez est aussi utilisé pour nommer certaines machines, ainsi : dorn-añ « battre (des céréales) », dorn-erez « batteuse ».

Corpus, 12 | 2013 59

38 Dans le nord-ouest du Finistère, l’initiale vocalique du suffixe est plus généralement prononcée [ø] au lieu de [ɛ] ; la seconde voyelle devient également [ø] par assimilation. Les formes mager et magerez sont ainsi remplacées par les variantes mag-eur et mag- eureuz.

39 Grâce au logiciel cartographique des patronymes, nous avons considéré les quinze NF les plus fréquents de la période 1891-1940 correspondant à cette variation phonique : Broudeur « personne conduisant le bétail avec un aiguillon », Charreteur « charretier », Corolleur « danseur », Guiadeur « tisserand », Joncqueur « grand-oncle », Lansonneur « le musicien », Larçonneur « le musicien »5, Larreur « le laboureur », Larsonneur « le musicien », Magueur « père nourricier », Meneur « carrier », Pastezeur « fabricant de pâté », Podeur « potier », Quemeneur « tailleur », Quidelleur « fabricant ou vendeur de filets de pêcherie ». Ils figurent sur la carte 14.

Carte 14 et 15

40 La carte 14 parle d’elle-même. Semblablement aux NF en –oc, les patronymes en –eur se trouvent à nouveau concentrés dans le Léon et de manière très compacte à l’extrême ouest de l’ancien évêché. Sur la carte 15, à trois ou quatre siècles d’intervalles, les noms en –eur semblaient déjà être localisés dans le nord-ouest de la Basse-Bretagne. Cela confirmerait à nouveau un certain immobilisme de la population.

41 Etudions à présent la prononciation de ce suffixe à partir des cartes de l’ALBB et du NALBB. Sur la carte 16 « batteuse » (NALBB 304), la variante dialectale [durˈnø:røs] est indéniablement attestée dans la moitié ouest du Léon.

Corpus, 12 | 2013 60

Carte 16. Aire dialectale de dourneureuz « batteuse »

42 On peut aussi relever ce trait phonétique spécifique du nord-ouest de la Basse-Bretagne sur les cartes NALBB 302 « faucheuse » [fal'hø:røs], NALBB 521 « pêcheur » [pøs'køtør], ALBB 372 « tailleur » [ke'me:nør], ALBB 387 « boucher » ['ki:gør]. Comme le montre la carte 16, les noms d’agent dotés d’un suffixe contenant une voyelle arrondie sont localisés dans l’aire où la grande majorité des patronymes en -eur a été enregistrée. Une nouvelle fois, on constate une concordance entre les données anthroponymiques et géolinguistiques.

Conclusion

43 Cette étude a permis de mettre l’accent sur les concordances entre aires linguistiques et aires culturelles dans la péninsule Armoricaine. Les coïncidences sont parfois frappantes entre la répartition des variantes patronymiques et celle des variantes dialectales encore en usage dans l’espace linguistique breton.

44 Les fichiers INSEE utilisés pour cette étude concernent l’intervalle historique 1891-1940. Il s’agit donc d’une période relativement récente. Cet intervalle correspond à la période où les enquêtes des atlas linguistiques de Gilliéron et Edmont pour l’Atlas Linguistique de France (Gilliéron & Edmont 1902-1012) et de Le Roux pour l’ALBB ont été réalisées. Il correspond donc à une France encore très majoritairement rurale et les éléments linguistiques recueillis sont souvent la photographie d’un territoire où les changements et les évolutions se sont produites très lentement, au fil du temps.

45 Les mouvements de population concernent le plus souvent les classes sociales dirigeantes ou favorisées et semblent toucher assez peu les habitants des zones rurales où se trouvent en majeure partie les locuteurs dialectophones. En utilisant les données

Corpus, 12 | 2013 61

du Finistère remontant au XVIe siècle, on s’aperçoit que la répartition des patronymes sur le territoire est sensiblement identique à celle constatée au début du XXe siècle. Nous ne disposons pas encore de données plus anciennes pour les autres départements bretons, mais si nous parvenions aux mêmes constatations, cela révélerait une relative inertie de la population bretonne sur plusieurs siècles.

46 Une autre source de documents aurait également pu être examinée : les montres générales et les réformations des fouages de Bretagne dont les plus anciens textes remontent à 1426. Ces recensements servaient à connaître le nombre d’habitants imposables par évêché afin d’estimer les capacités du duché à supporter un éventuel effort de guerre.

47 Ces témoignages historiques sont exceptionnels et remarquables. Ils contiennent de nombreuses informations anthroponymiques et toponymiques. Ils peuvent permettre d’étudier assez justement l’origine et la filiation des ancêtres d’une famille précise. Cependant, dans le cadre de cette recherche, leurs données sont difficilement exploitables d’un point de vue statistique. En effet, bien souvent elles ne donnent qu’un simple fragment de la population. Pour certaines paroisses de l’Ancien Régime, on inscrit ainsi les noms des nobles sans relever ceux des personnes de condition sociale plus modeste. Ces documents sont malheureusement trop incomplets pour établir une cartographie des patronymes qui cherche à prendre en compte l’ensemble des individus de la société.

48 Au travers des exemples que nous avons exposés dans cet article, nous avons vu que la répartition des patronymes peut coïncider de manière assez frappante avec certaines aires linguistiques. Ces correspondances rappellent les structures de base de l’espace linguistique breton telles que Falc’hun les avait déjà énoncées :

49 - dualité nord-ouest / sud-est des parlers vannetais avec ceux du KLT (KLT : Kerne- Leon-Treger désigne en breton les territoires correspondant aux anciens évêchés de Cornouaille-Léon-Trégor) ;

50 - dualité entre la zone des parlers celtiques et celle des parlers gallo-romans

51 Elles mettent aussi en évidence des structures de base plus secondaires comme nous avons pu l’observer dans la zone périphérique du nord-ouest.

52 Jusqu’à quelle époque pouvons-nous faire remonter la structuration du territoire et sa relative immobilité associée à des groupes humains identifiés ? Il est difficile de le savoir avec certitude. Nous avons pu observer que la bipartition dialectale nord- ouest / sud-est coïncide avec l’ancienne limite de séparation des territoires gaulois ossisme et vénète. Celle-ci nous ramène à l’Age du Fer, voire du Bronze. Ainsi la structure révélée par la concordance de ces aires culturelles et linguistiques pourrait s’inscrire dans le paysage depuis l’Age des Métaux dans la façon dont les groupes se partagent les territoires.

53 Que matérialisent les patronymes en soulignant la valeur plus ou moins marquée de certaines limites ? Pour y répondre, il serait par exemple intéressant de connaître la manière et la période à laquelle ces structures se sont inscrites dans le territoire. Il serait par ailleurs éclairant d’interpréter le rattachement de certains patronymes à ces territoires.

Corpus, 12 | 2013 62

BIBLIOGRAPHY

Brun-Trigaud G., Le Berre Y. & Le Dû J. (2005). Lectures de l’Atlas linguistique de la France de Gilliéron et Edmont. Paris : CTHS.

Berr A.-G., Le Berre I. & Le Dû J. (2008). Ichthyonymie bretonne. Atlas Linguistique de la Faune Marine de Bretagne. Brest : Ichthyo.

Darlu P., Degioanni A. & Ruffié J. (1997). « Quelques statistiques sur la distribution des patronymes en France », Population 3 : 607-634.

Darlu P., Degioanni A., Foulon M. & Poulain M. (2000). « La distribution des patronymes par rapport à la frontière franco-belge ». Régimes démographiques et territoires : les frontières en question, AIDELF. Paris : PUF, 139-153.

Dauzat A. (1977). Les noms de famille : traité d’anthroponymie française. Paris : Librairie Guénégaud.

Ernault E. (1905). « Notes d’étymologie bretonne », Annales de Bretagne 21 : 111-123.

Falc’hun F. & Tanguy B. (1966-1970-1979). Les noms de lieux celtiques, 3 vol. Rennes, Bourg- Blanc : Editions Armoricaines.

Falc’hun F. (1981). Perspectives nouvelles sur l’histoire de la langue bretonne. Paris : UGC.

Fleuriot L. (1988). Les origines de la Bretagne. Paris : Payot.

German G. (2007). « Language Shift, Diglossia and Dialectal Variation in Western Brittany : the Case of Southern Cornouaille », in H. L. C Tristram (éd.) The Celtic languages in contact : Papers from the workshop within the framework of the XIII International Congress of Celtic Studies. Heidelberg : Universitätsverlag C. Winter, 146-192.

Gilliéron J. & Edmont E. (1902-12) : Atlas Linguistique de France. Paris : Champion.

Gourvil F. (1970). Noms de famille bretons d’origine toponymique. Quimper : Société Archéologique du Finistère.

Humphreys H. L. (1995). Phonologie et morphosyntaxe du parler breton de Bothoa. Brest : Emgleo Breiz.

INSEE (Institut National de la Statistique et des Etudes Economiques) (1999). Fichiers des noms patronymiques de 1891 à 1990 – France entière. Paris : Centre Quetelet-CNRS.

Jackson K. (1953). Language and History in Early Britain. Dublin : DIAS.

Jackson K. (1967). A Historical Phonology of Breton. Dublin : DIAS.

Le Berre A. (2008). Atlas linguistique de la faune marine de Bretagne (ALFMB). Brest : CRBC.

Le Bris D. (2012). « Surnames and geolinguistics in Brittany : a study of concordances », STUF Language Typology and Universals 65(1) : 95-109.

Le Dû J. (1987). « Un nouveau regard sur l’anthroponymie bretonne », Etudes sur la Bretagne et les pays celtiques, Mélanges offerts à Yves Le Gallo. Brest : CRBC-Institut Culturel de Bretagne, 271-287.

Le Dû J. (1988). « Les appellatifs ethniques dans l’anthroponymie de la Basse-Bretagne », Campagnes et Littoraux d’Europe, Mélanges offerts à Pierre Flatrès, Hommes et Terres du Nord, N° hors série. Lille : Société de géographie de Lille, 67-76.

Corpus, 12 | 2013 63

Le Dû J. (1989). « Anthroponymie et dialectologie : répartition géographique des noms du tisserand d’après les données de l’ALBB, de l’ALF et du fichier INSEE des noms de personnes », Espaces Romans, Etudes de dialectologie et de géolinguistique offertes à Gaston Tuaillon, vol. II. Grenoble : Ellug, Université Stendhal, 545-559.

Le Dû J. & Le Berre Y. (1997). « Ce que nomme “breton” », in A. Tabouret-Keller (éd.), Le nom des langues I. Les enjeux de la nomination des langues. Louvain-La-Neuve : Peeters (BCILL), 99-116.

Le Dû J. (2001). Nouvel Atlas Linguistique de Basse-Bretagne (NALBB). Brest : CRBC-UBO.

Le Moing J.-Y. (1988). Toponymie bretonne de Haute-Bretagne : analyse informatique des formes anciennes et modernes. Thèse de 3e cycle. Rennes : Université Rennes 2.

Le Roux P. (1924-63). Atlas Linguistique de Basse-Bretagne (ALBB). Rennes : Plihon et Hommay, Paris : Champion et Droz.

Merlat P. (1959). « Les Vénètes d’Armorique : problèmes d’histoire et d’administration », Mémoires de la Société d’Histoire et d’Archéologie de Bretagne 59 : 5-40.

Mulon M. (2002). Origine et histoire des noms de famille en France. Paris : Errance.

Pitz M. (éd.). Nouvelle Revue d’Onomastique. Paris : Société Française d’Onomastique.

Plonéis J.-M. (1996). L’identité bretonne, l’origine des noms de personnes. Paris : éditions du Félin.

Plourin J.-Y. (1982). Description phonologique et morphologique comparée des parlers bretons de Langonnet et Saint-Servais. Thèse de doctorat d’Etat. Rennes : Université Rennes 2.

Plourin J.-Y. (2010). Les noms de famille et leur histoire. De Quimperlé au port de Pont-Aven. Brest : Emgleo Breiz.

Tanguy B. (1973). Recherches autour de la limite des noms gallo-romains en -ac en Haute- Bretagne. Thèse de 3e cycle. Brest : Université de Bretagne Occidentale.

Tanguy B. (1994). « De l’origine des évêchés bretons », Britannia Monastica 3 : 5-33.

NOTES

1. Je tiens à remercier chaleureusement Jean Le Dû pour ses encouragements et ses observations à mener cette recherche en partie inspirée par ses études sur les anthroponymes de Bretagne (Le Dû 1987, 1988 & 1989). 2. Ma plus vive reconnaissance et mes plus sincères félicitations à Michel Floch dont le talent et les très nombreuses heures de travail et de patience ont permis de mettre au point ce formidable logiciel cartographique sans lequel cette recherche demeurait impossible. 3. Mes plus prompts remerciements à Jean-François Pellan, Président du Centre Généalogique du Finistère et à Robert Marhic, informaticien de cette association, pour leur adhésion à notre projet et leur soutien sans faille. 4. En breton, les consonnes sonores deviennent sourdes en finale absolue ou devant une consonne sourde. Le [g] en finale sera donc prononcé [k]. La consonne sourde a traditionnellement été retenue pour noter la finale de ces patronymes. Cela explique par exemple pourquoi nous avons aujourd’hui un écart orthographique en consonne finale entre l’adjectif breton begog « pointu » et le patronyme Bégoc. 5. Deux articles définis se trouvent agglutinés dans ces deux patronymes : l’article français « l’ » et l’article breton an dans le cas de Lan-sonneur ; « l’ » et ar dans Lar-çonneur.

Corpus, 12 | 2013 64

ABSTRACTS

Geolinguistic and anthroponymic Concordances in Brittaby The development of a new software allows to map all the surnames files preserved by the INSEE. At first, we take into account the surnames of people born between 1891 and 1990 in the five départements of historical Brittany. Concerning the Finistère, we can sometimes go back to the sixteenth century thanks to digitized sources of the Genealogical Center of this département. This allows to assess to what extent there is a movement or an inertia of the population over a period of several centuries. This analysis is invaluable and useful to understand better the evolution or the conservatism of the Celtic dialects in this part of France.

La mise au point d’un nouveau logiciel permet de cartographier l’ensemble des fichiers patronymiques conservés par l’INSEE en France. Dans un premier temps, nous prenons en compte les patronymes des personnes nées entre 1891 et 1990 dans les cinq départements de la Bretagne historique. Concernant le Finistère, nous pouvons parfois remonter jusqu’au XVIe siècle grâce aux sources numérisées du Centre Généalogique de ce département. Cela permet d’évaluer dans quelle mesure, on constate un déplacement ou une inertie de la population sur une période de plusieurs siècles. Cette analyse est précieuse et utile pour mieux comprendre l’évolution ou le conservatisme des parlers celtiques dans cette partie de la France.

INDEX

Mots-clés: Breton, patronymes, géolinguistique Keywords: Breton, surnames, geolinguistics

AUTHOR

DANIEL LE BRIS CRBC Brest, UBO-UEB

Corpus, 12 | 2013 65

Le Thesaurus Occitan : entre atlas et dictionnaires

Patrick Sauzet and Guylaine Brun-Trigaud

Introduction

1 On ne peut en faisant de la linguistique ou de la dialectologie occitane échapper à la situation sociolinguistique de cette langue. Le rappel de cette évidence ne manquera pas de recueillir l’assentiment teinté d’ironie. Il recèle pourtant une ambiguïté qu’il est utile d’expliciter.

2 On peut l’entendre comme un constat. La façon dont on fait de la linguistique ou de la dialectologie est nécessairement marquée par la situation sociolinguistique de la langue étudiée. Le linguiste est, qu’il le veuille ou non, un acteur du jeu de dominance et de concurrence où sont impliquées les langues en domaine occitan. On peut l’entendre aussi comme une injonction. On ne saurait se pencher sur l’occitan sans tenir compte activement de la situation de cette langue, sans reconnaître l’occitan comme langue dominée.

3 A chaque interprétation s’attache potentiellement un type de démarche biaisée. L’effet non corrigé de la situation sociolinguistique sur l’observateur conduit à pratiquer sans distance une linguistique diglossique. Le linguiste inscrit son discours dans la langue dominante, le français, qui est notamment sa langue de travail, depuis laquelle il observe l’occitan, qu’il appellera éventuellement « patois ». Produit dans ces conditions le discours scientifique sur l’occitan légitime la relégation sociale et culturelle de la langue, quels que puissent être par ailleurs les protestations, démonstrations ou sentiments réels d’attachement pour la langue étudiée. Quelles que soient aussi les qualités du travail descriptif et analytique produit. Une linguistique qui utilise par réalisme le terme de « patois », comme les locuteurs eux-mêmes, n’adopte pas une attitude neutre et ne se situe pas dans quelque degré zéro de la glossonymie. En la reprenant à son compte, il valide la désignation courante de son autorité de spécialiste du langage. De plus, en reprenant comme telle la désignation ordinaire des témoins, le linguiste leur attribue exclusivement cette langue dont ils garantissent la nomination1 :

Corpus, 12 | 2013 66

cette langue est la leur, pas la sienne, même s’il la parle aussi. Nommée « patois », la langue décrite ne saurait être celle du linguiste.

4 Dans la logique de la situation diglossique, le linguiste est universitaire et francophone2. Il peut aussi être étranger, mais il a alors acquis le français comme langue d’enquête. Le linguiste peut bien sûr être en outre locuteur d’occitan. Eventuellement il peut biographiquement avoir été d’abord occitanophone. Il reste que la métalangue de son activité n’est pas l’occitan mais en général le français. La Revue des langues romanes en ses débuts accueillait l’écriture littéraire en langue d’oc à côté des travaux de romanistique, mais ces derniers étaient exclusivement en français. Même Mistral en rédigeant le Tresor dóu Felibrige (d’une grande modernité lexicographique, qui, combinée avec les carences de l’université occitane, le rend pertinent et indispensable encore aujourd’hui) utilise le français comme métalangue. La Gramatica occitana d’Alibert de 1935 (Alibert 1976) est bien en occitan, mais son dictionnaire (Alibert 1966) est un dictionnaire occitan-français. On peut opposer cette pratique occitane à la pratique catalane dont la renaissance linguistique a comporté d’emblée un usage métalinguistique du catalan (cf. Schlieben-Lange 1971 : 41-42).

5 Ne rien faire, laisser agir les forces en présence, c’est conforter la domination. Le constat explicité du poids de la diglossie sur le linguiste conduit à la deuxième lecture évoquée plus haut, la lecture injonctive. Puisqu’on ne saurait être neutre, choisissons notre camp ! Choisissons éventuellement de pratiquer une linguistique de contestation de la diglossie. Cela pourra se marquer d’abord par la revendication d’un champ sociolinguistique spécifique, par une manipulation volontariste des dénominations linguistiques (« patois » étant repéré comme désignation diglossique de l’occitan), éventuellement aussi par un recours d’ampleur variable à l’occitan comme métalangue. Si la première démarche peut être entachée de complicité avec la diglossie, la dernière démarche peut mener à un aveuglement volontariste qui, soit n’aborde l’occitan que du point de vue sociolinguistique, comme théâtre de ce qu’on décrira volontiers comme un conflit linguistique (au détriment de la linguistique interne), soit s’épuise dans des constructions normatives, dont la normalité conquise se relie difficilement aux faits obstinément diglossiques.

6 Ce qui vient d’être décrit, ce sont les idéalisations de tendances auxquelles les œuvres des linguistes réels cèdent plus ou moins volontiers, ou résistent avec plus ou moins de succès. Elles aideront ici à comprendre comment se pose la question de la lemmatisation dans le domaine occitan. La lemmatisation est en effet une pratique métalinguistique interne : son absence prolonge l’absence d’usage métalinguistique de l’occitan, et sa mise en place conduit à s’interroger en général sur les formes de l’usage métalinguistique en domaine occitan, donc sur des formes linguistiques qui relèvent de la norme, du standard, de la codification.

7 Typiquement, l’Atlas Linguistique de la France (ALF, Gilliéron & Edmont 1902-10) dans ses cartes comme dans son index, ne connaît à peu près (nous reviendrons plus loin sur l’approximation) que les termes français dans lesquels sont posées les questions et les formes phonétiques des réponses. A l’opposé, l’Atlas linguistique de Catalogne donne dans les intitulés des cartes la ou les formes orthographiques catalanes (en plus des équivalents castillans, italiens et français). Les atlas régionaux, réalisés dans le cadre du Nouvel Atlas Linguistique de la France (NALF), présentent, malgré quelques hésitations, quelques pas dans le sens d’un usage d’une lemmatisation interne de l’occitan. Elle peut prendre la forme de la notation phonétique d’une forme moyenne. Ainsi, dans les

Corpus, 12 | 2013 67

carnets d’enquête de l’Atlas Linguistique du Languedoc Occidental (ALLOc, Ravier 1978-93), il arrive que la forme typique attendue soit ainsi écrite, en notation phonétique dite ‘Rousselot’ : ex. [kalim'as], qui glose « chaleur étouffante » et indique le type de réponse attendu. Les lemmes sont indispensables, et des formes graphiques bien commodes pour noter les données négatives qu’introduit l’Atlas Linguistique de la Gascogne (ALG, Séguy 1954-73) : il est difficile de citer autrement que dans une notation conventionnelle une forme absente. Or l’orthographe est précisément une convention reçue. L’ALG utilise quelquefois des formes orthographiques dans cet usage (quelquefois aussi la base latine de la forme rejetée), l’ALLOc et l’ALLOr (Atlas Linguistique du Languedoc Oriental, Boisgontier 1981-86) le font assez systématiquement.

8 La diglossie, spécifiquement le bilinguisme diglossique, est au cœur des atlas linguistiques, de l’ALF comme des atlas régionaux, dans la mesure où le français est la langue d’enquête. En domaine d’oc, la traduction est parfois revendiquée non comme une contrainte mais comme un avantage méthodologique, puisqu’elle est censée éviter la contamination des formes locales par un modèle que l’enquêteur ne manquerait pas de suggérer. L’inconvénient inverse, du poids du modèle français sur les formes locales, outre qu’il est réputé plus facilement repérable, a été corrigé dans les nouveaux atlas qui d’une part, dans l’enquête, tendent à pratiquer plus la définition que la nomination directe, et d’autre part ont renoncé à la doctrine de la première réponse de règle dans l’ALF. Les enquêteurs de la seconde vague d’atlas vont jusqu’à pratiquer, en désespoir de spontanéité et en le mentionnant, la suggestion de formes occitanes.

9 Il y a donc toujours une forme française à laquelle rattacher une carte d’atlas linguistique. En face, une multiplicité de formes occitanes. Dans l’ALF, c’est toujours (dans l’atlas lui-même, pas dans les travaux qui en sont issus) une multiplicité brute, autant de formes que de points d’enquête3. Certains atlas régionaux font le choix de présentations par aires dégagées qui construisent quelque fois une quasi lemmatisation (ALG, ALLOc, ALLOr, etc.).

10 Ce n’est pas ici le lieu de discuter si une autre méthodologie, qui installe l’occitan comme métalangue au départ d’une entreprise d’atlas linguistique, aurait été possible. En revanche, la prise en compte réaliste de la façon dont les atlas ont été construits et du poids que la situation sociolinguistique a pesé sur leur construction, n’interdit pas de recourir à des outils dont la logique est celle de la contestation de la diglossie pour mener à bien leur exploitation. Toute orthographe, toute graphie conçue pour un usage social est, à quelque degré, inscrit dans une telle contestation de la diglossie4.

11 Il importe toutefois de relever que, de même que des travaux inscrits dans le consentement à la diglossie (voire à la disparition de la langue étudiée) peuvent néanmoins constituer un apport scientifique irrécusable (et sur certains point tirer des bénéfices de la forme de démarche induite par l’acceptation de la situation sociolinguistique, comme le recours à la traduction), de même le recours à des formes orthographiques est aussi un outil scientifique utile, indépendamment de son usage social possible.

12 Considérons l’exemple classique des formes du nom du « chien » en domaine occitan (cf. Dauzat 1929). En recourant à des formes orthographiques occitanes, on énonce d’emblée qu’il y a quatre aires principales, celles de can, de chin, de chen, de gos. Ces désignations sont disponibles de manière à peu près évidente et consensuelle pour toute personne qui sait manier la graphie classique de l’occitan. Un résultat approchant serait obtenu avec la graphie mistralienne (on noterait seulement gous la dernière

Corpus, 12 | 2013 68

forme et il faudrait substituer plusieurs notations à can). Sans recours aux formes orthographiques, une solution classique consiste à remonter aux types latins. Dans ce cas spécifique (en s’en tenant aux hypothèses couramment admises) il faudrait poser trois fois CĂNEM à la source des formes concernées et une forme ?°(SE)GUSIU(M) ou autre pour gos. Il faudrait en fait trancher et poser que, si can remonte bien à CANEM, chin et chen remontent à des prototypes français et francoprovençaux dont on voit mal comment les noter à leur tour autrement qu’orthographiquement. Sans compter qu’il est gênant de trancher (même en faisant la part de la dimension méthodologique de la décision) sur les formes sources de chin et de chen pour construire la discussion de cette forme source. Sans compter non plus que ces formes sources devront aussi être notées orthographiquement.

13 Les lemmes sont utiles pour manipuler la langue quand il s’agit, comme on vient de le voir, de discuter de la variation et de l’histoire des mots. Dans l’article évoqué comme ailleurs dans son œuvre, Dauzat, par ailleurs archétype du linguiste usant du terme « patois » et grand pourfendeur de l’enseignement de l’occitan, utilise volontiers les formes médiévales en guise de lemme : l’article cité s’ouvre par la phrase « Voilà longtemps que l’équation AQUA > prov. aiga a donné de la tablature aux romanistes. » L’abréviation prov. « provençal » renvoie à l’occitan et spécifiquement à l’occitan médiéval. La forme de l’ancien occitan sert à discuter du destin de ce mot à travers l’histoire et l’espace de la langue.

14 Les lemmes sont aussi et d’abord indispensables à toute entreprise lexicographique : tout dictionnaire occitan dont l’ambition dépasse une microrégion se pose la question de sa lemmatisation. C’est vrai du Tresor dóu Felibrige, du dictionnaire d’Alibert, de celui de Palay (Palay 1932-33) même si les réponses divergent. C’est vrai aussi de l’entreprise du THESOC qui a intégré dès le début la lemmatisation dans son système de saisie. Les lemmes et, de manière à la fois plus générale (parce qu’il ne s’agit pas de formes isolées) et plus spécifique (parce qu’il s’agit d’un type de lemme particulier), la notation orthographique sont des outils indispensables pour transcrire de manière large des textes oraux et entreprendre des travaux de syntaxe.

1. Propriétés des graphies classique et mistralienne

15 Etant admis le besoin de lemmes et de lemmes orthographiques, quel choix faire parmi les normes graphiques possibles de l’occitan (ou de la langue d’oc).

16 Il faut tout d’abord fixer les désignations. D’un côté, on parle ou l’on entend parler de graphie mistralienne, roumanillienne, félibréenne, provençale… De l’autre, de graphie classique, occitane, normalisée, alibertine… Nous retenons « mistralienne », malgré les hésitations initiales de Mistral en fait de graphie et l’influence de Roumanille sur lui sur ce point, parce que l’adoption de cette notation par Mistral dans son œuvre5 et dans son dictionnaire en sont la référence et l’appui majeurs. « Félibréenne » ne convient pas parce que le Félibrige utilise plusieurs graphies, « provençale » encore moins puisqu’on peut écrire, qu’on a écrit et qu’on écrit le dialecte provençal avec d’autres graphies et que d’autres dialectes peuvent s’écrire en graphie mistralienne. Nous retenons « classique » pour l’autre graphie envisagée parce que sa référence centrale est la réactivation des notations médiévales, régularisées et complétées de diacritiques. « Alibertine » n’est pas faux, mais isole le travail décisif du linguiste éponyme de la continuité où il s’inscrit. « Occitane » suggère qu’il n’y a qu’une graphie possible pour

Corpus, 12 | 2013 69

l’occitan ou langue d’oc (alors qu’elle peut comme toute langue s’écrire de mille manières) ou que n’est occitan que ce qui s’écrit avec cette graphie (alors que ce n’est pas le vêtement graphique qui fait la langue d’oc ou occitan, et que ce choix peut tout au plus contribuer à rendre son unité plus visible).

17 Les graphies « mistralienne » et « classique » ont en commun d’être des orthographes autonomes, liées à une entreprise de restauration ou de renaissance littéraire et linguistique6. L’une comme l’autre sont nées dans le Félibrige : la mistralienne en est la « loi » originelle, la classique un développement critique. Elles sont de ce fait liées l’une à l’autre à plus d’un titre : la graphie classique se construit à partir de la graphie mistralienne qu’elle entend améliorer ou accomplir, la graphie classique retient aussi des solutions qui avaient été envisagée dans la gestation de la graphie mistralienne (-a final, notation de marques de pluriel localement muettes)7.

1.1 Elément communs

18 On peut référer les éléments communs à un même principe de sobriété qui règne dans des orthographes ayant en vue l’usage régulier (et non l’utilisation occasionnelle)8. Elle s’oppose en cela à ce qu’on peut appeler « graphies oralisantes », c’est à dire des graphies orientées vers la restitution de l’effet sonore par le transfert des conventions graphique du français. Il est clair que la notation des manuscrits de l’Abbé Fabre par exemple vise avant tout à faire entendre la langue qu’elle note.

19 Cette sobriété ou cette économie s’exprime dans les choix suivants :

20 – notation légère et unifiée des diphtongues avec -u ou -i comme second élément : au, ai … paure, paire dans les deux graphies contre des notations ‘aou, âou, aù, âi, aï, ay…’ dans les usages oralisants,

21 – notation légère et unifiée des affriquées : chato en graphie mistralienne (désormais « g.m. »), chata en classique (désormais « g.c. ») (et non ‘tchato, tchiato, tsato…’), jamai (‘djamâï, djiamaï, djhamaï, dzamai…’),

22 – non-notation de l’accent tonique non marqué : cabro (g.m.), cabra (g.c.) (‘câbro, câbra…’), dire (‘dîré, dirë…’),

23 – rejet des notations ornementales : filousoufio (g.m.), filosofia (g.c.),

24 – rejet des diacritiques redondants (voir ci-dessus diphtongues et notation de la place de l’accent) : e (sans accent) note [e] que se netege e se seque, dans les deux graphies.

25 Outre leur sobriété, les deux orthographes de l’occitan se rejoignent dans la notation de certains faits de variation dialectale. Les résultats d’évolutions lourdes et anciennes sont notés. C’est le cas par exemple et typiquement :

26 – de la palatalisation nord occitane : chabro, cabro en g.m., chabra, cabra en g.c.,

27 – du traitement gascon du -f- latin : hilho, filho~fiho en g.m., hilha, filha en g.c.,

28 – de l’article pluriel caractéristique du provençal moderne : li biòu, lei biòu en face de lous biòus en g.m., lei (= [li] ou [lej]) buòus en face de los buòus en g.c.

1.2 Différenciation arbitraire

29 En revanche, les deux graphies se différencient par quelques choix arbitraires. Dans ces choix, la graphie mistralienne privilégie en général la communauté avec le français

Corpus, 12 | 2013 70

alors que la graphie classique privilégie la continuité avec les usages médiévaux spécifiques à l’occitan. On oppose ainsi :

30 – la notation de la nasale palatale qui est gn en g.m. et nh en g.c. : vigno vs vinha,

31 – la notation de la latérale palatale historique qui est -i- ou -h- en g.m. pour les parlers qui remplacent cette palatale par [j], et -lh- pour les autres, alors qu’elle est systématiquement -lh- en g.c. : paio, fiho ou palho, filho selon les parlers en g.m., palha, filha partout en g.c.,

32 – la notation des sons [ɔ] et [u] est o, ou respectivement en g.m. mais ò, o en g.c. : lou drolle en g.m. pour lo dròlle en g.c.

33 Dans le premier cas, la graphie mistralienne adopte la solution franco-italienne, tandis que la graphie classique recourt à une notation fréquente au moyen âge en domaine d’oc (d’où elle a passé au portugais). nh, lh font système pour la notation des palatales avec ch, et sh, th utilisés en gascon.

34 Dans le cas de o, ou ou ò, o, la graphie médiévale était insuffisante, donnant à « o » deux valeurs [ɔ] et [o] ou [ɔ] et [u] selon les époques. Mistral a recours à la notation française de [u], « ou » et attribue ainsi à « o » la seule valeur de [ɔ]. Alibert aligne le système de ò , o sur celui de è, e qui notent [ɛ] et [e] respectivement dans les deux graphies. Les alternances en morphologie de ò avec o et de è avec e sont de fait strictement parallèles : jòga, jogar comme lèva, levar… (en g.m. : jogo, jouga, lèvo, leva).

1.3 Différenciation par le caractère englobant

35 Les deux graphies ou les deux orthographes (si l’on entend par orthographe un système graphique fixé à vocation d’usage social, une graphie pouvant n’être que technique ou didactique) divergent surtout par leur degré d’intégration graphique ou d’univocité. La graphie mistralienne note généralement plus près de la variation dans un certain nombre de cas, alors que la graphie classique est plus englobante9.

36 Cette différence est manifeste autour des faits suivants :

37 – notation des produits de -a post-tonique protoroman : la g.c. note exclusivement -a qui recouvre des réalisations [o], [ɔ], [a], [ə], [u] tandis que la g.m. note -o pour [o], [ɔ], -a10, -e, -ou,

38 – notation d’évolutions vocaliques diverses ‘récentes’ (post médiévales) par la g.m. alors que la g.c. les laisse de côté : diphtongaison de /ɔ/ pòrc en g.c. pour porc, pouorc, pouerc, pouarc, puerc… en g.m., labialisation de /a/ en diverses positions : notation unique campana en g.c. pour campano, campono, compano, compono en g.m. ; la g.m. note l’évolution éventuelle des diphtongues atones eigueto à côté d’aigo dans les parlers qui connaissent ce phénomène alors que la g.c. note comme ailleurs aiga et aigueta… ; la g.c. note la diphtongaison conditionnée que les textes médiévaux montrent en train de se développer, mais elle réduit le nombre des types notés : -uò-, -uè-, -ue- pour le produit de -ò- en contexte palatal (nuèch ~ nuèit, nuech, nuòch), -iè-, -ie- pour le produit de -è- dans le même contexte (vièlha, vielha) les réductions ou différenciation ultérieures de la diphtongue pouvant donner par exemple des réalisations [ɲˈш] ou [nˈet] ne sont pas notées spécifiquement11,

39 – notation des consonnes latentes : elle est systématique dans la gra. clas. alors qu’elle est exceptionnelle dans la g.m. :

Corpus, 12 | 2013 71

40 – la graphie classique écrit partout parlat, prat, sec, dich ~ dit que les occlusives finales soient réalisées (comme en gascon ou en languedocien) ou non (comme en provençal ou nord-occitan), la g.m. note selon la réalisation locale a canta ou a cantat, se, ou sec, di ou dich ou dit ; elle note néanmoins toujours prat réalisé [prˈa] ~ [prˈat],

41 – la graphie classique écrit canton, segur que l’-n ou l’-r finale se prononce comme en Provence ou qu’elle soit muette comme c’est le cas plus à l’ouest ; la g.m. note cantoun ou cantou, segur ou segu.

42 – notation des neutralisations consonantiques finales : la graphie classique ne les note pas cantam, codonh qu’- m et - nh gardent leur valeur respective de [m], [ɲ] ou se confondent en [-n], trabalh, que -lh soit [ʎ] ou [j] ou [l] alors que la g.m. note cantan ou cantam, coudounh12 ou coudoun, trabai (travai), trabalh ou trabalh,

43 – notation du bétacisme : un grand tiers sud-ouest du domaine occitan ignore totalement la labiodentales sonore, la g.c. note pourtant systématiquement « v » dans tous les dialectes et écrit toujours vinha, parlava tandis que la g.m. note vigno et bigno, parlavo et parlabo ; parlava ou lavar supportent aussi les réalisations gasconnes où « v » note [w] alors que ces formes en g.m. demandent une notation spécifique : parlauo, laua.

44 On peut synthétiser la différence essentielle entre les deux graphies en disant que la graphie mistralienne est plus phonétique et la graphie classique plus phonologique. Il en résulte que les deux orthographes sont plus voisines pour un parler où les processus phonologiques sont moins complexes et plus différenciées pour un parler à la phonologie plus riche. Très caractéristiquement, c’est pour un parler comme le provençal rhodanien que les notations des deux graphies sont maximalement distantes. C’est sans doute une des racines de la vivacité polémique que revêt quelque fois le débat graphique occitan, encore qu’on puisse aussi penser que cette vivacité est un trait commun à tous les débats de ce type. Que l’on songe aux débats qui secouent l’Allemagne au moment où nous rédigeons cet article pour l’usage du ß ou à ceux que soulève la moindre discussion d’un circonflexe français !

45 Le provençal rhodanien amuit les obstruantes finales. La g.m. ne note qu’une partie de ces consonnes devenues latentes (parce qu’on les retrouve dans la dérivation). Elle note ainsi pour le provençal rhodanien cat, loup (comme cat, lop en g.c.) mais ro ou fiò… (ròc, fuòc en g.c. pour tous les parlers). La g.m. note, dans les parlers qui amuïssent les occlusives finales, lou roustit parce qu’il s’agit d’un nom, mais es rousti parce que c’est un participe passé (en g.c. on a uniformément, dans les parlers amuissants et dans les autres : lo rostit, es rostit).

46 On voit donc que dans de nombreux cas où la graphie mistralienne doit épouser la variation, la graphie classique propose d’emblée une forme unique. Il reste que la graphie classique enregistre certains processus évolutifs divergents. Ce sont les processus caractéristiques des grands ensembles dialectaux soit :

47 – la palatalisation qui oppose le nord occitan au sud depuis l’origine de la langue : chabra, jau au nord pour cabra, gal au sud,

48 – la débuccalisation de l’f en gascon, hilh, hlor vs filh, flor ainsi que d’autres processus typiques de l’aire gasconne : chute de l’n intervocalique : plea pour plena, traitement spécifique de -LL- géminé latin : aquera bèra vedèra, aqueth bèth vedèth pour aquel(a) bèl(a) vedèl(a).

Corpus, 12 | 2013 72

49 – les deux traitements du groupe -CT- latin, le sud-ouest conservant [-jt-] -it- que l’est et le nord (sauf une zone d’Auvergne et du Croissant) remplacent par une palatale -ch- : faita vs facha de FACTA etc.

50 – la vocalisation de l’-l final qui oppose le centre du domaine à toute la périphérie occitane : ostal vs ostau.

51 La gra. clas. note aussi les processus qui affectent la composition segmentale des mots : métathèses crompar en face de comprar ; craba en face de cabra, cramba en face de cambra, merulhier pour melhurier… les aphérèses : ‘nar pour anar, les prothèses arriu pour riu…

52 La graphie classique réunit donc assez largement les formes occitanes issues d’un même étymon latin, mais pas totalement. Tant pour l’usage didactique ou pratique que pour l’usage scientifique de la lemmatisation, il peut être utile de disposer d’une forme de référence au-delà de ce que la graphie établit d’elle-même. Il s’agit là d’une lemmatisation lexicale par opposition à la lemmatisation graphique. Cette opération demande des choix et des principes sur lesquels ces choix reposent.

53 Aucune des deux graphies présentées n’implique par elle-même de choix particulier concernant cette lemmatisation lexicale. Chacune d’elle est néanmoins associée par l’histoire de son développement à une logique propre en ce domaine. La g.m. s’accompagne naturellement d’une promotion systématique de la forme d’occitan utilisée par Mistral dans ses œuvres, le provençal rhodanien, nommé dans sa fonction de langue référence ‘provençal littéraire’. C’est ce que pratique Mistral lui-même dans son dictionnaire : les entrées s’ouvrent systématiquement sur la forme rhodanienne que suivent quand elles en diffèrent les variantes attestées des autres dialectes. J. Ronjat rejoint cette pratique : la Grammaire istorique, pour chaque phénomène étudié et en particulier pour analyser la morphologie, présente d’abord le provençal littéraire, note ensuite les traits du rhodanien (dit « rhodanien populaire ») que ne retient pas la langue littéraire, puis envisage les autres dialectes en commençant par ceux qui sont « voisins du provençal littéraire » et en s’en éloignant progressivement.

54 Les utilisateurs de la g.c. (mais ceux de la g.m. aussi) ont des positions très contrastées sur la norme linguistique qui peut, doit ou ne doit pas prolonger la fixation graphique. Il reste que l’entreprise de construction de la graphie dite classique est depuis le début fortement articulée sur la langue médiévale dont elle reprend fondamentalement les notations. Dans cette logique, la lemmatisation se fait en direction des formes les plus proches de la langue médiévale. La graphie classique est aussi née d’une volonté de prise en compte globale de l’espace d’oc. Il y a plusieurs façons de promouvoir parmi des parlers ou des usages une forme à vocation référentielle (que ce soit à des fins sociales ou techniques). On peut assumer un choix linguistiquement arbitraire et s’en remettre à une légitimation externe au système. C’est la logique de la lemmatisation sur le provençal littéraire. Ce qui valide le caractère référentiel du provençal rhodanien, c’est l’œuvre de Mistral et des félibres qui partagent son usage linguistique. Ce ne sont en aucun cas les propriétés intrinsèques de ce dialecte. Dans la logique de la g.c., un parler peut être considéré comme plus apte à jouer le rôle de référence ou de standard (sans encore une fois préjuger du rôle qu’on assigne à cette forme linguistique) à cause de ses propriétés. Aura typiquement vocation référentielle, un parler qui présente moins d’innovations et surtout moins d’innovations spécifiques. Les parlers languedociens sont centraux dans l’ensemble occitan au sens qu’ils ont un

Corpus, 12 | 2013 73

confront avec à peu près13 chacun des autres dialectes. Pour la plupart des faits évolutifs que note la graphie classique, le languedocien est du côté de la conservation :

55 – pas de palatalisation nord occitane des vélaires latines14,

56 – pas de débuccalisation gasconne du « F » latin,

57 – pas de vocalisation nord-occitane, gasconne ou provençale d’l final,

58 – conservation intégrale (au niveau morphémique et donc écrit) du pluriel sigmatique.

59 Cela ne signifie pas que le languedocien soit systématiquement « conservateur ». Les parlers languedociens sont sûrement souvent innovateurs en matière morphologique ou lexicale. Dans le domaine phonologique : la chute d’[-n] ou [-r] finaux sont des innovations par rapport à l’état roman commun ou médiéval, le bétacisme, originel en gascon, est relativement récent en languedocien, post médiéval en tous cas. Comme ces faits ne sont pas notés en g.c. ils n’affectent pas l’aptitude du languedocien à fournir des lemmes panoccitans.

60 Louis Alibert n’avait pas particulièrement en vue un rôle référentiel panoccitan du languedocien en rédigeant sa Gramatica puis son dictionnaire. Il se trouve que son œuvre est compatible avec une architecture normative à deux niveaux15. A un premier niveau, les grands ensembles dialectaux développent des formes de standards si l’on se place du point de vue social ou des systèmes de lemmatisation essentiellement graphique si l’on prend les choses techniquement. A un second niveau, une forme de languedocien joue le rôle de standard commun pan occitan pour qui juge pertinent l’usage d’une telle forme et peut jouer rôle de lemme dans une entreprise lexicographique ou lexicologique panoccitane comme le THESOC.

2. La lemmatisation au sein du Thesoc

2.1 Lemmatisation et indexation

61 Grâce à la participation de Guylaine Brun-Trigaud au projet d’indexation des atlas linguistiques régionaux16, les tâches de lemmatisation et de recherches étymologiques qui lui ont été confiées au sein de l’équipe du Thesoc ont bénéficié de l’expérience ainsi acquise. Cependant, le travail de lemmatisation est un peu différent du travail d’indexation, puisque dans le cas des atlas, il fallait rendre compte entièrement du contenu des cartes, en effaçant toute la variation phonétique au profit d’un lemme, quitte parfois à laisser des formes en suspens, avec une simple translittération.

62 L’idée des index d’Atlas est assez ancienne, puisque J. Gilliéron et E. Edmont ont fait paraître un pour l’ALF dès 1912. Elle fut reprise par P. Gardette dans Commentaires et Index (1976) pour l’Atlas Linguistique du Lyonnais qui avoue toute la difficulté de l’entreprise dans un domaine où il n’y a pas de tradition orthographique officielle (p. VII-VIII) : la majeure partie de l’ouvrage est consacré aux commentaires des cartes avec renvois au Französische Etymologische Worterbuch (FEW) et l’index contient massivement des formes en graphie phonétique.

63 Plus tard, l’informatique ouvrit de nouvelles perspectives et G. Taverdet compila et publia les Index de trois atlas (Atlas Linguistique de la Bourgogne en 1988, Atlas Linguistique de la Champagne et de la Brie en 1989 et Atlas Linguistique du Centre en 1993) en utilisant le

Corpus, 12 | 2013 74

système graphique du français, à quelques rares exceptions pour les formes faisant difficulté laissées en graphie phonétique.

64 Entre temps, en 1991, un projet d’indexation portant sur l’ensemble des atlas régionaux avait été lancé par le GDR des Atlas : l’idée était de constituer un index pour chaque atlas, avec possibilité d’introduire des bases étymologiques, le tout devant être regroupé dans une base nationale. Deux logiciels plus tard et après la dissolution du GDR des Atlas, l’indexation a poursuivi son chemin par des procédés différents. C. Dondaine a fait paraître en 2002 un Trésor étymologique des mots de la Franche-Comté, d’après l’ALFC. L’index alphabétique des formes regroupe la totalité des formes dialectales, typisées avec une graphie spéciale, suivies d’un renvoi au FEW et au Glossaire des Patois Suisses Romans… En 2010, F. Carton et Alain Dawson ont publié l’index de l’Atlas Linguistique Picard, en suivant les principes adoptés pour le projet initial du GDR des Atlas.

2.2 Le rôle de la lemmatisation dans le Thesoc

65 La lemmatisation joue un rôle important dans le Thesaurus Occitan et elle intervient à plusieurs niveaux.

66 L’architecture de la base de données en ce qui concerne l’implémentation des données fonctionne avec quatre niveaux :

67 1) la forme phonétique est saisie en transcription API, induisant une normalisation par rapport à la notation phonétique des atlas (= champ phonique).

68 2) la graphie phonologisante permet de restituer en graphie de type mistralien la forme phonétique (elle « traduit » la phonétique pour un public souvent peu familier des alphabets phonétiques : par ex. [ysel'ũ] « moineau » (La Javie, ALP pt 69) sera transcrit usseloun (= champ graphie phonologisante).

69 Ph. Dalbera et D. Strazzabosco ont d’ailleurs mis au point un premier algorithme permettant de réaliser automatiquement cette transcription qui fonctionne parfaitement bien pour les aires provençales et languedociennes, mais qui éprouve ses limites dans les autres aires, d’où des aménagements à venir sur cette fonction bien utile.

70 3) le lemme genre de « chapeau » à « plusieurs casquettes » : sa fonction principale de « chapeau » est de permettre de rassembler sous une même forme graphique de type alibertin (puisée dans le Dictionnaire Occitan Français selon les parlers languedociens (DOF)) les différentes variantes phonétiques d’un même terme : ex. pour le terme « chèvre », parmi les 605 réponses recueillies actuellement dans les atlas, on relève plus de 40 variantes phonétiques différentes [k'abrɔ, ʃˈæbr, ʃjˈɛb, ʦˈabrœ, ʧˈurɔ], etc. que l’on peut regrouper sous cabra (= champ lemme).

71 Ses différentes « casquettes » sont les utilisations que l’on peut en tirer : d’une part, ce regroupement permet de dessiner des cartes à aires lexicales où les lemmes sont représentés par des cercles colorés donnant la répartition géographique des termes recueillis pour une notion donnée, d’autre part, cela autorise l’ébauche d’un dictionnaire sémasiologique permettant de regrouper les différentes acceptions d’un terme défini (ex. pour cabra, outre le sens de « chèvre », on trouve, pour le moment, les sens de « chambrière du char », « chantier de tonneau », « chevalet pour scier »,

Corpus, 12 | 2013 75

« faucheux (araignée) », déjà attestés dans le DOF, mais aussi « chouette », « criquet », « sauterelle » etc., non attestés.

72 4) enfin, un dernier « étage » s’ajoute à l’édifice, avec les étymons coiffant l’ensemble des lemmes issus d’une même source étymologique (ex. avec l’étymon CAPRA, on retrouvera en sus des formes citées plus haut : cabraire°, « chat-huant », cabrarèla°°, « chouette », cabrèl, « chevreau », cabret°°, « billot », cabreta, « chèvre » et « chevreau », cabri, « chevreau », cabridar, « mettre bas (chèvre) », cabrilha, « chevreau », cabrilhar°°, « mettre bas (chèvre) », cabrilhon, « chevreau », cabrilhonar°°, « mettre bas (chèvre) », chèvre (fr), « chevalet pour scier » et « chèvre », etc. (= champ étymon) (cf. plus loin pour la signification des ° et des °°).

2.3 L’implémentation des lemmes

73 Le travail d’implémentation de la lemmatisation s’effectue à deux niveaux :

74 – le premier niveau se trouve en mode « opérateur de saisie » : la fiche d’implémentation comporte une rubrique « lemme » à liste déroulante permettant, soit de sélectionner une forme existante, puisée dans le DOF, ayant été intégrées lors de saisies précédentes, soit de saisir une nouvelle forme en suivant des règles sur lesquelles nous reviendrons plus loin, forme qui s’ajoutera automatiquement à la liste pour devenir disponible à son tour. Le remplissage de cette rubrique n’est bien sûr pas obligatoire pour la validation de l’enregistrement, cette absence de rattachement (résultat d’une ignorance ou d’un doute) a cependant pour conséquence de rendre incomplètes les cartes de synthèses lexicographiques basées sur la présence des lemmes.

75 – Le second niveau, accessible seulement en mode « administrateur », permet par une fonction spéciale d’accéder à toutes les formes phonétiques différentes saisies pour une notion donnée. En regard, se trouvent l’ensemble des lemmes intégrés par les opérateurs. Il suffit alors de faire coïncider les formes phonétiques avec l’un des lemmes existants ou de créer un lemme pour que l’ensemble des formes phonétiques sous-jacentes similaires soit pourvu de la forme convenable. Cette fonction a pour avantage de donner une vision globale des variantes en présence, ce qui souvent est déterminant pour le choix de tel ou tel lemme, d’autre part elle a un caractère non définitif, puisqu’il est toujours possible de revenir sur telle ou telle forme.

2.4 Les règles

76 Cette tâche de lemmatisation pourrait presque s’automatiser en terme de recherche : forme phonétique → graphie phonologisante (dite par approximation « mistralienne ») → graphie classique → recherche automatisée dans la version informatisée du DOF = absent / présent.

77 Cependant, cela n’est pas aussi simple, car à la dimension présence/absence, s’ajoute la dimension de l’adéquation sémantique : en fait, pour lemmatiser, il faut se poser deux questions essentielles : d’une part, le terme existe-t-il ou non dans le DOF ? (ce qui suppose quand même de l’avoir reconnu en le « déshabillant » de sa variation dialectale et donc de bien connaître les parlers traités (cf. les exemples donnés pour « chèvre ») et d’autre part, s’il est attesté, a-t-il le même sens ?

Corpus, 12 | 2013 76

78 Après la phase de reconnaissance de la forme phonétique (effacement de la variation), la lemmatisation proprement dite obéit aux principes suivants :

79 – les formes verbales sont ramenées à l’infinitif,

80 – les adjectifs et participes sont ramenés au masculin singulier,

81 – les substantifs au singulier (sauf si le singulier est inusité ou lorsque la forme au pluriel apporte un sens particulier).

82 Pour la confrontation avec le DOF, dans l’état actuel des choses, plusieurs options se présentent :

83 1) la forme reconnue est attestée dans le DOF avec le sens stipulé par la source (ici en l’occurrence le titre de la carte de l’atlas traitée), alors le terme figure tel qu’il est attesté (ex. cabra est attesté au sens de « chèvre », pour reprendre les exemples cités plus haut) ;

84 2) la forme reconnue est attestée dans le DOF, mais le sens spécifique contenu dans la base est différent, cette différence est marquée par la présence d’un symbole ° après le terme (ex. cabra est bien attesté aux sens de « chèvre », de « chevalet pour scier » et de « faucheux (araignée) », alors qu’il a été également recueilli avec les sens de « criquet », de « sauterelle » et de « chouette » dans les atlas, donc il figure comme cabra° en regard des formes phonétiques recueillies avec ces sens spécifiques ;

85 3) la forme reconnue n’est pas attestée dans le DOF, mais la base lexicale y figure avec d’autres affixes. On procède alors à l’ajout de l’affixe convenant, en respectant la graphie alibertine et l’on adjoint les symboles °° à la forme constituée (ex. cabrilhar°°, « mettre bas (chèvre) » n’est pas attesté, mais on y trouve cabrilha « jeune chèvre » et cabrilhon « jeune chevreau ») ;

86 4) la forme reconnue ne figure pas dans le DOF, hors homonyme. Cet ajout, en respectant la graphie alibertine est marqué par la présence du symbole * (ex. reinard* ne figure pas comme entrée pour « renard »17 ou encore tondol* pour « assiette », etc.) ;

87 5) enfin les formes reconnues comme étant empruntées au français sont notées avec la graphie française et l’abréviation (fr) leur sont adjointes (ex. la forme phonique [ʃˈɛv] est associée à chèvre (fr)).

88 Une sous-catégorie est apparue quand il s’est agi de traiter les formes relevées dans les atlas périphériques au regard de l’espace occitan (l’Atlas du Centre et l’Atlas de l’Ouest dont une partie du domaine comprend les parlers du Croissant qui ont été intégrés au réseau du Thesaurus Occitan). Il s’agit de termes inconnus du français standard, mais attestés dans les dictionnaires dialectaux. L’abréviation (fr*) leur est alors adjointe (ex. encoubaisser (fr*) « attacher une corne à une patte (pour entraver une bête) » attesté dans le Glossaire du Centre de la France de Jaubert).

89 Malgré tout, si la tâche semble facilitée par l’existence du dictionnaire de référence qu’est le DOF, il n’est pas toujours facile de se résoudre à une lemmatisation trop générale. Même L. Alibert n’a pas toujours tranché : soit il a utilisé la double vedette (ex. lach ~ lait, mossilhar ~ morsilhar « mordiller », etc.), soit il a fait usage des variantes (ex. avelana « noisette », Var. aulana, auglana, avelan) (voir plus loin).

90 Et comment ne pas évoquer les formes hybrides rencontrées dans les aires des atlas périphériques (Croissant et « amphizone » franco-provençale) où l’hybridité peut être phonétique comme dans le cas de [ʃjˈɛb] « chèvre » à lemmatiser sous cabra ou sous chèvre (fr) ou lexicale comme [asãbjˈad] assemblada « fête locale » qui est une forme

Corpus, 12 | 2013 77

occitane d’un terme largement répandue dans les parlers français de l’Ouest : l’ assemblée.

2.5 Quelques statistiques dans le Thesaurus occitan

91 Actuellement (avril 2013), le Thesaurus occitan comporte environ 1 212 250 formes phonétiques distinctes (techniquement des « enregistrements »), dont environ les deux-tiers (801 633) sont associés à un lemme, au nombre de 44 000, répondant au critère « forme / sens unique ».

92 – 7429 lemmes (17 %) apportent un changement de sens par rapport aux formes attestées dans le DOF,

93 – 6046 lemmes (13 %) se différencient la forme attestée dans le DOF par la présence d’un affixe,

94 – 904 lemmes (2 %) ne sont pas attestés dans le DOF.

95 Ce dernier chiffre est bien sûr très en-deçà de la réalité, puisque lorsque le lemme reconstitué (ou considéré comme tel) ne répond pas aux options 1, 2 ou 3, par réflexe ou par prudence, les opérateurs laissent la rubrique vide.

96 A l’inverse, la proportion de lemmes étiquetés « (fr) » (français) est très grande, 6589 (15 %), puisque ces formes sont facilement reconnaissables et donc traitées en priorité ; la proportion de ce type devrait fortement baisser au fur et à mesure de l’implémentation des lemmes.

3. Enrichissements du DOF

97 Quelques exemples permettront de constater dans quelle mesure le Thesaurus occitan produit un enrichissement du DOF.

Enrichissement sémantique :

98 Sous la vedette cuca, f, du DOF, on relève les sens de ‘lente’, ‘chrysalide’, ‘vermisseau’, ‘chenille’, ‘mite’, ‘artison’ et ‘petit insecte’. Idem dans le Trésor du Félibrige de Mistral, qui ajoute les sens de ‘ver luisant’ et de ‘femme perfide’ et fait des entrées à part (omises par L. Alibert) pour cuco ‘rainette’, ainsi que pour cucho, cuco, cusso ‘tas, monceau, butte’.

99 Le Thesoc atteste bien sûr des sens relevés par Mistral et Alibert, « asticot », « chenille », « insecte en général », « lente », « ver luisant » et « grenouille » d’une part et « meule de paille », « petit tas de gerbes » d’autre part, mais atteste également de « courtillière », « hanneton », « ver blanc » et « crapaud », et en restant dans l’aire animalière délimitée par les lexicographes, des sens de « vipère » et d’« orvet », de « pansement au doigt », et d’« épouvantail » pour l’autre terme.

100 Autre exemple, sous la vedette bramar, v intr, du DOF, on relève les sens de « bramer ; braire ; mugir ; beugler, s’égosiller ». Idem dans Le Trésor de Mistral qui ajoute « brailler, crier, rugir ; pleurer ; vociférer ».

Corpus, 12 | 2013 78

101 Le Thesoc atteste bien sûr des sens relevés par Mistral et Alibert, mais élargit le sens à « hennir », « bêler », « chevroter », « aboyer », « croasser », « crier (de l’aigle) » et aussi « crier (charivari de mariage) », et « publier les bans ».

Enrichissement lexical par apport d’affixes

102 La vedette pelha, f, du DOF est déjà riche d’un grand nombre de dérivés : pelhar, pelhaire, pelhandra, pelhandran, pelhandrós, pelhard, pelharòc, pelharocaire, pelhàs, pelheret, pelhièra, pelhotassa, pelhon, pelhasson, pelhomàs, pelhòc, pelhòl,-a, pelhòfa, pelhagondrit, pelhós, pelhòt, pelhum. Il faudra en adjoindre d’autres avec les données du Thesoc : pelharaud « créature fabuleuse », pelharòt et pelharotaire « chiffonnier » (var. de pelharòc, pelharocaire), pelharut « déguenillé », pelhatge « linge », pelhet « chiffon ».

103 Enrichissement lexical :

104 Les absences lexicales du DOF, qui par ailleurs sont parfois attestées dans le Trésor, sont quelquefois des oublis comme cantar ou reinard* (encore que ce dernier soit attesté par coa de reinard), mais le plus souvent sont des formes qui soit n’appartiennent pas au domaine couvert par le DOF, comme pacha* « fesse », masada* « fourmi »… soit des formes considérées comme des gallicismes et écartées pour cette raison dans un ouvrage dont la perspective est explicitement normative, comme par exemple fermar « fermer ». Alibert a en effet pour habitude de ne pas citer les gallicismes qu’il recommande d’éviter : sa liste de gallicismes corrigé ne donne que les correction et laisse les gallicisme implicite. Il est évident qu’un dictionnaire descriptif de l’occitan doit intégrer (et donc lemmatiser) les gallicismes : il faut des entrées boèta, volur, achetar… dans un dictionnaire général de la langue occitane.

Application : la lemmatisation d’avelana

105 La carte noisette de l’ALF est un bon exemple de carte complexe à la fois lexicalement et phonologiquement.

106 Un premier niveau de lemmatisation est donné par le passage à une forme orthographique classique : il livre des formes avelana, mais aussi auglana, aulana, averana, aurana, averaa… Il livre aussi des formes du type aulanha ou ametlana. Il livre enfin nosilha, noseta et anuçòla. On ne trouve pas du côté du fruit de formes apparentées à vaissa ou à còure qui peuvent désigner l’arbre.

107 La graphie réduit sensiblement la dispersion des formes mais ne fournit pas d’emblée toute la structure lemmatique dont on peut avoir besoin.

108 Les premières formes citées ont en commun d’être des avatars de la même matière étymologique. Elles ne diffèrent que par l’intervention de processus phonologiques : traitement d’-LL- géminé intervocalique, chute de la prétonique interne, épenthèse consonantique, chute d’-n- intervocalique… Ces formes pourraient être lemmatisées par leur étymon, ABELLANA. On a vu les difficultés éventuelles de cette approche. Elles peuvent être lemmatisées par une d’entre elles, préférablement une forme qui n’a pas subi les divers processus responsables de la divergence, soit avelana.

109 Dans un dictionnaire panoccitan complet, on pourrait admettre que la seule forme avelana soit suivie d’un article qui la définisse et l’illustre de citations. Aulana, auglana,

Corpus, 12 | 2013 79

averaa etc. seraient renvoyées à cette forme au titre de variantes (sauf spécificité sémantique liée exclusivement à une des formes qui justifierait un article propre en plus du renvoi).

110 Le renvoi au titre de variante est distinct du renvoi au titre de synonyme : c’est ce dernier qu’il faut envisager pour noseta, nosilha ou anuçòla. C’est aussi comme des synonymes (et non comme des variantes) qu’il faut considérer toute forme dont la composition morphologique ou l’étymon diffère. Les formes avelanha, aulanha… qui remontent à *ABELLANEA et non ABELLANA (à moins qu’elles ne résultent d’une fausse régression à partir d’avelanièr cf. plus loin) , doivent être considérées comme des synonymes. De même avelanilha < °ABELLANICULA, aulinha

111 On pourra éventuellement considérer que, en plus d’être lemme orthographique direct d’un bon nombre de variantes phoniques ([aβelˈano], [avelˈano], [avelˈana]…) et qu’en plus d’être le lemme lexical qui réunit des variantes marquées par des processus évolutifs lourds que la graphie enregistre, avelana peut aussi représenter la famille des mots issus d’une base °ABEL-18 ? Comme nosilha peut être pris pour représentant des formes diminutives tirées de NUX.

112 Enfin, à un niveau ultime « avelana » avec des guillemets est un bon candidat pour traduire le français « noisette » et désigner en occitan le concept dont l’ALF ou les atlas régionaux relèvent la variété des désignations.

113 L’articulation plus précise des formes liées au lemme lexical avelana est donnée dans les tableaux 1 & 2. Ces tableaux sont classificatoires et non pas chronologiques. Ils montrent la cooccurrence dans une forme de divers processus évolutifs, non l’ordre dans lequel cette évolution s’est faite.

Corpus, 12 | 2013 80

Avertissement :

114 Les deux tableaux précédents classent les formes selon les processus phonologiques qu’elles présentent. La succession des colonnes ne cherche pas à refléter la chronologie relative des changements. En fait, cela ne peut pas être le cas parce que, par exemple, la syncope ne saurait précéder le rhotacisme qui suppose que la latérale géminée soit intervocalique. Plus généralement, le fait que la variation repose parfois sur un ordre différent des processus envisagé exclut que l’on puisse toujours ordonner de manière chronologique ainsi les processus pour un groupe de formes.

115 L’ordre des colonnes et des valeurs dans les colonnes ne tend qu’à mettre en évidence les regroupements qui apparaissent sur les cartes (Cartes 1 & 2 en annexe). Ces cartes distinguent tout d’abord les formes du type avelana des formes issues de dérivés de NUX : nosilh, noseta, noisette. Parmi les formes issues d’ABELLANA ou apparentées, on distingue d’abord par la couleur celles qui supposent soit un étymon spécifique *ABELLANEA comme l’admet le FEW, soit une fausse régression à partir du nom de l’arbre (avelanièr, analysé avelanhièr, homophone et donnant avelanha). On distingue ensuite des formes gasconnes où la chute de l’n intervocalique donne des oxytons, souvent réinterprétés en masculins. L’ALF relève une seule forme féminine de ce type alors que l’ALG fait état d’une fréquente indécision sur le genre de la forme. La graphie classique de l’occitan notera de manière distincte et permettra donc de lemmatiser : averaa une forme féminine du type [awerãŋ] et averan une forme masculine de même réalisation.

116 Les aboutissants de ABELLANA présentent de manière attendue deux faits typiques du domaine gascon, le traitement de -LL- intervocalique latin (-LL- → -r- / v__v) et la chute d’n intervocalique (-n- → Ø/ v__v). On s’attend donc à trouver un type gascon averaa [awerˈa◌̃] en face d’un type général avelana [aβelˈanɔ] etc. Eventuellement, on s’attend à ce que les deux traits gascons puissent ne pas coïncider toujours. De fait, on trouve averana avec - LL- → -r- mais sans chute d’n intervocalique, mais on ne trouve pas d’*avelaa suggérant que l’aire de la chute d’n intervocalique est incluse dans celle du traitement gascon d’-LL- géminé.

117 Un fait massif vient compliquer ce tableau, la syncope de la prétonique interne dans nombre de parlers (aulana), suivie de l’éventuelle épenthèse d’une vélaire (auglana). La chute de la prétonique interne est de règle en occitan, en syllabe ouverte. La question est précisément celle-ci : la seconde syllabe d’ABELLANA est-elle ouverte ou fermée ? Tant qu’on a affaire à une géminée réelle, elle est fermée, mais elle peut être ouverte à partir du moment où l’opposition -LL- géminé -L- simple se transforme en opposition

Corpus, 12 | 2013 81

qualitative (l alvéolaire ou rétroflexe contre l vélaire par exemple…). On admettra donc que la syncope s’est produite dans des parlers qui ont réduit précocement la géminée au profit d’une différenciation qualitative ou pour aboutir à une neutralisation.

118 Le fait qu’on trouve des formes du type aulaa en gascon occidental peut s’expliquer si l’on pose une syncope précoce dans ces parlers, au stade où l’opposition -LL- / -L- avait pris la forme -l- / -ɬ-. l aurait ainsi été gelé à ce stade (puis vocalisé) au lieu de suivre l’évolution générale vers r. auraa suppose une syncope soit au stade cacuminal soit au stade rhotique : ABELLANA → aβeɭˈana → awɭˈana → awrˈana ou ABELLANA → aβeɭˈana → aβerˈana → awrˈana.

119 Ailleurs qu’en Gascogne, l’opposition du type avelana au type auglana peut être imputé aussi à une chronologie relative différente de ce qui est ici une perte non compensée de la géminée intervocalique et de la syncope. On peut risquer que les parlers qui en finale traitent de même -L- simple et -LL- géminé (ou gal rime avec ostal) sont de bons candidats à une neutralisation précoce, ceux qui distinguent le produits d’L simple et LL géminé (qui disent ostau mais gal) sont, au contraire, candidats à une plus longue préservation de la géminée. Le languedocien central traite de manière identique -L- et - LL- en toute position. Le languedocien oriental et le provençal nîmois présentent un traitement différencié. On peut donc avancer l’hypothèse que dans cette zone abellana a conservé une géminée assez longtemps pour résister à la syncope de la prétonique interne.

120 Les aires d’aulana, auglana d’un côté, avelana de l’autre, ne répondent pas trop mal à cette explication proposée sauf que l’aire d’avelana s’étend assez largement en zone de confusion d’-L- et de -LL-. Outre que la distinction en finale n’est qu’un indice et non une preuve et donc qu’elle n’est pas non plus une contrainte sur le déroulement chronologique, on peut supposer aussi des rediffusions de dialecte à dialecte. On peut le supposer, d’une part à la vue de la forme de l’aire abelana qui avance dans les vallées fluviales. On le peut aussi en s’appuyant sur une remarque de l’auteur anonyme d’un dictionnaire occitan français manuscrit de la toute fin du XVIIIe siècle (Bazalgues 1987). Ce dictionnaire a été composé à Saint-Hippolyte-du-Fort, dans le piémont cévenol. L’auteur dans son article avelano explique la différence qu’il y a en français entre « noisetier » cultivé et « coudrier » sauvage. Il en tire la conclusion que sur la montagne de la Fage (qui domine Saint-Hippolyte-du-Fort) il n’y a que des « coudrettes », des bois de coudriers, et pas de noisetiers. Or ce pays haut où croissent des « coudriers » est un pays où on dit auglana et non plus avelana comme à Saint-Hippolyte. On peut donc imaginer que les avelanas avancent là où l’arbre est cultivé ou inconnu. Dans le dernier cas la noisette vendue comme fruit sec a pu être le vecteur du mot : Jean Michel au vers 2276 de son Embarràs de la fièira de Beucaire évoque des « vendeires d’avelanas », attestant qu’on vendait des noisettes à la foire de Beaucaire (cf., commodément, Gardy 1974). Et une expression comme cracar averaas en Béarn, c’est à dire crocar d’avelanas au sens du français boire du petit lait (cf. Lespy & Raymond 1887 s.v. aberaa) suggère que la noisette a pu être une friandise très prisée et donc commercialisée, et que ce commerce a pu faire voyager certaines formes (comme avelana).

Corpus, 12 | 2013 82

Conclusion

121 Toutes les langues qui ont une orthographe d’usage établie trouvent dans les formes de cet usage un outil commode pour trier et référencer la masse de leurs variantes dialectale. Les linguistes qui pratiquent ces langues sont aussi des usagers (et habituellement des usagers experts) des codes graphiques communs. En domaine occitan cette compétence d’une part n’est pas systématique (il y a des linguistes travaillant dans le domaine occitan qui ont une connaissance très approximative des graphies d’usage) et d’autre part est sous exploitée par ceux qui la maîtrisent par crainte de sortir d’une supposée réserve ou neutralité scientifique que garantirait le non recours aux graphies d’usages de la langue. La présente contribution a voulu souligner l’intérêt d’une normalisation de la linguistique occitane, au sens de l’entrée sans confusion mais sans réserve dans une pratique normale dans d’autres domaines linguistiques, où code orthographique et notations phonétiques se complètent. Quelle que soit la graphie de l’occitan, la démarche serait soutenable. Elle l’est pour l’anglais ou le français dont on connaît les orthographes complexes. Elle le serait avec la norme mistralienne (comme l’utilise Ronjat dans sa grammaire (h)istorique, qui illustre d’abord ses analyses avec les formes rhodaniennes, malgré leur non-centralité dans le diasystème occitan, le provençal rhodanien étant connu pour avoir développé un bon nombre d’innovations). Toute standardisation en place, quelques réserves techniques que l’on puisse faire à son sujet, pourrait être opérationnelle. Il se trouve toutefois que la graphie dite classique (prolongée par une normalisation linguistique pluricentrique) est aussi un instrument techniquement assez commode et pertinent de manipulation et d’analyse des données comme on a tenté de le montrer à propos des variantes d’avelana. C’est aussi un instrument que l’entreprise du THESOC met à son service dans son projet global.

BIBLIOGRAPHY

ALF : voir Gilliéron & Edmont.

Alibert L. (1966). Dictionnaire occitan-français, sur la base des parlers languedociens (DOF). Toulouse : Institut d’Estudis Occitans.

Alibèrt L. (1976). Gramatica occitana, segon los parlars lengadocians. Montpelhièr : CEO. [reedicion corregida : 1ra edicion 1935].

Bazalgues G. (éd.) (1974). Dictionnaire Languedocien-Français manuscrit (Saint-Hippolyte-du-Fort 1798) [anonyme]. Montpellier : CEO-UPV.

Boisgontier J. (1981-1986). Atlas Linguistique et Ethnographique du Languedoc oriental. (ALLOr). Paris : CNRS, 3 vol.

Bouvier J.-C. & Martel C. (1975-1986). Atlas linguistique et ethnographique de la Provence (ALP). Paris : Editions du CNRS (3 vol.).

Corpus, 12 | 2013 83

Brun-Trigaud G. (2003a). « Présentation du logiciel d’indexation des atlas linguistiques régionaux », in S. Laine, P. Boissel & C. Bougy (éd.) VIIe colloque international de dialectologie et de littérature du domaine d’oïl occidental : A l’ouest d’oïl, des mots et des choses. Caen : Presses universitaires de Caen, 293-299.

Brun-Trigaud G. & Carton F. (2003b). « Lemmes, supra-lemmes : dilemmes… Problèmes d’indexation de l’Atlas linguistique picard et de l’Atlas linguistique du Centre », in J.-C. Bouvier, J. Gourc & F. Pic (éd.) Sempre los camps auràn segadas resurgantas. Mélanges offerts à Xavier Ravier. Toulouse : CNRS / Université Toulouse-Le Mirail, 63-72.

Carton F. & Dawson A. (2010). Index lemmatisé et étymologique de l’Atlas Linguistique et ethnographique Picard. Amiens : Université de Picardie Jules Verne.

Chantraine P. (1970-1980). Dictionnaire étymologique de la langue grecque : histoire des mots. Paris : Klincksieck, 2 vol. xviii, 1368 p.

Dalbera J.-Ph. (1998). « La base de données Thesoc : état des travaux » in J. Gourc & F.Pic (éd.) Toulouse à la croisée des cultures, 403-417.

Dauzat A. (1929). « Essais de géographie linguistique (nouvelle série) », Revue des langues romanes 66 : 45-80.

Dondaine C. (2002). Trésor étymologique des mots de la Franche-Comté, d’après l’ALFC. Strasbourg : Société de linguistique romane.

Dubuisson P. (1976-1982). Atlas Linguistique et Ethnographique du Centre. Paris : CNRS (3 vol.).

Gardette P. (1976). Atlas Linguistique du Lyonnais. V. Commentaires et Index. Paris : CNRS.

Gardy Ph. (éd.) (1974). L’embarràs de la fièira de Beucaire de Jean Michel. Montpelhier : Centre d’Estudis Occitans.

Gilliéron J. & Edmond E. (1912). Table de l’Atlas Linguistique de la France. Paris : Champion.

Gillieron J. & Edmont E. (1902-1910). Atlas linguistique de la France. (ALF). Paris : Champion.

Harper D. (2003). Online Etymology Dictionary [En ligne http:// www.etymonline.com, consulté le 2013-07-22], Ohio University.

Jaubert H.-F. (1864-1869). Glossaire du Centre de la France. Genève : Slatkine Reprint (1970).

Kremnitz G. (1974). Versuche zur Kodifizierung des Okzitanischen seit dem 19. Jahrhundert und ihre Annahme durch die Sprecher. Tübingen : G. Narr.

Lafont R. (1971). L’ortografia occitana, sos principis. Montpelhièr : CEO.

Lafont R. (1972). L’ortografia occitana, lo provençau. Montpelhièr : CEO.

Lafont R. (1997). Quarante ans de sociolinguistique à la périphérie. Paris : L’Harmattan.

Lespy V. & Raymond P. (1887). Dictionnaire Béarnais ancien et moderne. Montpellier : Hamelin.

Massignon G. & Horiot B. (1971-1983). Atlas Linguistique et Ethnographique de l’Ouest. Paris : CNRS (3 vol.).

Mistral F. (1882-1886). Lou tresor dóu Felibrige (2 vol.). Aix-en-Provence : Ve Remondet-Aubin [réimp. avec une préface de J.Cl. Bouvier 1979, Aix : Edisud].

Nauton P. (1955-1961). Atlas linguistique et ethnographique du Massif central (ALMC). Paris : Editions du CNRS (4 vol.).

Corpus, 12 | 2013 84

Palay S. (1932-33). Dictionnaire du béarnais et du gascon modernes. Pau : Marrimpouey. (réédition Paris : CNRS 1963, 1994).

Potte J-Cl. (1975-1992). Atlas linguistique et ethnographique de l’Auvergne et du Limousin (ALAL). Paris : Editions du CNRS (3 vol.).

Ravier X. (1978-1993). Atlas linguistique et ethnographique du Languedoc occidental. (ALLOc) Paris : CNRS.

Ronjat J. (1930-41). Grammaire istorique (sic) des parlers provençaux modernes. Montpellier : Société des Langues Romanes.

Sauzet P. (2002). « Réflexions sur la normalisation linguistique de l’occitan », in D. Caubet, S. Chaker & J. Sibille (éd.) Codification des Langues de France. Paris : L’Harmattan, 39-61.

Schlieben-Lange B. (1971). Okzitanisch und Katalanisch : ein Beitrag zur Soziolinguistik zweier romanischer Sprachen. Tübingen : G. Narr.

Séguy J. (1954-1973). Atlas linguistique et ethnographique de la Gascogne. Paris : CNRS.

Sumien D. (2006). La standardisation polycentrique de l’occitan. Nouvel enjeu sociolinguistique, développement du lexique et de la morphologie. Turnhout : Brepols.

Taupiac J. (1980). « Quin modèl lexicografic foguèt Simon Jude Onorat per Frederic Mistral », Quasèrns de Linguistica Occitana 9 : 17-22.

Taverdet G. (1988). Index de l’Atlas Linguistique de la Bourgogne. Dijon : ABDO

Taverdet G. (1989). Index de l’Atlas Linguistique de la Champagne et de la Brie de Henri Bourcelot. Dijon : ABDO.

Taverdet G. & Dubuisson P. (1993). Index de l’Atlas Linguistique du Centre. Dijon : ABDO.

Teulat R. (1980). « Remarcas subre l’ortografia del Tresor dóu Felibrige » Quasèrns de Linguistica Occitana 9 : 52-57.

NOTES

1. Un pas qu’il faut se garder de franchir consiste à considérer que « patois » étant un terme couramment utilisé par les locuteurs serait un ‘autoglossonyme’. Pour être assumé, « patois » n’en reste pas moins historiquement induit sinon imposé. Cette historicité est soulignée par la perception différente du terme hors des frontières politiques françaises, comme par sa non-implantation en pays niçard sur laquelle insiste un de nos relecteurs. 2. Il s’agit de la situation, très largement majoritaire, des parlers occitans en territoire français. La situation sociolinguistique est notablement différente (et pas seulement parce que la langue haute est autre que le français) dans les Vallées occitane italiennes ou le Val d’Aran espagnol. 3. Dans l’index de l’ALF on trouve toutefois une forme de lemmatisation par allègement des diacritiques sur les formes phonétiques et par l’enregistrement de type français régionaux qui sont des calques des formes locales éventuellement occitanes. 4. Ce qui ne signifie pas que tout usager d’une notation orthographique doive afficher un militantisme linguistique radical.

Corpus, 12 | 2013 85

5. Ce qui n’implique pas que l’œuvre de Mistral ne soit pas graphiquement transposable bien sûr. 6. J. Taupiac insiste justement sur les rationalisations qu’apporte Mistral à Honnorat et que conservera Alibert, même si certains choix d’Honnorat préfiguraient ceux de la graphie classique (Taupiac 1980). 7. Pour une présentation de la graphie classique voir en particulier Lafont 1971 et 1972. Pour l’histoire de la codification de l’occitan au début du XXe siècle, voir Kremnitz 1974. 8. La formule suivante que Ronjat applique à « l’ortografe félibréenne » vaut tout aussi bien pour la graphie classique : « (cette orthographe) rejette en principe tout signe fisiologiquement ou psicologiquement superflu. » (graphie du français et mise en relief de l’auteur) (Ronjat 1930-37 1 §45, 81). 9. Cette différence entre les deux graphies est soulignée par exemple dans Teulat 1980. 10. Le timbre [a] de la finale, tel qu’on le trouve à Montpellier ou à Nice, impliquerait dans la logique graphique mistralienne la notation systématique de l’accent tonique pénultième puisque -a final est censé être accentué : canta [kantˈa] implique de noter cànta pour [kˈanta]. En fait dans les parlers qui réalisent [a] atone final, on note en g.m. l’accent sur [a] tonique final : canta, cantà (Nice ou Montpellier) en face de canto, canta (Maillane ou Toulouse) (Ronjat §43, 80). En gra. clas., on a dans ce cas uniformément canta et cantar. 11. Du moins ne le sont pas en principe, car on trouve des usages de la graphie classique qui notent par exemple des formes comme nèit ou neit… Remarquons en passant que la différenciation de -uè- et de -ue-, de -iè- et de -ie- que retient la gra. clas. pourrait avantageusement être abandonnée dans une entreprise lexicographique sinon dans l’usage. Cette notation qui ne tend qu’à rendre des différences dialectales et non des oppositions internes à un parler est contraire à l’esprit général de la gra. clas. Un point d’application particulier est la graphie du suffixe -ier < ARIU où -ièr languedocien s’oppose à -ier provençal mais sans pertinence phonologique dans aucun des dialectes. On écrira avantageusemenet -ier partout (mais -èr, -èir en gascon), de même que nuech ~ nueit et vielh. 12. Cf. TdF s.v. coudoun. D’ailleurs Mistral, pour une raison qui nous échappe, note bagn et banh, à côté de ban (pour gra. clas. banh). Ronjat lui ne note qu’en -gn : bagn les réalisations palatales (Ronjat §52, 95). 13. Le confront languedocien-vivaro-alpin est réduit sinon théorique. 14. La palatalisation n’est une « innovation » que relativement à l’état latin ou protoroman. Dans l’histoire de la langue elle est attestée dès les premiers textes, comme bien des traits gascons et à la différence des principaux traits qui caractérisent le provençal. 15. Sur l’architecture générale de la norme classique occitane on peut se référer à la synthèse de Dominique Sumien (Sumien 2006). 16. Cf. Brun-Trigaud, 2003a et 2003b. 17. Cependant, le terme est attesté par coa de reinard « amarante » sous coa ce qui relève soit de l’oubli dans la part du travail du lexicographe, ou plus vraisemblablement du purisme (Alibert n’indique pas en général les emprunts récents au français).

18. On explique classiquement ABELLANA et ses variantes comme des formes dérivées d’un toponyme : abellana nux, ‘noix d’Abella’ ville de Campanie réputée pour ses fruits (FEW 24.134, p.

Corpus, 12 | 2013 86

28). Caton distingue ainsi « nuces abellanae, praenestinae, calvae… » (De agricultura 8.2, 133.6). On remarque toutefois que ABEL- est une désignation indo-européenne répandue du ‘fruit’ (germ. apple, Apfel ‘pomme’, breton : aval ‘pomme’, gaélique d’Ecosse ubhal¸ russe yabloko etc.). Il est donc plus satisfaisant de voir dans abellana nux la désignation une noix éminemment comestible (noix- fruit) qui a rencontré un toponyme lui-même formé sur une base faisant référence aux fruits (cf. Gaffiot et l’explicitation virgilienne qu’il cite : malifera Abella ‘Abella riche en fruit’). Une situtation initiale où abelana nux ‘noix fruitière’ est parallèle à Abella ‘(terre/pays) du fruit, abondant’ fait naître une étymologie populaire où le nom du lieu explique le nom du fruit. De même gr. κάστανα et de-là lat. castanea est quelque fois expliqué par un toponyme pontique ou thessalien, mais il est plus convaincant de considérer que les toponymes viennent de l’arbre dont le nom, outre l’arménienr kask ‘châtaigne’ peut être rapproché du nom celtique du chêne cassanos, oc. casse (cf. Chantraine 1980 s.v. κάστανα, Harper s.v. chestnut). Un indice interne à l’occitan vient appuyer cette hypothèse : il existe un adjectif abelan, -a que Mistral applique à la terre et fait rimer au féminin avec avelana justement. Mistral traduit « la tèrra es abelana » par « la terre est généreuse ». Le -b- d’abelan peut s’expliquer par un passage par une autre langue que le latin, ou un emprunt interdialectal.

ABSTRACTS

The Thesaurus Occitan : between atlas and dictionnaries Too few scholars are dedicated to Occitan studies. There are a lot of reasons for such a situation, among which the social and political status of the language is not the least. Occitan studies also are affected by a split in the research attitudes and conceptions. Specifically, there is no regular continuity between works describing dialectal varieties and works contributing to corpus planning, even when the former ones don’t undervalue the language status and the latter ones don’t ignore dialect complexity. We shall not try here to analyse the reasons for this difficult cooperation. We only want make it clear, on the basis of a few examples, that the orthographic codification of Occitan not only has a practical relevance (allowing to write, use and teach the language), but also is a valuable scientific and descriptive tool. In order to do so, we shall first explain the principles of the so-called « classical » Occitan orthography and we shall then indicate how lemmatizing on the basis of this notation strongly helps organize, from inside the language, the huge wealth of lexical and morphological data included in Thesaurus Occitan (THESOC, cf. Dalbera 1998 and for an online sample : http:// thesaurus.unice.fr/).

Les études occitanes souffrent d’un manque de chercheurs. Les causes en sont multiples et ne sont pas étrangères au statut social et politique de la langue. Les études occitanes souffrent de plus d’une segmentation des pratiques et des réflexions. Spécifiquement, la circulation n’est pas facile entre la description des variétés dialectales de l’occitan (même pénétrée de la dignité de la langue) et la codification (même bien informée de la réalité dialectale). Notre propos n’est pas ici d’analyser les raisons de ces dysfonctionnements, mais de montrer par l’exemple que la codification graphique de l’occitan a une utilité scientifique et descriptive, en plus de sa pertinence pratique première (écrire, utiliser et enseigner la langue). Pour ce faire, nous présenterons ici la logique de la codification graphique dite « classique » de l’occitan avant de montrer comment une lemmatisation fondée sur cette graphie est un précieux instrument d’organisation interne de la masse de données lexicales et morphologiques occitanes que

Corpus, 12 | 2013 87

constitue le Thesaurus Occitan (THESOC, cf. Dalbera 1998 et pour la partie en ligne : http:// thesaurus.unice.fr/).

INDEX

Mots-clés: Occitan, atlas, dictionnaires, codification graphique Keywords: Occitan, atlases, dictionaries, orthographic codification

AUTHORS

PATRICK SAUZET Université de Toulouse, CNRS, « Cognition, Langues, Langage, Ergonomie »

GUYLAINE BRUN-TRIGAUD Univ. Nice Sophia Antipolis, CNRS, BCL, UMR 7320, 06300 Nice, France

Corpus, 12 | 2013 88

Perception catégorielle et pertinence référentielle. Le cas des animaux domestiques en domaine occitan

Albert Malfato

Il n’est pas jusqu’aux noms des Romains qui ne nous révèlent leur esprit, leurs coutumes, leurs institutions. Ce sont des noms de paysans […] et vous voyez défiler toute la métairie dans Porcius, Asinus, Vitellius, Ovidius. (Marouzeau, 1937 : 156)

0. Introduction

1 La faculté à catégoriser est l’une des capacités cognitives propres à l’espèce humaine ; on perçoit le monde qui nous entoure, discrimine les caractéristiques jugées pertinentes, établit par ce procédé des catégories au sein du réel, puis les conceptualise et les verbalise1. On peut définir la catégorisation de la manière suivante : To categorise is to treat a set of things as somehow equivalent: to put them in the same pile, or call them by the same name, or respond to them in the same way. Neisser (1987: 1)

2 La pensée établit des concepts à partir des éléments du réel qu’elle regroupe comme équivalents et les nomme à l’aide de signes linguistiques résultant de la modification d’éléments linguistiques appartenant, en amont, au système2. Les éléments d’une même catégorie peuvent donc être nommés par une même unité lexicale.

3 Ce n’est pas ici le lieu d’entrer dans les détails de la conceptualisation en sciences cognitives, ni dans le débat entre sémantique structurale et sémantique du prototype3 ; nous avons pour notre propos besoin de rappeler que la discrimination et la

Corpus, 12 | 2013 89

catégorisation dépendent de l’importance, de la pertinence, de l’usage associés aux éléments du réel par un groupe, par une communauté4.

4 En effet l’Homme ne distingue, et donc ne nomme, que ce qui est utile d’être distingué pour lui dans la diversité de sa vie quotidienne, et par un syllogisme trivial une catégorie qui ne serait pas établie et pas nommée, mais qui pourrait pourtant exister en puissance, ne le serait pas du fait de sa non pertinence à telle époque et au sein de telle communauté. Le jugement de ce caractère utile ou non utile n’est pas ancré dans la langue mais dans un tout, bien plus vaste, dont la langue fait partie et dont elle est le reflet5. La familiarité, l’utilité, la pertinence ou l’utilisation qui est faite des éléments du réel au sein de la communauté sont les moteurs de la discrimination et de la catégorisation.

5 Si on considère que la cognition humaine est universelle, de même que la capacité perceptuelle de chaque être humain, il ne serait alors pas impossible pour un locuteur francophone ou pour un locuteur coréen de distinguer le moineau mâle du moineau femelle, la souris qui n’a encore jamais porté de celle qui est déjà plusieurs fois bisaïeule, la pieuvre ayant perdu un tentacule par rapport à celle possédant les huit, et il ne leur serait pas non plus impossible, dans un autre registre, de distinguer acoustiquement le [ʁ] du [χ] ou le [p] du [b]. Mais si les catégories ne sont pas identiques en fonction des communautés – pensons notamment au relativisme linguistique (Humboldt (2000 [1821]), Sapir (1968 [1911]) ou encore Whorf (1971 [1940])) – c’est que leur pertinence n’est pas identique entre ces communautés. La langue n’empêche pas de percevoir, ni de discriminer, ni de catégoriser ; tout au plus le langage « accompagne, et probablement contraint du point de vue développemental, la catégorisation »6. Si un locuteur francophone ne distingue pas le [ʁ] du [χ] c’est qu’il n’en a pas l’utilité fonctionnelle au sein de sa langue, la réflexion est identique concernant le [p] du [b] pour un locuteur coréen7 ; et si nous ne distinguons et ne catégorisons pas les animaux précédemment cités par rapport à leurs congénères c’est parce que les particularités qui les caractérisent nous semblent, aujourd’hui et dans notre communauté, totalement inutiles. Nul doute, pour prendre des exemples extrêmes, que les locuteurs du bassa ne sont pas handicapés par leur catégorisation des couleurs8, ou que les francophones ne sont quant à eux pas handicapés par leur catégorisation des chameaux9.

6 En travaillant sur des corpus lexicaux dialectaux, en participant à des enquêtes de terrain, nous avons remarqué que les catégorisations établies par les communautés de locuteurs sont souvent plus complexes que le niveau de détail sollicité par le questionnaire lexical. Il nous semble que les études ciblées sur le lexique – en ce qui nous concerne plus particulièrement : sa structuration et la motivation sémantique des unités qui le composent – gagneraient à être couplées à une description objective des découpages conceptuels effectifs au sein de la communauté. C’est pourquoi nous avons choisi de présenter ce travail qui, en décrivant les différentes catégories d’animaux domestiques perceptibles en domaine occitan, est envisagé comme un point de départ à l’analyse de l’ensemble du lexique de ce champ conceptuel10. Nous présentons à la fin de ce travail une application simple, relative au cas d’un animal domestique en particulier.

Corpus, 12 | 2013 90

1. Réflexions méthodologiques

1.1 Notion de domestication et choix des référents

7 Définir la domesticité dans son ensemble nécessiterait un espace que nous ne pouvons nous permettre de prendre ici sachant que d’autres ont déjà réalisé cette entreprise11. Aussi nous avons pris pour base un travail de Mounin (1965) consacré aux dénominations des animaux domestiques, sous-entendu des animaux domestiques catégorisés comme tels dans le lexique français. Cette liste nous fournit le terme français considéré comme générique12, elle servira de point de départ à notre étude : âne, cheval, mulet, bœuf, chèvre, mouton, porc / cochon, chien, chat, lapin, canard, dindon, oie, pigeon, pintade, poule. Voici les seize champs notionnels que nous avons étudiés sur l’ensemble du domaine occitan. Penchons nous maintenant sur les spécificités de notre corpus.

1.2 Description du corpus

8 Le corpus utilisé pour cette étude est issu de la base dialectale occitane Thesaurus Occitan13 (THESOC) qui regroupe l’ensemble des données dialectales occitanes publiées dans les Atlas linguistiques et ethnographiques de la France par régions (NALF), ainsi que les données supplémentaires recueillies par l’équipe de dialectologie du laboratoire Bases, Corpus, Langage de l’Université Nice Sophia Antipolis. Le nombre de localités présentes dans la base, et donc dans notre corpus, s’élève à 845. Le thème de l’élevage, qui regroupe en son sein celui des animaux domestiques que nous étudierons ici, offre au chercheur plus de 178 516 données lexicales occitanes issues de l’oralité. Pour cette étude nous avons uniquement conservé les dénominations des animaux domestiques, soit un total dépassant les 104 000 données. Outre les formes dialectales présentes sur les cartes et les listes de chaque atlas, nous avons également étudié les commentaires émis, lors de l’enquête, par les informateurs. Nous verrons en 1.3.4 en quoi ces précisions sont d’une pertinence extrême pour une étude comme celle que nous entreprenons ici ayant trait au découpage du réel et à la catégorisation du monde animal. L’importance de ces informations est directement liée à la méthode de collecte des données pratiquée au sein des atlas (Oliviéri 2012).

1.3 Questionnaires d’enquêtes et atlas linguistiques

9 Les données que nous étudions, ont été recueillies dans le NALF grâce à une méthode d’enquête reposant sur un questionnaire lexical. Ce type de procédure, au demeurant très prolifique, dresse cependant certains écueils méthodologiques qu’il convient de ne pas négliger. Nous en distinguons trois principaux qui concernent l’étude que nous menons ici, mais qui pourraient avoir des répercussions sur l’ensemble des études dialectologiques en rapport avec le lexique.

1.3.1 L’absence de certaines catégories notionnelles

10 Lorsque l’on regarde la totalité des cartes onomasiologiques contenues dans les atlas en domaine occitan, on se rend compte que de nombreuses notions ne se retrouvent pas sur l’ensemble du domaine. Seuls certains concepts très génériques ou largement

Corpus, 12 | 2013 91

répandus sont répertoriés sur des cartes, marges, ou listes, pour l’ensemble du domaine occitan, leur nombre à été évalué à environ quatre-cents14 (Brund-Trigaud & Malfatto sous presse). Cette situation disparate est due au fait que les questionnaires d’enquête ne sont pas identiques d’un atlas à l’autre : le questionnaire commun envisagé par Dauzat n’ayant été utilisé que pour les deux premiers volumes de l’ALG, chaque direction d’atlas a en réalité travaillé avec son propre questionnaire, contribuant à cette hétérogénéité15. S’ajoute à cela le fait que certaines cartes jugées trop homogènes car ne présentant pas de variation lexicale n’aient pas été publiées, les données ne sont alors accessibles que par le recours aux carnets d’enquêtes.

11 L’absence d’une carte au sein d’un atlas est à distinguer de l’absence de donnée au sein d’une carte. Les conclusions que l’on peut tirer de ces deux cas ne sont pas identiques : il ne nous est pas possible de nous prononcer sur la présence ou l’absence d’une notion au sein d’un système lorsqu’elle n’a pas été sollicitée, tandis que lorsqu’au sein d’une carte onomasiologique une localité ne fournit pas de réponse, on peut supposer que le locuteur n’a pas su ou n’a pas pu traduire le concept dans son dialecte. Toutefois nous ne pouvons trancher entre remettre en doute l’existence d’une telle notion dans le système étudié – le locuteur ne peut pas répondre – ou la compétence du locuteur concernant un sujet précis qui ne lui est pas familier – le locuteur ne sait pas répondre.

12 De ce fait il n’est pas rare que certaines notions soient totalement absentes d’un ou plusieurs atlas. Les raisons de telles absences peuvent être de deux sortes : parfois, comme nous venons de le voir, la notion n’a pas été sollicitée car elle ne faisait pas partie du questionnaire d’enquête16, dans ce cas on ne peut pas juger de leur inexistence dans le système étudié ; parfois il arrive que la carte, jugée peu intéressante car trop peu variée par exemple, n’ait simplement pas été publiée17.

13 Ce premier obstacle rend souvent impossible une comparaison stricte et régulière de chaque point d’enquête avec l’ensemble des autres localités présentes dans notre corpus.

1.3.2 L’utilisation de périphrases et de questions diverses

14 Outre le fait que certaines catégories notionnelles ne sont pas représentées dans tous les atlas, un second écueil, aux conséquences peut-être moins prononcées que les deux autres, émane lui aussi de la non homogénéité des questionnaires. Pour une même notion il existe régulièrement des questions, des périphrases ou des approches différentes en fonction des atlas. Cette difficulté peut être évitée à moindres frais en se basant sur un index onomasiologique tel Billy (1993) qui, conscient de ce phénomène, a dû établir des regroupements, voire même des suppressions, de distinctions pour l’établissement de son index : Un certain nombre d’entrées sont très longues, des auteurs d’Atlas ayant usé de périphrases toujours difficiles à entrer dans un index. D’autre part, des regroupements de concepts ont dû être effectués, d’autres écartés : les auteurs des Atlas n’ayant pas toujours posé la même question pour désigner le même objet ou le même fait, il a fallu, en courant le risque de l’arbitraire, balayer certaines nuances mais en conserver quelques autres. Similitude n’est pas identité, et il est ici quatre sources d’erreurs possibles : le rédacteur du questionnaire, l’enquêteur, le locuteur, le rédacteur de l’index. L’utilisateur de l’index se doit donc de l’utiliser avec la prudence que requiert tout index et ne pas omettre qu’il ne saurait remplacer ni le recours ni la vérification des documents de base.

Corpus, 12 | 2013 92

15 Certains regroupements a priori aisés et sans conséquences sont cependant dommageables du fait qu’ils lissent certaines catégories pourtant pertinentes au sein de la communauté. Regrouper par exemple les notions de « jeune brebis qui porte pour la première fois » et de « jeune brebis qui n’a jamais porté » sous une même étiquette « jeune brebis » efface complètement des distinctions pourtant essentielles au sein de la communauté qui possède les deux catégories. « Similitude n’est pas identité », comme l’affirme Billy (1993), et il convient en effet de ne pas regrouper trop hâtivement des notions proches mais pourtant distinctes au sein des dialectes, de peur de lisser un découpage du réel différencié par des pratiques et des besoins différents des nôtres. Nul doute pour reprendre un exemple précédent, qu’un regroupement sous un même concept « chameau » de l’ensemble des différentes catégories de chameaux établies par les bédouins âl wahîba (Webster 1991) serait un lissage très dommageable des concepts afin de les faire entrer dans le moule conceptuel de celui qui les regroupe et pour qui la distinction n’est pas pertinente. Une conséquence supplémentaire de ces pratiques, serait l’opacification des motifs à l’origine de la création lexicale. En compactant des distinctions jugées non pertinentes sous une même catégorie plus globale, on s’interdit l’accès aux différences notionnelles qui expliqueraient les variétés lexicales et les représentations à l’origine de la création18.

1.3.3 L’empreinte de la langue du questionnaire

16 Le dernier point important à noter concerne directement la méthode d’enquête par questionnaire lexical utilisée pour l’établissement des atlas. Dans son déroulement, en sollicitant la traduction d’un terme français, l’enquête induit pour l’informateur un découpage du réel susceptible d’être différent du sien en lui proposant des catégorisations établies « à travers le prisme du français » (Oliviéri 2012 : 31). Cette méthode peut donc parfois être à l’origine de confusions ou d’imprécisions dommageables quant à la catégorisation à l’œuvre dans le système enquêté, ou simplement jeter le doute quant aux informations fournies par le locuteur. Il n’est pas rare en effet de voir un informateur, fatigué par la longueur de l’enquête, finir la séance en apportant de manière automatique une couleur patoisante à tous les termes avancés par l’enquêteur.

1.3.4 Pour pallier ces difficultés

17 Mais il n’est cependant pas impossible de contourner, ou tout au moins d’atténuer, les effets de ces différents écueils.

18 Les trous notionnels repérables entre les différents atlas peuvent être acceptables si on a conscience que l’absence de données recueillies ne signifie pas la non existence du concept dans le système et si l’on s’interdit cette inférence.

19 La vérification des sources permet de localiser et d’éliminer les compactages et les regroupements notionnels dommageables. Sur ce point et sur le suivant l’étude des commentaires et des précisions fournis par l’informateur au fil de l’enquête dialectale nous permet de révoquer des distinctions non pertinentes ou plus fréquemment d’établir des différenciations hautement utiles ne figurant pas dans le questionnaire de base19.

20 L’influence du découpage conceptuel du questionnaire sur celui des informateurs reste une des difficultés majeures face à laquelle nous sommes tributaires de la compétence

Corpus, 12 | 2013 93

et de la bonne volonté de l’informateur. Plusieurs méthodes existent déjà pour tenter de pallier ces difficultés comme l’enquête par discours libre, par enregistrement dissimulé ou encore par utilisation d’un imagier. L’objectif serait de rendre l’interaction entre enquêteur et informateur la plus naturelle et la moins influencée possible afin d’obtenir des données de même nature.

21 Nous venons de voir que chaque étape de l’élaboration ou de l’utilisation d’un atlas linguistique contient son lot de difficultés et d’erreurs potentielles, de l’établissement du questionnaire au traitement des données en passant par la fiabilité de l’informateur. Cependant le fait de prendre conscience, de délimiter et de définir ces obstacles, permet d’adapter nos analyses en conséquence. Les atlas font partie des trop rares moyens que nous possédions pour accéder à des systèmes linguistiques pour certains quasiment éteints20 et ils sont quasiment la seule voie possible pour aborder ces systèmes de tradition orale.

22 Conséquence de la diversité du réel et des écueils vus précédemment : il n’existe aucune localité qui présenterait l’ensemble des distinctions que nous allons donner ci- après, elles représentent une vision a maxima des découpages rencontrés en domaine occitan. Cette étude transcende la variation diatopique pour proposer une description globale du système conceptuel observable au sein du domaine occitan.

2. Description des catégories conceptuelles

2.1 Nom générique et regroupements

23 Les noms d’animaux domestiques présents dans la liste de Mounin (1965) y sont qualifiés de « noms spécifiques », il semble qu’ils renvoient à des catégories conceptuelles générales représentant des « individus quelconques » telles que les ânes, les chevaux, les chiens, les oies etc. Le nom sous lequel sont regroupés les différents individus d’une même espèce21 est régulièrement appelé « nom générique ». Les atlas ont très peu d’informations en ce qui concerne ces ensembles d’individus quelconques ; une raison qui peut être avancée concernerait la nature des dénominations de ces génériques. En effet les termes génériques sont régulièrement homonymes du nom d’un individu précis, souvent le mâle châtré ou la femelle22, et se confondent donc avec lui. Il faudrait, afin de posséder une dénomination dialectale orale des noms génériques pour chaque animal domestique, que le questionnaire d’enquête interroge chaque locuteur en utilisant une périphrase spécifique. Au sein de notre corpus seule la notion d’espèce chevaline a été récoltée.

24 Certaines questions posées durant l’enquête renvoient à des regroupements conceptuels de plusieurs espèces d’animaux, tel que bétail et volaille. Les données fournies par les commentaires d’informateurs montrent qu’au sein de l’ensemble des volailles sont distingués deux sous-groupes, les jeunes volailles et l’ensemble des poules. Le concept global de bétail inclut les deux sous-groupes jeune bétail et gros bétail23.

25 Afin de faire la distinction dans notre étude entre le terme générique relatif aux différents membres de l’espèce et le terme précis renvoyant à un individu spécifique nous utilisons le nom générique au pluriel, e.g. (les) poules, et le nom précis au singulier, e.g. le coq et la poule sont des poules. Dans les tableaux nous écrivons les noms génériques en italiques.

Corpus, 12 | 2013 94

2.2 Le système a minima

26 Les individus spécifiques qui composent ces regroupements d’individus quelconques sont, de manière générale, toujours distingués entre le mâle, la femelle et leur progéniture. Ces trois critères forment un système distinctif que nous nommerons système a minima. Un bémol toutefois en ce qui concerne les pintades, les pigeons, les lapins et les mulets : les pintades ne fournissent pas de dénomination pour leur progéniture, le terme pintadeau français n’a pas de correspondant conceptuel recensé dans notre corpus24 ; notons toutefois que le concept « pintade mâle » possède quant à lui une dénomination propre, contrairement au français qui en est dépourvu si on en croit le classement de Mounin ; les pigeons ne fournissent pas, eux non plus, de dénominations de leur progéniture dans notre corpus ; en ce qui concerne les lapins, nous ne rencontrons aucun terme qui désignerait le fr. lapereau en tant qu’individu. Toutefois « l’ensemble des lapereaux issus d’une même portée » est un concept possédant un nom spécifique ; le cas des mulets est quant à lui naturellement différent et s’explique « par la biologie elle-même »25 : animal hybride issu du croisement entre un âne et une jument, il est stérile et ne possède de ce fait pas de progéniture.

27 Les lapins, les oies, les canards et les dindes sont les seuls groupes d’animaux domestiques pour lesquels le système de catégorisation soit minimal. Ce système est représenté dans le tableau 1. Tableau 1. Système minimal

28 Chez les animaux restants cette tripartition minimale se voit agrémentée de diverses distinctions que nous allons présenter maintenant.

2.3 La castration

29 Les chats représentent un degré supplémentaire sur l’échelle des distinctions référentielles : en plus du système minimal mâle / femelle / progéniture, on note dans notre corpus la distinction entre le mâle et le mâle châtré, entre le matou et le chat français. Le caractère châtré d’un animal est donc suffisamment pertinent pour le faire accéder à une autre catégorie conceptuelle, et à une autre dénomination.

30 Notre corpus nous confirme que la pratique de la castration concernait le groupe des chats, mais aussi celui des bœufs, des chevaux, des moutons, des porcs et des poules. Si elle était pratiquée sur le groupe des ânes, des chiens et des chèvres elle n’a en tout cas pas créé de catégorie spécifique ni laissé de nom dans notre corpus. Seules les données ethnologiques pourraient nous confirmer si la castration est, ou était, pratiquée sur l’ensemble des animaux domestiques étudiés ici. Le tableau 2 représente entre autre la répartition des concepts relatifs à l’adulte châtré.

Corpus, 12 | 2013 95

2.4 La progéniture selon le genre

31 Nous venons de voir que les ânes et les chèvres ne fournissent pas de noms différenciés du mâle châtré. Ils font cependant partie des animaux pour lesquels le système dispose d’une distinction supplémentaire en fonction du genre de la progéniture. Les jeunes ânes et les jeunes chèvres sont en effet distingués entre mâles et femelles. Cette distinction de la progéniture selon le sexe se retrouve également chez les bœufs, les chevaux, les moutons, les porcs et les poules26, mais pas chez les chiens ni les chats, où le même terme vaut pour l’ensemble des petits quel que soit leur sexe.

32 Le cas des chèvres est particulier car, en plus de la distinction entre jeune mâle et jeune femelle, on rencontre régulièrement dans le corpus une catégorie désignant le chevreau hermaphrodite ; nul doute que cette caractéristique marquée fasse l’objet d’une catégorisation et de dénominations particulières27.

33 Le tableau 2 représente entre autres la répartition de ces distinctions avec une mention spéciale pour les chèvres. A ce stade de l’analyse on pourrait conclure que les chiens ne présentent que le système a minima, mais nous verrons en 2.6 et 2.7 pourquoi ce n’est pas le cas. Tableau 2. Mâle castré et genre de la progéniture

2.5 Les étapes du développement

34 Parmi les jeunes animaux que nous venons de voir, la vie des moutons, des bœufs et des porcs est découpée en fonction de différentes étapes de leur développement, des âges approximatifs qu’ils atteignent et de leur place vis-à-vis du processus de reproduction.

2.5.1 De la naissance au sevrage

35 A la naissance, certains porcs sont distingués de leurs congénères : s’ils sont en surnombre au sein de leur portée, ou s’ils sont nés au mois de mai, ils sont alors catégorisés et nommés d’une manière spécifique. Un processus similaire touche les moutons qui sont nés en retard par rapport aux autres. Ces spécificités justifient une catégorisation et donc une dénomination différente. Plus tard les jeunes mâles ou femelles, sont distingués selon qu’ils sont allaités ou au contraire sevrés ; la distinction

Corpus, 12 | 2013 96

peut se faire d’un côté ou de l’autre, soit l’animal sevré sera distingué de ceux qui ne le sont pas encore, soit l’animal qui tète encore sera distingué de ceux qui ne sont plus allaités.

36 Le tableau 3 représente les catégories relatives aux jeunes mâles et femelles confondus, il ne reprend pas les caractéristiques exclusivement réservées à un groupe d’animaux, comme le fait d’être en surnombre dans la portée pour les porcs. Tableau 3. Sevrage des jeunes

2.5.2 Ages distinctifs et processus de reproduction

37 A l’intérieur des catégories sexuées, les individus sont distingués en fonction de certains critères. Les jeunes mâles sont différenciés en fonction de leur castration ou de leur âge, tandis que les jeunes femelles sont classées en fonction de leur âge ou de leur place par rapport au processus de reproduction.

38 L’âge de l’animal est un critère discriminant à la fois pour les porcs, les bœufs et les moutons. Les différenciations liées à l’âge repérables sur un corpus de 845 localités sont trop peu similaires pour former des catégories bien délimitées ; toutefois certaines catégorisations liées à l’âge sont davantage représentées dans le corpus. Ainsi la notion de « veau d’un an » est largement répandue à travers le domaine28 ; de même celle d’« agneau dans sa deuxième année », équivalent à l’antenais français 29, et celle de « jeune porc entre deux et cinq mois »30. Parmi les jeunes mâles, alors que les bœufs et les moutons châtrés sont distingués de ceux qui ne le sont pas ou pas encore (cf. ci- dessus), pour les jeunes porcs ce sont souvent le poids et le niveau d’engraissement qui prévalent. Nous trouvons des catégorisations et des dénominations relatives au jeune porc de cinquante kilos, à celui qui n’est pas encore tout à fait gras et à celui qui est prêt à être tué.

39 Les femelles sont elles aussi différenciées selon leur âge. Certaines distinctions sont assez répandues, notamment en ce qui concerne les brebis et les génisses ; les truies ne sont cependant pas distinguées en termes comptables en fonction de leur âge. Les brebis sont catégorisées selon qu’elles ont un an, deux ans, trois ans ou quatre ans. Les distinctions comptables relatives à l’âge des génisses sont trop nombreuses pour espérer en tirer une quelconque typologie31. Cependant trois catégories sortent du lot : celles de l’animal d’un an, de deux ans, ou de trois ans.

40 Les regroupements « jeune truie », « jeune génisse » et « jeune brebis » sont des concepts généraux qui ne concordent pas avec la réalité observable au sein des dialectes occitans. Au contraire, les truies sont différenciées et forment des catégories distinctes lorsqu’elles n’ont encore jamais porté ou bien lorsqu’elles portent pour la première fois ; les brebis sont distinguées selon qu’elles n’ont encore jamais porté, qu’elles vont mettre bas, qu’elles viennent de mettre bas, ou qu’elles sont restées sans allaiter ; les génisses présentent un niveau de discrétisation et de catégorisation largement supérieur, elles sont distinguées selon qu’elles sont en âge de porter, qu’elles n’ont jamais porté, qu’elles viennent d’être saillies, qu’elles ont été saillies prématurément, qu’elles portent jeune, qu’elles portent pour la première fois, qu’elles

Corpus, 12 | 2013 97

sont en retard pour porter, qu’elles n’ont pas porté dans l’année, qu’elles vont mettre bas ou enfin qu’elles viennent de mettre bas.

41 Le tableau 4 présente les distinctions effectives quant aux rapports que les femelles entretiennent avec le processus de reproduction. Nous ne précisons pas les cas exclusivement relatifs à un groupe. Tableau 4. Femelle et reproduction

2.6 Les fonctions

42 Certains animaux domestiques remplissent des fonctions précises pour l’homme et sont alors catégorisés d’une manière différente de leurs semblables.

43 Les chiens sont les meilleurs représentants de ce type de catégorisation : ils sont distingués selon les fonctions spécifiques qui leurs sont attribuées32. Le corpus nous fournit les catégories de chien de berger, chien truffier et chien ratier. Parmi les jeunes porcs est distingué celui que l’on engraisse dans l’optique de le tuer l’hiver pour la consommation familiale. Certaines génisses ont la fonction particulière de laitière et sont ainsi catégorisées différemment des autres. Les chevaux spécialisés dans le dépiquage des céréales ont eux aussi des dénominations particulières.

2.7 Les caractéristiques physiques et comportementales

44 Certains animaux domestiques ont une caractéristique physique marquée qui influence leur distinction d’avec leurs congénères ; si cette caractéristique est le moteur de la différenciation, c’est qu’elle n’est pas anodine aux yeux de ceux qui l’établissent.

45 La taille d’une bête semble avoir une grande importance, notamment si l’animal possède une croissance inférieure à la normale ou présente un signe de mauvaise alimentation. Ainsi on retrouve le concept général d’animal chétif, ceux de vache maigre, d’agneau chétif, de brebis qui reste petite, de poussin le plus chétif de la couvée et de cochon le plus petit de la portée. A l’inverse, un animal présentant une taille supérieure à la normale peut lui aussi faire l’objet d’une dénomination spécifique : nous rencontrons les concepts de gros chien et de gros coq.

46 Outre la taille de l’animal certaines caractéristiques sont à l’origine de catégorisations spécifiques : elles ont la particularité d’être déviantes par rapport à la normalité, au prototype33. Ainsi au sein d’un groupe de bêtes à cornes un individu écorné sera fortement marqué, il en sera de même pour ceux dont les cornes ont une forme, une orientation ou une taille notable. Les bovins sont les animaux domestiques pour lesquels on rencontre le plus de variations dues à des caractéristiques physiques concernant notamment leur robe, on distingue les robes pies, les robes rayées, les robes tachetées et les robes de cap more (la tête possède des taches noires). Les vaches dites « manchotes », dont un trayon ne donne pas de lait, sont elles aussi caractérisées

Corpus, 12 | 2013 98

spécifiquement. Les chevaux ayant les sabots orientés vers l’extérieur sont eux aussi distingués de leurs semblables.

47 Certains animaux ont une maladie ou une dégénérescence liée à l’âge qui les rend distinguables au sein du troupeau. On trouve ainsi le porc ladre distinct de ses congénères, le vieux cheval, la vache tarie, mais aussi les vieilles brebis, vieilles chèvres, vieilles truies et vieilles vaches, qui une fois stériles ne peuvent plus porter. Certaines de ces caractéristiques en entraînent d’autres : on trouve ainsi des dénominations spécifiques pour la vieille brebis stérile alors destinée à la boucherie.

48 Outre les caractéristiques physiques, certains animaux ont un comportement marqué par rapport à l’ensemble de leurs congénères ; ce comportement inhabituel ou remarquable est la source d’une nouvelle classification et donc d’une dénomination particulière. Ainsi la poule qui veut couver, le chef du troupeau, le cheval rétif, le bœuf habitué à sa place, la vache nymphomane ou encore celle qui ne veut pas manger, ont tous un comportement particulier qui fait qu’ils seront distingués des autres individus de leur groupe.

3. Réflexions à mi-parcours

49 Nous percevons désormais, en considérant le domaine occitan dans sa totalité, quels aspects de la réalité la langue représente. Nous avons vu par exemple que la communauté n’entretient pas les mêmes rapports avec tous les animaux domestiques : certains semblent recueillir d’avantage d’attention que d’autres, c’est le cas par exemple des bœufs par rapport aux oies ou des moutons par rapport aux chats. Nous avons également aperçu que certains individus semblent nécessiter plus d’attention ou de soin que leurs congénères en fonction de leur âge ou de leur état, comme c’est le cas par exemple pour les jeunes femelles qui portent pour la première fois. Certaines étapes comme la gestation et la parturition semblant cruciales pour ces communautés, elles se caractérisent par des catégorisations spécifiques que l’on retrouve dans la langue. Nous avons également remarqué que des individus d’une même espèce peuvent être catégorisés selon leurs fonctions, leurs caractéristiques physiques ou leurs comportements. Certaines de ces particularités hautement importantes pour le groupe ethnolinguistique ont également été mises en avant par Gaide (1997) au sujet du latin, les Romains représentant bien une communauté de locuteurs agro-pastorale, un « peuple d’éleveurs » (Marouzeau 1937).

50 Nous avancions en ouverture de cet article que l’être humain ne discrimine, ne catégorise et donc ne nomme que ce qui est utile d’être distingué pour lui et la communauté dans laquelle il se situe. La catégorisation des animaux domestiques et le lexique utilisé pour nommer ces catégories, sont influencés par la réalité entourant toute communauté ethnolinguistique, que cette réalité soit biologique, zoologique ou zootechnique. Les communautés à forte tradition agro-pastorale telles que celles étudiées ici entretiennent une relation d’une telle importance et d’une telle complexité avec leur bétail qu’il convient de ne pas négliger ces aspects extralinguistiques lorsqu’on a pour objectif d’étudier l’organisation lexicale de leur langue. Nous sommes convaincu en effet que l’étude du lexique ne peut se passer d’une description et d’une étude détaillée des rapports que la communauté entretient avec les divers éléments du réel, et qu’en ce qui concerne notre centre d’intérêt, elle doit donc être couplée à une étude ethnozootechnique.

Corpus, 12 | 2013 99

4. Etude de cas, les ânes

51 Une étude des dénominations de l’âne en tant qu’animal générique, en tant que représentant d’une espèce animale, nous invite donc à nous pencher sur l’ensemble des catégories perceptuelles effectives sur le domaine.

52 Les ânes sont, d’après notre relevé catégoriel visible dans le tableau 2, distingués en quatre catégories : mâle adulte, femelle adulte, jeune mâle et jeune femelle. Il ne s’agit pas là, comme nous l’avons déjà mentionné, des distinctions conceptuelles perceptibles pour chacun des 845 points d’enquêtes du domaine, mais des distinctions recensées a maxima à travers l’ensemble de notre corpus.

53 Dans le détail on observe qu’hormis l’ALCe34 qui ne possède aucune carte renvoyant à un de ces référents, chaque atlas possédant des localités en domaine occitan dispose au minimum de deux cartes renvoyant aux concepts d’« âne mâle adulte » et d’« âne femelle adulte ». Dans notre corpus nous recensons 775 données relatives au mâle adulte et 763 relatives à la femelle adulte. En ce qui concerne leur progéniture la situation est moins régulière car seuls deux atlas – l’ALP et l’ALMC – possèdent la double distinction « jeune âne mâle » et « jeune âne femelle ». Ce dernier concept est moins bien représenté que celui de « jeune âne mâle » qui est, lui, présent dans chaque atlas hormis l’ALCe, l’ALLOc et l’ALLy. Sur la totalité du domaine, nous dénombrons 468 réponses correspondant au « jeune âne mâle » et 67 à la « jeune âne femelle ». Le tableau 5 récapitule la répartition des concepts à l’échelle des atlas et le nombre de données disponibles, nous en avons volontairement exclu l’ALCe qui ne dispose d’aucune réponse correspondante. Tableau 5. Répartition conceptuelle des ânes

3.1 Onomasiologies du mâle et de la femelle

54 Une étude onomasiologique des concepts d’« âne adulte mâle » et d’« âne adulte femelle » montre une forte variation des types lexicaux à travers le domaine : on rencontre sur l’ensemble du corpus treize noms du mâle et dix-sept de la femelle. Nous allons voir que la répartition de ces différents lemmes35 n’est cependant pas équivalente.

Corpus, 12 | 2013 100

55 Les treize dénominations du mâle adulte sont : âne, ase, asirolet, borro, borrin, borric, borricòt, borriquet, saumèl, saumièra, bardin, baudet et arriuc.

56 Il ressort que sur les 775 dénominations de l’âne mâle adulte, 700 sont liées étymologiquement au latin ASINUS « âne » (DELL, sous asinus). Soit elles en sont les continuateurs directs, comme c’est le cas d’âne et d’ase, soit elles en sont dérivées, comme asirolet dont la formation fait penser à un diminutif démotivé ou à un hypocoristique36. Parmi les 75 formes restantes nous remarquons celles qui, comme borro, borricòt, borric, borrin ou encore borriquet, sont liées étymologiquement au latin BURRUS « rouge vif » (FEW 1, 646b) ; d’autres, telles saumèl et saumièra, sont dérivées du latin SAGMA « bât » (FEW 11, 61a) ; d’autres enfin sont rattachées à la racine germanique *BALD « osé ; hardi » comme c’est le cas du terme baudet (FEW 15.1, 31b). Le sémantisme associé à *BALD peut laisser perplexe pour une dénomination de l’âne. Le terme fr. baudet « âne » serait issu de fr. baud « variété de chien courant propre à la chasse des bêtes fauves et du cerf » avec le sens d’« impudique » (TLF, sous baud et baudet) dérivé à l’aide du suffixe -et. Nous sommes davantage enclins à le rapprocher du terme bauda « câblière » à l’origine de nombreux termes relatifs aux charges attribuées aux animaux de bâts, tels baudorn « tortoir » et baudornièra « corde qui lie la charge d’une bête de somme ». Cette forme bauda possède d’après Alibert (1993 [1966]) une étymologie arabe DABBA « bête, bête de somme ». Le rapprochement entre une désignation occitane de l’âne et une étymologie afro-asiatique nous rappelle que cet animal n’est pas autochtone, a initialement été domestiqué en Afrique et en orient, et est relativement récent en Europe de l’ouest (Zeuner 1963 : 374-387). Un hapax de notre corpus, bardin, dispose d’ailleurs également d’une étymologie arabe, BARDA’A « housse, bât » (FEW 19, 23a). Le lemme arriuc, classé parmi les étymologies obscures dans le FEW (22.1, 271a), peut, quant à lui, être rapproché de arri « interjection pour exciter les bestiaux à marcher » (Alibert 1993 [1966]). Cette forme, dont l’origine expressive est généralement avancée37, possède des correspondants dans d’autres langues romanes et sémitiques comme l’atteste Corominas (1991 [1980], sous arre) : « voz de creación expresiva, que también se halla, con ligeras variantes, no sólo en las demás lenguas peninsulares, sino además en lengua de Oc, italiana y árabe africano »38.

57 Les dix-sept dénominations de la femelle adulte sont les suivantes : sauma, saumarda, saumeta, saumièra , âne, ânesse, ânette, borra, borrica , bourrique, mitra, montura, mula, baude, charra, arriuca et bardina.

58 Sur les 763 formes de notre corpus 594 ont un lien étymologique avec le latin SAGMA, ce sont les types sauma, saumarda, saumeta et saumièra. Les formes borra et borrica sont liées étymologiquement au latin BURRUS ; les formes âne, ânesse et ânette sont quant à elles dérivées du latin ASINUS ; la racine germanique *BALD expliquerait le type baude – que l’on pourrait peut-être rapprocher de bauda ; les formes de type mula renvoient au latin MULUS « bardot » (FEW 6.3, 211a) ; le type montura s’explique par une dérivation sur le verbe monta « monter » (Alibert 1993, sous mont) issu du latin *MONTARE « monter » (DELL, sous mons, montis) ; les formes relatives au type arriuca seraient soit d’origine onomatopéique soit apparentées au latin ARRIGE [AURES] (cf. note 37) ; enfin celles de type mitra (FEW 22.1, 271a) et charra sont d’origine inconnue.

59 Les racines SAGMA, ASINUS, BURRUS et *BALD seraient donc à l’origine à la fois des noms du mâle et de la femelle, mais pourtant nous allons voir que les couples de dénominations

Corpus, 12 | 2013 101

liées étymologiquement qui pourraient exister en puissance au sein du domaine sont en réalité très rares.

3.2 Le couple mâle / femelle

60 Nous distinguons en premier lieu deux types de localités, celles où l’on rencontre plusieurs dénominations pour le même concept – il s’agit là d’une situation apparemment synonymique que l’on ne peut pas résoudre faute d’informations suffisantes – et celles où chacun des deux concepts est désigné par un seul signe linguistique. Les premières, systèmes complexes et minoritaires, sont au nombre de 44, tandis que les secondes, plus simples, sont au nombre de 665. Nous avons choisi de ne pas nous appesantir sur les systèmes complexifiés par une synonymie apparemment parfaite afin de nous concentrer ici sur des données plus sûres qui ne seraient pas liées à une interprétation préalable. En effet au vu de l’ensemble du domaine et pour la totalité des animaux domestiques, nous pensons que les situations synonymiques parfaites sont très rares, voire inexistantes, et que la plupart du temps les prendre comme telles aboutit à lisser des différences pourtant pertinentes. Comme nous l’avons montré précédemment, elles peuvent être le fruit de regroupements ou de compactages conceptuels liés à la méthode de recueil ou de traitement des données.

61 Lorsqu’on s’attèle à la description de couples conceptuels comme celui de l’âne et de l’ ânesse, on peut s’attendre à ce que le schéma typique, tel que représenté par les termes français et dans lequel le nom de la femelle et celui du mâle entretiennent un lien de forme, soit préservé. Ce type de système dont les éléments sont liés étymologiquement, morphologiquement, est appelé « champ dérivationnel » par Mounin (1965 : 33). « Un tel champ pourrait (non sans débats terminologiques) être nommé morpho- lexical, ou étymologique : il rassemble bien les unités lexicales apparentées à la fois par leur forme et par leur sens, par leurs signifiants et leurs signifiés. Mais il serait mieux dit dérivationnel. »

62 Contrairement au français, la présence de systèmes dérivationnels concernant les ânes est plutôt rare en domaine occitan. La répartition des données nous montre au contraire une large prédominance des couples de termes sans rapport étymologique (623) par rapport aux couples dont les éléments appartiennent à la même famille étymologique (42). Comme le montre le tableau 6, une majorité de systèmes non dérivationnels présente des dénominations issues d’ASINUS pour le mâle et de SAGMA pour la femelle (537). On rencontre également des couples dérivés d’ASINUS pour le mâle et de BURRUS pour la femelle (43) ; d’autres joignant pour le mâle et la femelle respectivement : ASINUS à MITRA (28) ; ASINUS à *BALD (6) ; ASINUS à MULA (5) ; ASINUS à charra (3) et enfin BURRUS à SAGMA (1). Tableau 6. Systèmes mâle / femelle non dérivationnels

« mâle adulte » « femelle adulte » Nombre d’occurrences

ASINUS SAGMA 537

ASINUS BURRUS 43

ASINUS mitra 28

Corpus, 12 | 2013 102

ASINUS *BALD 6

ASINUS MULA 5

ASINUS charra 3

BURRUS SAGMA 1

63 Les systèmes qui présentent un lien étymologique entre le mâle et la femelle sont quant à eux apparentés à BURRUS (17), ASINUS (15), SAGMA (8), et aux formes obscures arriuc/arriuca (2).

64 Les noms du mâle et de la femelle n’entretiennent pas nécessairement de lien étymologique ; au contraire cet état de fait est même relativement rare au sein de notre corpus. Qu’en est-il des systèmes qui fournissent des données concernant les jeunes mâles et femelles ?

3.3 Le système maximal, adultes et jeunes, mâles et femelles.

65 Nous avons vu dans le tableau 5 que seuls l’ALP et l’ALMC disposent de données concernant les jeunes ânes de sexe différent ; on dénombre alors 58 localités fournissant une réponse pour les quatre référents. Sur ces 58 points d’enquêtes à discrétisation maximale la paire mâle / femelle n’est quasiment jamais représentée par un système dérivationnel de dénominations. On distingue 57 localités où les formes ase « âne » et sauma « ânesse » sont présentes, et 1 localité (ALP 126) où les dénominations des deux concepts sont issues d’ASINUS.

66 Afin d’établir des systèmes lemmatisés parfaitement analysables nous n’avons pas tenu compte des cas de synonymie parfaite (suspects à nos yeux) pour lesquels le jeune mâle ou la jeune femelle possèderaient deux noms distincts. Le nombre des systèmes écartés est très faible (3) : il s’agit généralement de localités qui subissent l’influence d’une langue extérieure, le français en particulier, et qui possèdent de ce fait deux dénominations pour le même référent. Lorsque l’informateur ne précise pas lequel des deux termes est autochtone nous avons choisi de les écarter.

3.3.1 Systèmes maximaux dérivationnels

67 Concernant les jeunes animaux, on remarque que leurs dénominations sont majoritairement liées à celles des adultes : 47 localités sur 58 présentent un système de ce type où les noms des jeunes ânes mâles et femelles sont dérivés à partir des dénominations des adultes. Dans ces cas majoritaires les dénominations sont toujours des diminutifs, soit synthétiques39 – de formation dérivée –, soit analytiques – de formation adjectivale. Les premiers, formés par dérivation suffixale, utilisent un ensemble de suffixes occitans à valeur diminutive, tels -on(a) -ilh(a) -et(a), associés aux bases ase et sauma. Nous relevons les formes masculines ason, asenon, asot, aset, asenet, saumin, saumon ; et les formes féminines saumeta, saumon, saumin, saumelota, saumillon. Les dénominations basées sur des dérivés analytiques sont quant à elles formées à l’aide des termes pichon(a), pichin(a), pichòt(a) « petit(e) ». Pour le mâle nous relevons les

Corpus, 12 | 2013 103

formes pichòt ase, pichon ase, pichin ase, pichon saumin ; pour la femelle pichota sauma, pichona sauma, pichina sauma.

68 Ces différents lemmes s’articulent de diverses manières par rapport aux noms des adultes. Nous donnons dans le tableau 7 une liste des 20 systèmes différents que l’on rencontre à travers l’étude des dénominations recueillies à ces 47 localités.

69 Certains de ces systèmes ont des diminutifs analytiques à la fois pour le mâle et la femelle (α), on remarque cependant que l’adjectif utilisé n’est pas toujours identique pour les deux sexes mais peut varier entre pichòt et pichona (α3). Une proportion plus large de systèmes présente concomitamment les deux types de diminutifs – synthétiques et analytiques – utilisés pour nommer le jeune mâle et la jeune femelle (β). Dans le reste des cas (γ et δ) les deux dénominations sont des diminutifs synthétiques généralement dérivés à l’aide d’affixes différents (δ), elles ne sont que rarement formées par l’adjonction d’un même suffixe fléchi selon le genre (γ)40. Tableau 7. Systèmes maximaux dérivationnels

mâle femelle jeune jeune

adulte adulte mâle femelle

α1 ase sauma pichòt ase pichota sauma

α2 ase sauma pichon ase pichona sauma

α3 ase sauma pichòt ase pichona sauma

β ase sauma pichòt ase saumeta

β ase sauma pichon ase saumeta

β ase sauma pichon saumin saumeta

β ase sauma asenon pichina sauma

β ase sauma saumin pichina sauma

β ase sauma polin d’ase saumin

γ1 ase sauma saumin saumin

γ2 ase sauma saumon saumon

γ3 ase sauma aset saumeta

δ ase sauma saumin saumeta

δ ase sauma saumelon saumelota

δ ase sauma asenet saumeta

δ ase sauma asot saumeta

Corpus, 12 | 2013 104

δ ase sauma ason saumeta

δ ase sauma ason saumelota

δ ase sauma asenon saumeta

δ ase sauma asenon saumilhon

70 On peut tenter de regrouper l’ensemble de ces systèmes en deux classes, selon que les dénominations du jeune mâle sont liées à celles du mâle adulte ou selon qu’elles sont, par opposition, liées aux noms de la femelle. Sur les 20 types de systèmes repérables sur le domaine, 6 présentent des noms du jeune mâle dérivés ou composés sur sauma, la part restante étant quant à elle laissée aux dérivés d’ase.

3.3.2 Systèmes maximaux non dérivationnels

71 Sur 58 localités rendant compte de la distinction maximale effective pour les ânes, 8 présentent un système au sein duquel adultes et jeunes n’entretiennent pas nécessairement un lien morphologique entre eux (tableau 8). Tableau . Systèmes maximaux non dérivationnels

mâle femelle jeune jeune

adulte adulte mâle femelle

α ase sauma borriscòl saumeta

β ase sauma ânon saumeta

γ ase ânesse ânon pichota ânesse

δ ase sauma poltre poltressa

ε ase sauma poltre poltre

72 On remarque que le jeune mâle n’y entretient jamais de rapport morphologique avec les dénominations de l’adulte, tandis que la jeune femelle peut quant à elle, entretenir un lien dérivationnel avec le nom de la femelle adulte (α et β). Les termes qui ne sont pas morphologiquement liés à ceux de l’adulte sont soit empruntés au français, comme ânon, soit relatifs à une base effective dans d’autres systèmes du domaine, comme BURRUS, soit enfin sans lien avec aucune dénomination de l’adulte recensée dans l’ensemble du corpus, comme c’est le cas de poltre et poltressa formes dérivées du latin PULLITER « poulain » (FEW 9, 530).

73 Outre une grande variation lexicale au sein du domaine, la description des dénominations des ânes que nous venons de présenter montre également une grande hétérogénéité des systèmes lexicaux. Le couple mâle / femelle n’est quasiment jamais un système dérivationnel tandis que les dénominations des jeunes sont régulièrement morphologiquement liées à celles des adultes. Nous voyons également que si les ânes

Corpus, 12 | 2013 105

semblent former un groupe catégoriel bien délimité, une espèce animale, il sera nécessaire de les rapprocher de dénomination d’autres animaux domestiques comme les chevaux ou les mulets, jugés relativement proches, bien que d’espèces distinctes, si l’on veut parfaire une étude concernant les dénominations dialectales occitanes des ânes.

BIBLIOGRAPHY

ALAL = Potte J.-C. (1975-1992). Atlas linguistique et ethnographique de l’Auvergne et du Limousin. Paris : Editions du CNRS (3 vol.).

ALCe = Dubuisson P. (1976-1982). Atlas linguistique et ethnographique du Centre. Paris : Editions du CNRS (3 vol.).

ALG = Séguy J. (1954-1974). Atlas linguistique et ethnographique de la Gascogne. Paris : Editions du CNRS (6 vol.).

Alibert L. (1993 [1966]). Dictionnaire occitan-français d’après les parlers languedociens. Toulouse : Institut d’études occitanes.

ALLOc = Ravier X. (1978-1993). Atlas linguistique et ethnographique du Languedoc occidental. Paris : Editions du CNRS (4 vol.).

ALLOr = Boisgontier J. (1981-1986). Atlas linguistique et ethnographique du Languedoc oriental. Paris : Editions du CNRS (3 vol.).

ALLy = Gardette P. (1967-1976). Atlas linguistique et ethnographique du Lyonnais. Paris : Editions du CNRS (5 vol.).

ALMC = Nauton P. (1955-1961). Atlas linguistique et ethnographique du Massif central. Paris : Editions du CNRS (4 vol.).

ALO = Massignon G., & Horiot B. (1971-1983). Atlas linguistique et ethnographique de l’Ouest. Paris : Editions du CNRS (3 vol.).

ALP = Bouvier J.-C., & Martel C. (1975-1986). Atlas linguistique et ethnographique de la Provence. Paris : Editions du CNRS (3 vol.).

Battisti C. & Alessio G. (1950-1957). Dizionario etimologico italiano. Firenze : Giunti.

Benveniste E. (1949). « Noms d’animaux en indo-européen », Bulletin de la société de linguistique de Paris 45 : 74-103.

Billy P.-H. (1993). Index onomasiologique des Atlas linguistiques par régions (domaine gallo-roman), de l’Atlas linguistique de la France, et du Französisches Etymologisches Wörterbuch XXI-XXIII. Toulouse : Presses Universitaires du Mirail.

Brun-Trigaud G. & Malfatto A. (sous presse). « Limites dialectales vs limites lexicales dans le domaine occitan : un impossible accord ? », in X. A. Álvarez Pérez, E. Carrilho & C. Magro (éd.) Current Approaches to Limits and Areas in Dialectology. Cambridge : Cambridge Scholars Publishing.

Corpus, 12 | 2013 106

Corominas J. (1991 [1980]). Diccionario critico etimológico castellano e hispánico 1, A - CA. Madrid : Gredos.

Dalbera J.-P. (2006). Des dialectes au langage. Une archéologie du sens. Paris : Honoré Champion.

Dalbera J.-P. et al. (1992-). Thesaurus Occitan, ‘THESOC’. Université Nice Sophia Antipolis - CNRS / UMR 7320 BCL, http://thesaurus.unice.fr

Dalbera J.-P. et al. (2012). « La base de données linguistique occitane Thesoc. Trésor patrimonial et instrument de recherche scientifique », Estudis Romànics 34 : 367-387.

DELL = Ernout A. & Meillet A. (1959/2001). Dictionnaire étymologique de la langue latine. Histoire des mots. Paris : Klincksieck.

FEW = von Wartburg W. (1922-2002). Französisches Etymologisches Wörterbuch. Eine Darstellung des galloromanischen sprachschatzes (25 vol.). Bonn, Berlin, Basel : Klopp, Teubner, Zbinden.

Gaide F. (1997). « A propos des noms des quadrupèdes domestiques en latin. Lexicologie et ethnozootechnie », in S. Mellet (éd.) Les zoonymes : actes du colloque international tenu à Nice les 23, 24 et 25 janvier 1997. Nice : Publications de la Faculté des Lettres.

Gautier A. (1990). La domestication. Et l’homme créa l’animal. Paris : Errance.

Gleason H.-A. & Dubois-Charlier F. (1969). Introduction à la linguistique. Paris : Larousse.

Guiraud P. (1986). Structures étymologiques du lexique français. Paris : Payot.

Helmer D. (1992). La domestication des animaux par les hommes préhistoriques. Paris : Masson.

Humboldt W. (2000 [1821]). Sur le caractère national des langues et autres écrits sur le langage. Paris : Seuil.

Ingham B. (1986). « Notes on the dialect of the Āl Murra of eastern and southern Arabia », Bulletin of the School of Oriental and African Studies 49, 2 : 271-291.

Kleber G. (1990). La sémantique du prototype : catégories et sens lexical. Paris : Presses universitaires de France.

Kazanina N., Phillips C. & Idsardi W. (2006). « The Influence of Meaning on the Perception of Speech Sounds », Proceedings of the National Academy of Sciences of the United States of America 103, 30 : 11381-11386.

Lakoff G. (1987). Women, Fire, and Dangerous Things : What Categories Reveal about the Mind. Chicago : The University of Chicago Press.

Leibniz G. W. (1679-1710 [2000]). L’harmonie des langues. Paris : Ed. du Seuil (présentée, traduite et commentée par Marc Crépon).

Malfatto A. (2012). « De quelques noms du cochon de lait en domaine occitan », in G. Brun- Trigaud, M. Oliviéri & P. Del Giudice (éd.) La Leçon des dialectes. Hommages à Jean-Philippe Dalbera. Alessandria : Edissioni dell’Orso, 89-95.

Marouzeau J. (1937). Le latin, dix causeries. Toulouse, Paris : Edouard Privat, Henri Didier.

Mounin G. (1965). « Un champ sémantique : la dénomination des animaux domestiques », La Linguistique 1 : 31-54.

Neisser U. (1987). « Introduction : The ecological and intellectual basis of categorization », in U. Neisser (éd.) Concepts and conceptual development : ecological and intellectual factors in categorization. Cambridge/New York : Cambridge University Press, 1-24.

Corpus, 12 | 2013 107

Oliviéri M. (2012). « Le Mot et la chose : Réflexion sur le responsaire du THESOC », in G. Brun- Trigaud, M. Oliviéri & P. Del Giudice (éd.) La Leçon des dialectes. Hommages à Jean-Philippe Dalbera. Alessandria : Edissioni dell’Orso, 13-32.

Reboul A. (2007). Langage et cognition humaine. Grenoble : Presses universitaires de Grenoble.

Sapir E. (1968 [1911]). Linguistique. Paris : Les Editions de Minuit (traduction de Jean-Elie Boltanski et Nicole Soulé-Susbielles ; présentation de Jean-Elie Boltanski)

Séguy J. (1973). « Les Atlas linguistiques de la France par régions », Langue française 18, 1 (Les parles régionaux) : 65-90.

TLF = Imbs P. (dir.) (1971-1994). Trésor de la langue française : dictionnaire de la langue du XIXe et du XXe siècle : 1789-1960. Paris : Klincksieck.

Togeby K. (1958). « Les diminutifs dans les langues romanes du moyen-âge », Studia Neophilologica XXX, n° 2 : 192-199.

Webster R. (1991). « Notes on the Dialect and Way of Life of the Āl Wahība Bedouin of Oman », Bulletin of the School of Oriental and African Studies 54, 3 : 473-485.

Whorf B. L. (1971 [1940]). Linguistique et anthropologie. Paris : Denoël (traduction de Claude Carme)

Zeuner F. E. (1963). A History of Domesticated Animals. Londres : Hutchinson.

NOTES

1. Cf. notamment Lakoff (1987) et Reboul (2007). 2. Cf. Guiraud (1986) à propos de la création lexicale et ses différents aspects. 3. Ailleurs nommée sémantique cognitive. 4. Ce terme est utilisé pour regrouper un ensemble de pratiques culturelles, linguistiques, de connaissances encyclopédiques, propres à un groupe d’individus, une communauté ethnolinguistique. 5. La métaphore de la langue en tant que miroir de la pensée nous vient de Leibniz (1679-1710 [2000]). 6. Reboul 2007 p. 27. 7. A ce sujet voir en particulier Kazanina, Philips & Idsardi (2006). 8. Moins précise par exemple que celle d’un francophone. Le bassa regroupe sous un même terme hui ce que le français distingue en indigo, bleu, et vert, et sous le terme ziza le jaune, l’orange et le rouge. (Gleason 1969). 9. Moins précise par exemples que celle des locuteurs de certains dialectes arabes qui distinguent le chameau très rapide, le chameau utilisé spécialement pour la monte, la chamelle gravide, la chamelle noire ou la vieille chamelle (Webster 1991 et Ingham 1986). 10. Conscient de l’existence et des nuances qu’entretiennent les termes champ notionnel, champ sémantique et champ conceptuel nous avons toutefois choisi de les considérer, ici, comme synonymes. 11. Cf. notamment Zeuner (1963), Gautier (1990) et Helmer (1992). 12. Cf. §2.1. sur le nom générique. 13. Cf. Dalbera et al. (1992-) ainsi que Dalbera et al. (2012). 14. Ce nombre relativement faible représente l’ensemble des concepts pour lesquels chaque atlas possède au minimum une liste. 15. Sur l’établissement des atlas linguistiques et ethnographiques de la France par régions voir notamment Séguy (1973).

Corpus, 12 | 2013 108

16. Dans certains cas l’absence de questionnement peut être motivée par un raisonnement ethnologique, biologique ou zoologique établi au préalable et non imputable à un manque de rigueur méthodologique. Il est évident que les realia ne sont pas identiques à travers tout le domaine, on ne s’offusquera pas de ne pas trouver par exemple les cartes « anchois », « sardine » ou même « chamois » au sein de l’ALAL. 17. L’accès aux carnets d’enquêtes serait sans doute le seul moyen de retrouver les données inédites. 18. Sur la création lexicale, son caractère motivé et les diverses variétés de motifs nous renvoyons notamment à Guiraud (1986) et Dalbera (2006). 19. D’autres exemples de distinctions que seuls les commentaires d’informateurs peuvent nous révéler sont évoqués dans Malfatto (2012). 20. N’oublions pas que la plupart des enquêtes ont été réalisées dans la seconde moitié du XXe siècle auprès de locuteurs déjà âgés. 21. Il convient de noter que la notion d’espèce n’est pas à prendre ici au sens utilisé en taxinomie. Les animaux domestiques sont généralement des sous-espèces domestiquées d’espèces sauvages, le chien appartient à l’espèce canis lupus tout comme le loup, le porc à l’espèce sus scrofa tout comme le sanglier etc. Nous maintenons le terme espèce pour désigner ce que la taxinomie nommerait, quand il y à lieu, sous-espèce. 22. Le choix du représentant étant influencé par la réalité extralinguistique, pour Benveniste (1949) « La variété la plus utile pour l’éleveur dénomme l’espèce entière. ». 23. Savoir avec certitude quelles sont les espèces englobées sous les concepts de bétail et gros bétail ou quels sont les individus regroupés sous celui de jeune bétail n’est pas aisé. En français il semblerait que le bétail regroupe l’ensemble des animaux d’élevage à l’exception des volailles, cependant à certaines localités bétail ne catégorise que l’ensemble des bovins ou des bêtes à cornes. Une étude ethnologique de ces concepts, parallèle à une étude linguistique de leurs dénominations, éclairerait la situation. 24. Nous réaffirmons encore une fois que l’absence de données ne signifie pas l’absence du concept dans les systèmes. 25. Mounin (1965 : 45). 26. A ceci près que les chevaux et les poules n’ont pas, comme les ânes, d’autre distinction en rapport avec les jeunes individus. Les moutons, les bœufs et les porcs représentent un niveau de distinction supérieur détaillé au §2.5. 27. La formation de ces dénominations est généralement une composition des noms du mâle reproducteur et de la femelle. On pourrait envisager une étude lexicale intéressante à ce sujet. 28. Les autres distinctions, sporadiques, du bœuf mâle sont les suivantes : de douze à quinze mois, d’un an et demi, de un à deux ans, de deux ans, de deux à trois ans. 29. Les autres distinctions des moutons mâles sont les suivantes : de moins d’un an, de deux ans, de trois ans, de quatre ans. 30. Les autres distinctions du porc mâle sont les suivantes : de plus de quatre mois, de moins de six mois, de six mois, d’un an. 31. Les diverses catégories de génisses sont les suivantes : jusqu’à six mois, de six mois, de plus de six mois, jusqu’à sept ou huit mois, de plus de huit mois, de six mois à un an, de plus d’un an, d’un an à un an et demi, d’un an et demi, de six ou sept mois à deux ans, d’un an à deux ans, de deux ans et demi à trois ans, de deux à trois ans, de trois à quatre ans. 32. Qu’ils soient élevés dans ce but ou qu’ils aient une prédisposition caractérielle. 33. La notion de prototype est empruntée à la sémantique cognitive issue notamment des travaux d’Eleanor Rosch. Elle explique la catégorisation des individus en fonction de leurs distances ou de leurs similitudes envers un représentant prototypique de l’espèce. Pour une description générale de la théorie du prototype voir Reboul (2007). Concernant le domaine de la linguistique et plus précisément de la sémantique lexicale voir Kleber (1990).

Corpus, 12 | 2013 109

34. L’ALCe, dont les points méridionaux sont intégrés au THESOC, ne dispose d’aucune carte onomasiologique concernant l’âne mâle adulte alors que l’index onomasiologique de Billy (1993) annonce pourtant la carte 394 « âne ». Sur cette carte on trouve en réalité, en marge, les noms facétieux ou les sobriquets – de type ministre des finances ou président – parfois attribués à l’animal. 35. Nous lissons volontairement les variantes phonétiques et utilisons une forme de référence, un lemme, pour regrouper divers aboutissements dialectaux issus d’un même étymon. En ce qui concerne l’occitan nous avons choisi de nous référer au « Dictionnaire occitan français selon les parlers languedociens » de Louis Alibert également utilisé comme référence au sein du THESOC. 36. Nous constatons en effet que la forme asirolet, hapax de notre corpus, est employée en situation synonymique avec une forme ase au point ALLOc 24.10 Veyrines-de-Vergt, on pourrait donc supposer une valeur hypocoristique attribuée à cette forme. 37. Outre la formation onomatopéique Battisti & Alessio (1950-1957, sous arri) propose d’y voir un dérivé du latin ARRIGE [AURES] « dresse (les oreilles), écoute ». 38. « Mot de création expressive, qui est également attesté, avec de légères variations, non seulement parmi les autres langues péninsulaires, mais également en langue d’oc, en italien et en arabe africain. » (Nous traduisons). 39. Sur les diminutifs analytiques et synthétiques voir notamment Togeby 1958. 40. D’ailleurs les données pour lesquelles le nom du jeune mâle et de la jeune femelle sont strictement identiques (γ1 et γ2) nous semblent suspectes car les dénominations de la jeune femelle recueillies ainsi que leur article sont de genre masculin : lo saumin (ALP 115) et lo saumon (ALP 66, 74, 136).

ABSTRACTS

Perceptive categories and referential relevance. The case of domesticated animals in Occitan The paper considers the relevance of categorisation in the light of dialectology methods for data collection and analysis. After a general reflection on the issue, it investigates a corpus of 178,000 lexical data taken from Atlas linguistiques et ethnographiques de la France par regions. First, it provides an overall account of the categories found in Occitan for domesticated animals; then it focuses on the notional system of donkeys and their dialectal names.

Ce texte présente une réflexion générale sur la pertinence catégorielle en la rapprochant de questionnements relatifs au recueil et à l’analyse des données en dialectologie. Cet article se poursuit en proposant, par l’étude d’un corpus constitué de plus de 178 000 formes lexicales issues des Atlas linguistiques et ethnographiques de la France par régions, la description globale des découpages catégoriels effectifs en domaine occitan, concernant l’ensemble des animaux domestiques. Les dénominations dialectales du système notionnel des ânes constituent une étude de cas sur laquelle ce travail se conclue

Corpus, 12 | 2013 110

INDEX

Mots-clés: catégorisation, atlas, dialectes occitans, questionnaire d’enquête, animaux domestiques Keywords: categorisation, atlas, occitan dialect, survey questionnaire, domesticated animals

AUTHOR

ALBERT MALFATO Univ. Nice Sophia Antipolis, CNRS, BCL, UMR 7320, 06300 Nice, France

Corpus, 12 | 2013 111

La trajectoire de la dialectologie au sein des sciences du langage. De la reconstruction des systèmes dialectaux à la sémantique lexicale et à l’étymologie

Jean-Philippe Dalbera

1. L’image actuelle de la dialectologie : la dialectologie vue de dehors

1 Que représente aujourd’hui la dialectologie ? Aux yeux du plus grand nombre, peu de choses : une discipline vieillotte, passéiste, folkloriste, un savoir superflu, aucunement rentabilisable, au mieux un violon d’Ingres pour quelques originaux. Aux yeux des linguistes, une discipline mineure, l’étude de parlers locaux, le plus souvent moribonds auxquels on s’intéresse au détriment des grandes, des vraies langues : parlers locaux, l’appellation neutre de ce qui auparavant s’appelait patois est en train de prendre à son tour l’acception teintée de mépris qui caractérise ces derniers. Certes il existe encore quelques régionalistes ici et là qui tentent de brandir la dialectologie comme argument scientifique de défense de leur parler maternel ou grand maternel, mais même là le cœur n’y est pas car le dialectologue se refuse à valider les normalisations autoritaires auxquelles tentent de se livrer certains à l’intérieur des groupes de parlers régionaux. Le dialectologue ne peut accepter que l’on fasse subir aux parlers encore vivants le sort que la diffusion du français a réservé aux langues régionales. Le fait de se doter d’une norme graphique susceptible de fonctionner comme koinè écrite en vue de favoriser la diffusion et de promouvoir l’enseignement d’une langue n’est nullement répréhensible tant s’en faut, tant que l’usage parlé de cette langue demeure effectif dans sa diversité géographique. Cela devient une catastrophe linguistique si le propos est de réapprendre « leur » langue à des générations qui ne la connaissent plus : le conflit

Corpus, 12 | 2013 112

engendré entre ce qui reste d’apprentissage passif (hérité et valorisable) et ce qui procède d’une norme externe achève le processus de mise en extinction de celle-ci. Mais alors, à quoi bon la dialectologie ? Et d’abord de quoi s’occupe-t-elle ? Il semble qu’on ne le sache plus trop. Au départ ce qui sépare la dialectologie de la philologie et plus globalement de la linguistique, c’est le fait de travailler sur l’oralité ; en liaison avec cet aspect une seconde caractéristique intervient, qui touche au mode de recueil des faits, au mode de transcription et de consignation des données linguistiques, au mode de choix des témoins consultés, bref au travail dit de terrain et à la technique d’enquête. En troisième lieu figure la prise en compte de la dimension spatiale, la variabilité de proche en proche dans le continuum géographique. Mais ni l’étude des données orales, ni l’enquête de terrain, ni la variation dans l’espace ne sont plus à même de caractériser la dialectologie : l’oralité est désormais incontournable pour la linguistique dans son entier, les sociolinguistes ont approfondi la gestion théorique et pratique de l’enquête, les géolinguistes se sont appropriés l’espace géographique… Que reste-t-il au dialectologue ?

2. L’objet de la dialectologie : retour aux sources et recentrage sur la parenté génétique

2 Pour concevoir ce qui fait le propos spécifique de la dialectologie, il est utile de revenir un instant aux sources : l’intérêt qui s’est porté pendant une période sur les « parlers locaux » ne relève pas du souci immédiat de mieux les connaître. A travers eux, à travers la représentation naïve que l’on se fait de ces parlers locaux, on cherche à comprendre pourquoi les lois phonétiques ne s’avèrent que partiellement, pourquoi il y a toujours des exceptions : si l’on veut ne pas remettre en cause la théorie (les lois phonétiques) il faut revoir les faits, le corpus. Puisque les langues de culture ou nationales n’illustrent pas (toujours) ce que prédisent les lois, c’est que ces langues ont été manipulées artificiellement (retouchées, complétées, enrichies, codifiées… bref transformées) de telle sorte qu’elles ne constituent pas un test valide pour juger de la valeur des lois phonétiques : il convient donc de trouver des parlers ayant évolué de manière « naturelle », étant restés en dehors de tout interventionnisme linguistique (le bon sauvage version langue). Nous y voilà. On sait ce qu’il est advenu de cette démonstration : les parlers locaux n’ayant pas fourni la preuve que les lois phonétiques ne souffraient pas d’exception, la démonstration s’est retournée contre ses promoteurs. Bien loin de valider définitivement les lois, ce sont les aléas de leur histoire qui font les mutations des mots. La démarche a donc avorté mais elle reste révélatrice : ce qui a été tenté, avec l’essai de validation des lois phonétiques, c’est la mise en œuvre d’une vision de l’évolution linguistique dans laquelle les changements observables sont la résultante des forces de pression qui s’exercent sur la langue dans le temps et l’espace ; dans le temps sous forme de vagues de mutations aveugles ne laissant à l’homme aucune prise (telles les lois phonétiques), l’espace apparaissant comme un crible qui laisse plus ou moins, plus ou moins vite, passer ces vagues de mutations et dessiner en définitive des aires (entendues comme espace ayant connu une évolution homogène). Il y a donc bien dans cette irruption de la dialectologie sur la scène linguistique l’idée sous-jacente d’une corrélation étroite entre variations dans l’espace-temps et dans l’espace géographique et par ailleurs au moins l’intuition que ces deux dimensions de la variation peuvent à certains moments tirer en sens inverse et entrer en conflit.

Corpus, 12 | 2013 113

3. Parenté génétique et dialectes : l’approche comparatiste

3 Il est temps à présent de rassembler les débris épars et d’essayer de reconstituer la poterie. Le dialectologue travaille essentiellement sur des données de l’oralité mais ne s’interdit nullement d’exploiter des données écrites quand elles existent ; la dialectologie s’intéresse au premier chef à la répartition des faits dans l’espace mais cela ne lui interdit nullement de prendre en compte le temps : les cartes d’atlas sont tantôt synchroniques, tantôt diachroniques. Ce qui caractérise la dialectologie, c’est la prise en compte nécessairement conjointe du temps et de l’espace. Le doute n’est pas permis : l’objet propre de la dialectologie, c’est la parenté génétique, ou plutôt le degré de parenté génétique entre les parlers. Le terme de dialecte a été utilisé de tant de manières différentes qu’il couvre toutes les ambiguïtés du monde ; si l’on doit l’utiliser, il convient d’être clair avec sa valeur ; dialecte fonctionne, dans notre perspective, comme un terme purement relationnel : le niçard n’est pas un dialecte mais un dialecte de la langue d’oc au même titre par exemple que le languedocien ; la langue d’oc (l’occitan) est un dialecte du roman occidental au même titre que le catalan, le piémontais, le castillan ou le toscan et peu importe que certains aient acquis rang de langue nationale et d’autres pas. Puisque l’on se trouve embarqué dans une métaphore génétique, avec les désagréments que cela comporte, essayons d’en tirer avantage et soulignons que dialecte fonctionne comme cousin. Nul n’est cousin : tout ce qui peut arriver c’est que l’on soit le cousin de quelqu’un. Et chacun sait qu’il existe des degrés dans le cousinage comme il existe des degrés dans la proximité diachronique entre les parlers.

4 Mais dès que l’on pose que le dialectologue travaille sur un ensemble de parlers génétiquement apparentés, le plus souvent étroitement apparentés et qu’il cherche à cerner les dialectes, à délimiter les aires dialectales, on se rend compte que son objectif est de parvenir à une mesure des écarts : écarts entre les parlers modernes, écarts entre parlers modernes et système-source. Le mode d’opération de ces mesures, qui visent à établir la distance qui sépare chacun des parlers du système-source et sur le détail desquelles il y aurait beaucoup à dire suppose le recours au moins implicite à un arrière-plan (reconstruit ou attesté, peu importe) qui sert de repère. La meilleure mesure de la distance linguistique qui sépare le roman occidental du languedocien, de l’alpin ou du piémontais est certainement celle qui s’exprime en nombre et qualité des changements intervenus. L’étude monographique d’un parler local n’est qu’un préambule à une recherche dialectologique : celle-ci commence là où commence la comparaison. L’objet d’un travail dialectologique revient in fine à rendre compte de l’architecture d’un espace-temps dialectal à travers sa reconstruction. Le maître-mot- clé définitoire de la dialectologie est donc reconstruction. Celle-ci se décline comme élaboration hypothétique d’un protosystème et conjointement élaboration de paquets de règles ordonnées ayant pour fonction de dériver les proto-éléments (état zéro) c’est- à-dire pour en faire des éléments de l’état n°1 qui succède à l’état zéro dans la chronologisation prise pour objet de l’étude.

Corpus, 12 | 2013 114

4. Un comparatiste privilégié

5 Le dialectologue apparaît dès lors essentiellement comme un comparatiste, peut-être même comme un comparatiste privilégié. De fait, entre la démarche du comparatiste- dialectologue et celle du comparatiste indo-européaniste seule ou presque l’échelle change. Les problèmes que l’un ou l’autre ont à traiter sont de même nature. Mais il est vrai que les conditions de travail ne se ressemblent guère : le recul (ou l’absence de recul) par rapport aux données, des lacunes face à un déroulement continu, des univers de référence différents… Certes, le fossé est considérable mais dans tous les cas cependant l’adéquation des systèmes reconstruits à la réalité reste comparable ; ceux-ci ne sont que des systèmes intermédiaires et de pures abstractions. La reconstruction d’un ensemble dialectal se fait souvent avec des données qui ne changent pas spectaculairement d’un parler à un voisin immédiat mais qui peuvent, quand on confronte un bout de la chaîne à l’autre manifester un écart considérable. C’est alors toute une architecture sous-jacente qui se révèle et qui, dans les répétitions qu’elle affiche et les cycles qu’elle suppose, nourrit les modélisations du changement linguistique. C’est là qu’on discerne ce qui est possible en matière de langage (la vraisemblance des systèmes et des règles), c’est là qu’on touche du doigt comment des systèmes cousins que peu d’écarts séparent, confrontés à une même difficulté sont susceptibles de s’engager dans des voies diverses pour y porter remède, toutes choses qui constituent une contribution spécifique aux sciences du langage. C’est là qu’on appréhende la dynamique des mutations (gradualité vs innovation partagée). C’est là qu’il faudra puiser les modélisations du changement linguistique. Il reste néanmoins, – et cela est crucial pour notre propos –, à rappeler que, en pratique, toutes les reconstructions ne se valent pas ; les plus abouties l’ont été dans les domaines de la phonologie et de la morphologie. Le lexique est beaucoup moins bien loti. Les linguistes s’accordent sur la faiblesse de ce secteur de recherche. Ainsi Swiggers dans son analyse dans une perspective épistémologique des principaux axes et des différents moments de la pensée étymologiste, clôt son bilan sur le « parent pauvre de l’explication étymologique : la sémantique diachronique et reconstructiviste »1. Et le constat est analogue dans l’article qui ouvre le Mémoire de la Société Linguistique de Paris, consacré aux « Théories contemporaines du changement sémantique » : « la manière dont les dictionnaires étymologiques rendent compte ou tentent de rendre compte de l’évolution sémantique est profondément décevante »2.

5. Le parent pauvre de l’explication étymologique

6 Le moment semble venu de mettre à profit des convergences entraperçues dans ce qui précède pour relancer ces laissés pour compte de la recherche que semblent être la sémantique lexicale et l’étymologie. Le nœud conceptuel pourrait être constitué par l’analyse motivationnelle et la perspective de reconstruction. Les nombreuses analyses auxquelles nous nous sommes livré dans nos travaux autour de l’ALiR et de l’ALE nous ont convaincu que des analyses fines réalisées à partir des cartes d’atlas dialectaux étaient de nature à révéler des motifs profonds, voire très profonds à la base d’unités lexicales somme toute banales. Les deux champs les plus fouillés ont été le domaine magico-religieux3 et les zoonymes ; les résultats sont très encourageants. La technique mise en œuvre consiste à se servir des motifs dégagés sur les unités lexicales

Corpus, 12 | 2013 115

transparentes comme clés pour élucider les mots opaques. Ensuite procéder à une analyse comparative selon les mêmes principes que ceux utilisés pour la phonologie. Ainsi la dialectologie livre-t-elle un corpus important et pré-formaté à l’attention des chercheurs.

6. Le lexique peut-il faire l’objet d’une reconstruction ?

7 Mais l’étymologie n’est-elle pas une reconstruction lexicale, elle qui s’autorise notamment, entre autres, à reconstruire des mots-étymons quand nécessaire ? Alors notre question paraît étrange et fait entendre que l’on se propose d’enfoncer des portes ouvertes. Il convient donc de l’expliciter. A priori la réponse va de soi ; une démarche qui vise à identifier des formes-sources et à les relier à des formes observables en aval (quelle que soit la période considérée) ou, lorsque celles-ci n’existent pas dans les textes dont on dispose, à les re-construire (en les marquant d’une astérisque *) peut- elle être autre chose qu’une reconstruction ? – Soit. Cette réponse pourtant n’est aucunement satisfaisante ; ce n’est pas faire preuve d’esprit byzantin que de dire qu’on est bien en présence d’une reconstruction mais non d’une reconstruction lexicale : on reconstruit la forme phonique mais on ne reconstruit guère le signifié ; or chacun sait que le signe lexical – disons ici simplement le mot – est une entité à double face signifiant / signifié.

8 Que la reconstruction se limite à la forme signifiante est facile à démontrer. Il suffit de feuilleter quelques pages d’un dictionnaire étymologique pour s’en convaincre. Ouvrons par exemple le DELF. On y trouve toute une série d’entrées françaises, de type chèvre, doigt, maison, agneau, pierre, pain… en face desquelles figurent, avec quelques commentaires, les étymons latins respectifs : CAPRA, DiGiTUS, MA(N)SIO, -4NIS, AGNeLLUS, PeTRA, PANIS… Cet ensemble de formes ne soulève aucune difficulté. Les étymons sont là des mots latins attestés dont le référent n’a pas changé et dont la forme phonique a connu des changements bien répertoriés par ailleurs et tout à fait conformes à ce que l’on sait de l’évolution du phonétisme dans cette zone de la Romania.

7. Le modèle proposé : principes directeurs et méthodologie

9 Reculer devant la reconstruction de la face sémantique du mot dans le cadre de l’élucidation étymologique ne nous semble pourtant pas inéluctable et nous nous attacherons dans ce qui suit à montrer comment parvenir à reconstruire le signifié.

7.1 Assumer le caractère bifacial du signe et dissocier deux plans et deux analyses

10 Les langues naturelles se caractérisent par l’absence d’isomorphisme entre les deux plans du signe que sont l’expression et le contenu. L’association d’une représentation à une expression s’opère dans le cadre du mot notamment où elle se fige. Mais cela n’implique nullement que les atomes constitutifs de l’un des plans soient systématiquement corrélés aux atomes de l’autre. Cette dissymétrie s’observe sans

Corpus, 12 | 2013 116

difficulté dans le changement lexical : une altération de la forme phonique d’un mot n’a pas nécessairement d’écho au plan du sens. Cela nous incite à envisager l’idée que la reconstruction lexicale passe par une double démarche : reconstruction de la face phonique d’une part, sur la base de ce que l’on sait de l’évolution du phonétisme, de la face sémique de l’autre. Le point crucial est que ces deux reconstructions doivent être conçues indépendamment l’une de l’autre ; ce n’est que par la suite qu’il faudra étudier l’interaction entre les deux, étant entendu que le changement lexical ne passe pas que par le signifiant. Il y a en effet tout lieu de croire, à voir dans la diatopie les ressorts des mutations lexicales, qu’à chaque état du système les deux faces interagissent et participent par là-même de la dynamique lexicale (attraction paronymique, pondération homonymie/polysémie…). Rééquilibrer l’étymon suppose de traiter chaque plan du signe de manière autonome. Il n’est nul besoin d’insister sur la reconstruction de la face phonique : elle est, pour l’essentiel, au point. La chose est moins claire pour la face sémantique.

7.2 Concevoir l’analyse motivationnelle comme une reconstruction comparative du signifié

11 La première phase de la reconstruction du signifié d’une unité lexicale consiste selon nous à mettre en évidence le ou les motif(s) qui constituent le fondement de la création de celle-ci et à tenter de cerner les transformations que ce motif est susceptible d’avoir connues. Certes il ne s’agit pas seulement de piocher dans un sachet de motivations superficielles apparentes. Pour accéder à ces motifs, il faut tirer les conséquences du fait que le langage est son propre métalangage, qu’un mot se glose par un autre mot ; cela implique, en l’occurrence, que le signifié d’un mot ne peut être communiqué que par le biais de l’un (ou de plusieurs) de ses équivalents approchés, c’est-à-dire toujours par le biais d’autres mots. L’idée, à partir de là, est d’utiliser les manifestations concrètes du sens que sont les diverses expressions qui lui sont associées pour approcher et reconstruire le sémantisme qui les sous-tend. Cela revient à traiter les signifiés selon une technique de reconstruction comparative bien rôdée sur le plan de l’expression. De la même façon que le linguiste est capable de reconstruire un proto- phonème à partir des divers aboutissements que celui-ci connaît dans des contextes différents ou dans des idiomes différents, de même, le linguiste, prenant en compte la variation lexicale se met en mesure de reconstruire la source sémantique d’où se déduisent les différentes manifestations sémantiques observées (et, complémentairement, de maîtriser les changements de sens). Il ne lui reste alors, pour progresser dans une recherche étymologique, qu’à répondre à la question : les autres dénominations – opaques – s’éclairent-elles si on leur associe un signifié comparable à celui précédemment trouvé ?

12 Deux points majeurs, par conséquent, se font jour dans notre approche : d’une part, la matérialisation du sens sous la forme d’un paradigme de variantes lexicales interprétées comme quasi-équivalentes dans leur emploi ; d’autre part, la technique éprouvée de reconstruction comparative. Et le support concret de la réflexion pour mener à bien ces deux manœuvres peut être, dans un premier temps du moins, un objet tel qu’une carte onomasiologique d’atlas dialectal. Le signifié (profond) n’est que sporadiquement accessible sous la forme d’un motif de manière immédiate : le motif doit le plus souvent faire l’objet d’une reconstruction et la reconstruction de celui-ci

Corpus, 12 | 2013 117

n’est convaincante et ne se valide que si elle entraîne en retour la mise en lumière de nouvelles expressions de ce motif. La recherche motivationnelle consiste donc à exploiter les équivalences d’emploi pour accéder aux équivalences de représentation4. Et il faut noter qu’elle a ceci de particulier qu’elle engendre naturellement sa propre évaluation : le chercheur se rend compte très vite si sa clef ouvre des portes oubliées ou que l’on croyait condamnées.

7.3 Postuler la continuité lexicale dans l’espace et le temps

13 Il ressort de ce qui a été établi plus haut que la dynamique lexicale est à l’œuvre en permanence, que, pour dire les choses autrement, le cheminement des mots est cyclique (motivation–convention–arbitraire)5. Cette propriété pourrait bien ouvrir des horizons intéressants pour la reconstruction lexicale. S’il est vrai que la remotivation est à la fois potentielle en permanence et susceptible de s’effectuer de plusieurs manières différentes, il devient crucial d’examiner de près les avatars motivationnels. Une remotivation peut s’opérer à l’identique si le motif d’origine est toujours aussi prégnant dans l’imaginaire collectif ou se renouveler si la représentation qu’on se fait de tel ou tel pan de réalité change. Mais en tout état de cause, elle donne des clefs pour accéder tant aux représentations diverses qu’une communauté linguistique se fait du réel, qu’aux mécanismes proprement linguistiques qui autorisent ou favorisent le changement de représentation. Une conséquence importante est que l’argumentation étymologique doit être conçue comme achronique et atopique ; seuls les états du lexique résultants sont à envisager situés dans l’espace et le temps ; ils constituent alors des équilibres instables et fragiles.

7.4 Postuler une homogénéité de représentation par défaut à l’intérieur d’une aire linguistique génétiquement délimitée

14 La proposition ci-dessus en 7.3 doit être complétée par un postulat d’homogénéité minimale des faits linguistiques qui consiste à supposer que les motifs des représentations du réel que véhicule le langage ne sont ni individuels ni anecdotiques ; en d’autres termes que la vision du monde d’une communauté à un moment donné est pour l’essentiel homogène ; il s’agit presque d’une proposition tautologique. Il faut donc s’attendre, pour ce qui nous concerne ici, à trouver, quand on travaille sur des périmètres restreints, des motifs de création de signes récurrents et c’est cette permanence dans la représentation qui incite à y voir une sorte de sémantisme commun ; celui-ci dès lors est candidat au statut de fondamental. Encore faut-il que ce point soit bien interprété : nous voulons dire que l’homogénéité de motif doit être envisagée par défaut comme le caractère non marqué de la situation. Cela n’empêche nullement qu’il y ait des cas où une diversité notable se manifeste. Par exemple quand les motifs traduisent l’empilement de plusieurs strates linguistiques, la vision en à-plat de l’aire ne renvoyant alors qu’à une hétérogénéité factice, artefact du regard porté. Dans ce cas, on a affaire à une situation marquée.

Corpus, 12 | 2013 118

8. Illustrations

15 Quelques illustrations sont indispensables pour mesurer l’écart qui sépare la reconstruction lexicale ainsi initiée de la démarche étymologique classique. Il est important entre autres de voir à l’œuvre la mise en évidence des motifs, les notions de continuité de représentation, d’homogénéité en périmètre restreint et de récurrence. Le premier exemple traité concernera les noms du martinet6.

8.1 Les dénominations du martinet (d’abord en pays languedocien puis au delà)

16 Le martinet, comme chacun sait, est une espèce d’hirondelle. Sa dénomination scientifique est Apus apus. Dans les parlers populaires il reçoit, selon le témoignage de la dialectologie, une multitude d’appellations plus étranges les unes que les autres. Nous nous sommes posé la question d’un éventuel motif qui serait à la base de quelques-unes au moins de ces appellations. Nous n’avons pas été déçu. La liste des types d’appellations que l’on peut trouver en consultant notamment les atlas linguistiques du monde roman se présente comme suit : martinet, martelet, foucil, balestrièr, barbajòu, barbiròu, rascle, rudilou, issòlo, passovolan, trenquet, sbiro, passeru volan 7 pour le sud de la France, à quoi s’ajoutent des dénominations recueillies en terre espagnole : vencejo, ou italienne : rondone, balestruccio , barbaottu , sbiru… La liste n’est évidemment pas exhaustive.

17 Importante et curieuse diversité. En première approximation, ces dénominations n’offrent ni unité ni cohérence ; qu’y a-t-il de commun à un martinet, une faucille, la barbe de Jupiter, un oiseau qui vole (sic), un soudard… ? Ce bric à brac lexical prend néanmoins un relief certain dès que l’on a bien voulu gratter la mince couche superficielle. Tout tourne, semble-t-il, autour de deux images.

18 Le martinet en vol, d’une part, évoque (irrésistiblement, semble-t-il) par sa silhouette l’arbalète et les traits qu’elle décoche ; d’où ces dénominations récurrentes de type balestrièr, aubarestier, balestruccio ; cette métaphore est également, de manière moins immédiatement visible, à la base de sbiro : les sbires (aujourd’hui hommes de main chargés de la basse besogne) sont d’abord dans l’Italie du quattrocento des gens d’armes au service des princes, appartenant à des compagnies d’archers ou d’arbalétriers ; l’image ne se dément pas et l’on pourrait ajouter d’autres appellations analogues du martinet comme, par exemple wallon aîrchi « l’archer ». Les ailes déployées du martinet en vol, alliées à la rapidité et au caractère rasant de celui-ci font penser aussi au geste du faucheur et au mouvement des lames recourbées d’outils agricoles, de type faucille : c’est la source de bon nombre d’appellations, telles fauç, fauçil mais divers autres outils peuvent faire l’affaire, une fois la matrice métaphorique en place ; ainsi s’expliquent des dénominations comme trenquet qui désigne, entre autres, une serpette de vendangeur, eissòla qui renvoie à une petite hache courbe (TDF) ou encore martelet qui désigne une sorte de petit marteau… Cela nous permet en outre de comprendre ce nom de volan qui est attesté en maints endroits : il ne s’agit évidemment pas d’un mot construit sur « voler » (le trait ne serait guère discriminatif pour un oiseau) mais de volam, autre terme en usage désignant la faucille. Et de même que les dénominations forgées sur arbalète campent un oiseau-arbalète ou un arbalétrier, celles qui sont liées à la faucille campent un oiseau-faucille (littéralement passo volam) ou un faucheur. Et

Corpus, 12 | 2013 119

c’est à cette caractéristique de vol rasant que l’Apus apus doit certaines de ses dénominations parmi les plus étranges : c’est un raseur que l’on dénomme donc barbier, barbirou, rasclaire8 ou même, avec dérapage, barbajou.

19 L’analyse comparative des variantes de dénomination de l’Apus apus conduit donc à un motif majeur, un sémantisme fondamental : la représentation que les gens se font du martinet est celle d’un faucheur, d’un raseur (homme ou instrument). Reste à savoir quelles sont la validité et l’extension de cette représentation. L’analyse qui précède a livré une clef. Celle-ci pourrait-elle faire office de passe-partout ? Un rapide élargissement du champ d’étude livre des confirmations au delà de toute espérance. Bon nombre de formes d’Italie septentrionale désignant le martinet sont considérées comme d’étymologie obscure ; elles semblent s’égrener dans l’espace sans principe organisateur. Il est vrai que la destructuration phonétique de ce terme et son émiettement en variantes innombrables ne facilitent pas une appréhension cohérente et univoque des faits. Un usage immodéré de la métathèse notamment, combiné à des déplacements d’accent (cf. [si'zile], ['siliga]) rendent délicat l’établissement de la chaîne des formes ; de telle sorte que chacun y va de sa proposition étymologique et que l’on rivalise d’intuition et d’astuce : Bartoli (1945 : 39) pose une base CICINULA en se fondant sur une définition du Corpus glossariorum latinorum : Hirundo nomen passeris cicines ; Zamboni (1972 : 239) propose une base (AVIS) CILICA, l’oiseau de Cilicie qu’il considère comme « foneticamente ineccepibile (…) e semanticamente plausibile se si pensa alle caratteristiche migratorie di questi ucelli »9. Ces essais, fort louables au demeurant, pèchent par leur caractère non systématique qui les rend non falsifiables. Est-il imaginable de voir dans ces dénominations les images-sources prégnantes, la métaphore créatrice majeure de l’arbalétrier ou du faucheur ? A priori il semble que la réponse soit négative en ce qui concerne les formes dialectales italiennes ; mais, à la réflexion, si l’on prend en considération le stade latin, l’hypothèse prend corps : il existe en effet dans cette langue un mot S3C3LIS qui désigne la faucille (S3CIL3RE « faucher ») et qui, au plan phonique, sous-tendrait sans difficulté les réalisations dialectales dans toute leur diversité ; [si'zile] et alii ne seraient donc autres que des continuateurs d’un mot latin qui désigne la faucille. Certes les perturbations qui affectent le signifiant bousculent cet ordonnancement et gomment le lien génétique mais guère plus qu’en Languedoc où faucilh peut dériver vers un énigmatique forsit et où balestrièr se déforme en vulastrièr. L’hypothèse étymologique est donc cette fois issue d’une suggestion sémantique, il convient de le noter ; ce n’est pas un mot latin qui sert de source partagée aux formes languedociennes et frioulanes, c’est une image-dite10 formulable par des mots différents, c’est-à-dire une représentation exprimée. Une situation complexe se présente également à l’ouest du Languedoc. En Espagne, la forme vencejo qui désigne l’Apus apus laisse les analystes perplexes ; néanmoins le poids du sémantisme mis en lumière par la comparaison incite Corominas11 à rattacher vencejo à FALCILLU malgré les difficutés phonétiques.12 La récurrence motivationnelle n’est donc nullement argument négligeable aux yeux des maîtres de l’étymologie.

20 Nul ne contestera, pensons-nous, le caractère récurrent de la représentation en même temps que la plasticité de celle-ci. L’image peut se modifier quelque peu, tout comme la forme phonique signifiante, évoluer sans pour autant devenir illisible, ce qui revient à dire que signifiant et signifié mènent alternativement le jeu, que l’un comme l’autre sont susceptibles d’évoluer et surtout que ces évolutions sont autonomes, s’opèrent

Corpus, 12 | 2013 120

parallèlement13. L’équilibre se rétablit dans la reconstruction entre dynamique phonique et dynamique sémique.

21 Enfin, un coup d’œil du côté du grec nous apprend que la faux (drépanè) et le martinet (drépanis) portent dans cette langue quasiment le même nom. La preuve est faite qu’en matière de lexique, la reconstruction sémantique opérée à partir d’une analyse comparative de dialectes modernes est de nature à livrer des résultats qui dépassent largement le périmètre du corpus à partir desquels l’analyse a été élaborée, et notamment d’excéder le cadre synchronique. Prenons donc acte du fait que le signifié premier est une primitive logique et non chronologique. Et de ce que la possibilité de faire des prédictions (éminemment falsifiables) permet de mesurer la fiabilité et la pertinence des hypothèses avancées. On aura remarqué au passage le rôle majeur tenu par la dialectologie dans cette démarche. Elle seule est en effet de nature à proposer un corpus suffisant pour suggérer puis asseoir des hypothèses sémantiques ; ce n’est qu’à travers le foisonnement des variantes se complétant et se corrigeant l’une l’autre que la reconstruction s’est avérée autorisée. Le même raisonnement, appuyé sur les seules formes des langues nationales, aurait certainement eu du mal à emporter la conviction.

8.2 Les dénominations des oiseaux de types grives ou merles

22 Notre deuxième illustration concerne encore des noms d’oiseaux. Il s’agit cette fois des noms populaires des turdidés, c’est-à-dire des grives auxquelles nous adjoindrons les étourneaux. Les parlers de France, au delà de quelques mots onomatopéiques tels tyatya ou chacha, connaissent, considérées en vrac, les formes suivantes14 : grive, merle, draine, litorne, mauvis, tourd, étourneau, sansonnet, oc. tordol, trida, quina, cesera… ; les parlers d’Italie attestent des types correspondants : turlu, sturnello , merula , marvissi … et y ajoutent quelques autres : turdena, sassello… Peuvent encore y être adjointes quelques formes relevées dans la péninsule ibérique par exemple, ou en Dacie : sturdz. Il y aurait certes beaucoup à dire sur la liste ainsi dressée : ces noms renvoient à diverses espèces de grives ou à des génériques variables selon les régions, prennent ou non en compte la distinction mâle / femelle, cèdent parfois la place à des appellations sous forme de gloses : tordo reale, grive de pays, merle noir ou encore grive de vignes ; mais il n’est guère possible dans le présent cadre d’exposer la question en détails15.

9. Reconstruction autonome de la face sémantique et étymologie

23 Nombreux sont les cas où la démarche étymologique classique tourne court, une fois la constatation faite que la forme phonique est opaque et qu’il n’existe pas en latin de mot susceptible de sous-tendre cette forme phonique moderne. Le recours à une reconstruction du sens permettrait de démontrer, si celle-ci aboutit, que les deux reconstructions sont effectivement autonomes et que la reconstruction lexicale ne peut faire l’économie ni de l’un ni de l’autre plan. Nous nous efforcerons dans ce qui suit de tirer la leçon de la confrontation des résultats que produit l’étymologie classique à ceux qu’autorise une reconstruction lexicale au sens où nous l’avons définie. Nous examinerons à cet effet le cas des différents noms des grives et des merles dans les langues et parlers romans16. Que nous apprend sur ces noms la consultation des dictionnaires étymologiques ? Pour ce qui concerne le français, les sources

Corpus, 12 | 2013 121

étymologiques présentées comme sûres se résument à peu de choses : merle continue lat. MeRuLA ; de nombreuses formes gallo-romanes, de type oc. ['turt], continuent par ailleurs TuRDUS ou l’un de ses dérivés, par ex. TuRDuLUS > oc. ['turdu]. Ces deux bases se retrouvent dans toute la Romania. L’appellation grive, en revanche, est davantage localisée (gallo-roman) et a fait l’objet d’une controverse ; certains la rattachent à un adjectif exprimant la provenance de ce migrateur : ce serait GRAECUS, l’oiseau qui vient de Grèce, griva, gribo représentant la forme féminine de grieu « grec » ; d’autres y voient « l’oiseau tacheté », « l’oiseau criblé », gribo continuant une forme nominale construite sur CRIBR1RE « passer au crible, tamiser »17. C’est à peu près tout. Le bilan étymologique est néanmoins vécu comme satisfaisant puisque trois étymons sont identifiés TURDUS, MERULA et GRAECU, -A et attestés en latin. En outre l’évolution qui les mène jusqu’à fr. tourd, merle, grive, à l’it. tordo, merula ou à des dérivés tordena, tordola, à l’esp. tordo, merlo ne pose pas de problème grave. Seul le rapport qui relie grive à sa source n’est pas immédiat ; mais dans l’ensemble, le contrat étymologique, s’il est vrai qu’il se limite à identifier la source latine, à pointer des jalons historiques de la continuité de sa forme phonique et à s’assurer qu’il n’existe pas de rupture brutale entre ses emplois latins et ses emplois modernes est rempli18. On remarque néanmoins que les laissés pour compte sont nombreux ; on ne sait que peu de choses des sources des appellations françaises draine, litorne, mauvis ni d’appellations italiennes comme sassello ni a fortiori d’appellations dialectales comme oc. trida, turdre, cesèra, cors. tridzina … pour ne mentionner que les plus courantes ; et le peu que l’on « sait » est trop anecdotique pour n’être pas décevant : autant de principes explicatifs différents qu’il y a de cas d’espèces. Ainsi le tordo sassello serait « la grive de roche » (sassello continuerait SAXATILE) ; pourquoi pas ? Mais encore… Le nom de la trido serait onomatopéique : il est évident pour tout le monde que cette grive-là émet un son [trtr] ; le nom du turdre procèderait d’un croisement avec celui de la tourterelle (TURTUR)… Et même si l’on admettait de pareilles formes-sources, on n’aurait pas progressé d’un iota sur le signifié des noms de ces oiseaux. Benveniste (1966), dans les Problèmes sémantiques de la reconstruction, s’est attaché à dénouer les fils d’un problème du même genre, concernant les dénominations latines du cochon. Essayons de voir comment il a posé le problème. Dans le développement qu’il consacre à SUS et PORCUS, Benveniste conteste l’emploi attribué traditionnellement à ces deux mots, à savoir que SUS désigne l’animal sauvage tandis que PORCUS est réservé à l’animal domestique. La discussion dans laquelle il s’engage n’est donc pas complètement comparable à celle qui nous occupe dans la mesure où elle n’est pas à proprement parler, étymologique. Elle ne remet nullement en question l’existence d’une base étymologique SU- distincte d’une base PORCO- dont on retrouve des continuateurs tant pour l’une que pour l’autre, dans la plus grande partie du monde indo-européen. Toutefois ce que l’analyse révèle à ses yeux le conduit à mettre en doute les inférences qui découlent de ces emplois respectifs de SUS et PORCUS en matière de realia du monde IE, plus précisément de la domestication du porc dans cet espace et de la chronologie relative des faits.

24 Essayons d’établir ce qui est pertinent pour nous, à savoir sur quoi le raisonnement benvenistien s’appuie. Trois ordres de faits sont tour à tour allégués. Le premier résulte d’un examen minutieux des emplois respectifs de ces deux termes dans les textes et de l’éclairage contextuel éventuel. Il ressort de là, selon Benveniste, que SUS peut tout aussi bien que PORCUS désigner l’animal domestique. Celui-ci note alors que, s’il s’avère que SUS et PORCUS y sont effectivement devenus synonymes, le lexique latin se fait indûment redondant sur ce point. Ce qui conduit à une autre lecture du couple

Corpus, 12 | 2013 122

SUS/PORCUS en l’occurrence adulte/petit. Mais laissons le résultat pour focaliser sur la nature de l’argumentation. En quoi consiste ce contexte d’emploi ? Le contexte allégué peut être simplement l’entourage syntagmatique immédiat ; par exemple le fait que l’animal de lait est dit lactens porcus mais jamais *lactens sus. Il ne se limite néanmoins pas à cela ; il est fait aussi de corrélations. Benveniste remarque dans un chapitre du De Agricultura de Caton où se trouve décrit un protocole de sacrifice que « le sacrifice de fait comprend trois animaux, porcins, ovins, bovins mais si l’on compare les termes du sacrifice nominal : sus, ovis, taurus et ceux de l’offrande réelle : porcus, agnus, vitulus » on se rend compte que la distinction sus/porcus est du même ordre que celle que l’on observe dans ovis/agnus et taurus/vitulus à savoir adulte/petit. Enfin peuvent être mises à contribution des gloses ; on lit ainsi chez Varron : « porcus graecum est nomen… quod nunc eum vocant khoîron »19.

25 Laissons là le cas d’espèce et les détails. Le lecteur aura remarqué qu’on se trouve en présence dans l’argumentation sémantique de trois ordres de faits correspondant à des propriétés que le dialectologue connaît bien parce qu’il les rencontre dans l’espace en permanence : ce que nous avons appelé ‘la création lexicale par spécification d’un générique’ (qui débouche sur des oppositions privatives), la valeur structurale (qui procède des relations paradigmatiques oppositives) et ‘l’équivalence approximative’ (en acte dans toute traduction ou reformulation).

26 Ces propriétés sont à considérer à la fois dans une perspective synchronique et dans une perspective diachronique et éclairent chacune un pan du mécanisme de changement lexical. Qu’un besoin de distinction se manifeste, au terme générique s’adjoint une caractéristique : TURDUS, TURDUS MERULA. Que nous apprend une approche comparative du tissu dialectal moderne ? La difficulté est-elle moindre in situ ? Ne peut-on esquisser une représentation tant soit peu stable de ces oiseaux ? Que peuvent bien signifier ces mots trida, cesèra, sassello ? Guiraud a avancé l’idée, comme on vient de le voir, que la grive n’était autre qu’une « tachetée », une « criblée »20, ce en quoi il rejoint bien des impressions ou commentaires de connaisseurs21 : « les grives ont une moucheture particulière à laquelle les oiseleurs ont donné le nom de grivolure »22 ; d’autres témoignages présentent spontanément griolé comme équivalent de grivelé et de marbré ; ou encore grivoté comme équivalent de grivelé et de tacheté. La piste mérite donc indéniablement d’être suivie. Et très vite on se rend compte, à y regarder de plus près, que grive n’est pas la seule dénomination à s’articuler sur cette représentation. Les découvertes ne traînent pas : en premier lieu lat. TR3TUM est le supin d’un verbe TEReRE qui signifie « trier », plus précisément « frotter » (pour polir, pour séparer la balle du blé…)23 ; une trida (variante trio) ne serait-elle pas TR3TA une « triée », un genre de « passée au crible » ? En second lieu le sas (source latine SAETACIUM) « tissu de crin ou de soie entouré d’un cercle de bois qui sert à passer de la farine ou des liquides » n’est autre en afr. qu’un genre de tamis ou de filtre ; sasser signifie « passer au sas, au tamis »24 ; it. sassello ne serait-il pas un sassé, un genre de « criblé » ou de « tamisé » ? Et la cesèra ne serait-elle pas aussi une « tachetée », avec l’indication d’une tache de forme particulière, évoquant un pois chiche si l’on admet que ce mot repose sur une source latine CiCeR(A) « pois chiche » ? ne serait-elle pas la « grive à pois » ? Coïncidences ? Si un doute subsiste, il est aisé de le balayer, en montrant que ce jeu de représentations est récurrent. Il existe ainsi en français un autre couple nom-verbe dénominal équivalant à crible-cribler, passe-passer, sas-sasser, trie-trier : c’est tamis- tamiser (source STAMEN « chaîne [du métier vertical des tisserands anciens] », au pluriel étamines ; étamine est donné en afr. avec le sens de « tamis » (DAF) ; or il existe

Corpus, 12 | 2013 123

en langue d’oc un oiseau nommé tamisièr ; ce n’est pas une grive mais un oiseau de proie, un genre d’épervier ou d’émouchet, en d’autres termes un oiseau moucheté et cet épervier a pour nom dans la région de Nice l’escrivèu, qu’il faut entendre non pas comme en rapport avec « écrire » mais de nouveau comme le criblé (sur CRIBELLUM) ; son nom dans l’Isère est d’ailleurs la criblette. Cela ne s’invente pas : les faits sont massifs. Or ces propriétés sont autant de dimensions de la variation qui constituent l’ordinaire du dialectologue. Ce sont là des données incontournables en dialectologie et qui mériteraient d’être intégrées dans une modélisation du langage et de son développement. A ces variations sur l’image-source ne manquent pas de faire écho des variations des formes phoniques-sources complètement indépendantes25 pour lesquelles nous renvoyons le lecteur à Dalbera (2010). Une fois que l’on maîtrise le sémantisme fondamental et la matrice morphosémantique, on se rend compte que bon nombre d’appellations étranges se révèlent de fait banales, répétitives, mettant en jeu les mêmes ressorts mais ont été rendues méconnaissables à l’issue d’une sorte de balayage aléatoire effectué par la convention.

10. L’intégration et le redéploiement des dénominations dans le cadre de champs lexicaux instables

27 Une troisième dimension est en effet à prendre en compte dans un essai de reconstruction lexicale, dimension caractéristique et définitoire du langage : le caractère structural. Les dénominations ne s’empilent pas n’importe comment mais se composent, organisant ou ré-organisant temporairement des champs. A l’intérieur de ces champs jouent des distinctions, des oppositions comme dans l’univers phonématique : les unités se définissent négativement les unes par rapport aux autres, par opposition. On vient de voir un exemple caractéristique : le merle, en latin, dénommé « l’uni, le pur, le sans-mélange », l’oiseau au plumage uniforme ; cette appellation ne prend véritablement sens qu’à l’intérieur du domaine de définition des turdidés : toutes les grives sont tachetées sauf le merle. La pression paradigmatique se fait sentir d’emblée. Et ces champs sont susceptibles de se transformer à la suite d’une modification de telle ou telle de leurs unités constitutives (sortie d’usage, opacification, remotivation…). Il en résulte une dissociation du signe linguistique par rapport au référent qui parachève le processus d’arbitrarisation du signe. Le premier degré consiste, on l’a vu, en une inversion des rapports entre motivation et usage ; la convention d’usage prend progressivement le pas sur la motivation créatrice d’origine et finit par se substituer à elle. Le deuxième degré consiste en ce que le réseau de relations qui s’est constitué autour d’une notion et qui structure le champ lexical de celle-ci est l’objet, au cours de l’évolution, de métamorphoses consécutives notamment à l’introduction de signes nouveaux. L’entropie consécutive à leur irruption dans le champ engendre des réactions qui peuvent devenir des réactions en chaîne, par exemple un processus de type chaises musicales. Ce qui doit être souligné ici, c’est que le désordre créé par les réaménagements dans le cas de systèmes phonématiques prend une tout autre ampleur dès lors qu’on a affaire à des unités significatives. Que l’effet produit soit dans le premier cas, une « inversion de timbre » ou une perte de distinction de degré d’aperture cela interpelle le linguiste, cela peut intriguer quelques locuteurs perspicaces, mais cela n’a pas d’incidences autres. Tandis que lorsque c’est

Corpus, 12 | 2013 124

l’emploi et notamment la fonction référentielle qui est touchée, les choses sont pour les locuteurs beaucoup plus difficiles à admettre.

28 Tous ceux qui ont la curiosité de feuilleter des cartes d’atlas dialectaux sont surpris par la nature des dénominations (très variées) que connaît, par exemple tel ou tel animal. Deux points surtout les intriguent : le caractère « extravagant » de certaines dénominations et le caractère « contradictoire » de certaines autres. Le fait qu’un serpent comme l’orvet soit appelé ici ou là le serpent ver, le ver aveugle ou l’anguille de terre n’épate personne ; des appellations de ce même serpent comme salamandre ou scorpion (andalou [ehkur'pjon]) surprennent déjà davantage mais on reste dans le domaine du pensable car on pressent qu’il pourrait y avoir un trait en partage (le caractère dangereux ou venimeux par exemple) qui justifierait la métaphore ; mais quand cela devient [anvj'o] soit « vieil âne » comme cela arrive en certains points de l’aire dialectale francoprovençale ou cabra cega soit « chèvre aveugle » en certains points dialectaux portugais ou encore aniel soit « agneau » en certains points dialectaux catalans… on sort des limites de l’épure. C’est au cours de ces redéploiements que ces appellations déconcertantes apparaissent : les mots se repositionnent les uns par rapport aux autres, se réévaluent à l’aune des autres tandis que les référents demeurent. Il s’ensuit que la motivation d’un mot, si elle est restée perceptible, peut se trouver en porte-à-faux par rapport au référent : une poule, c’est initialement une petite (PULLUS, -A), un rejeton de gallinacées, l’adulte étant la géline (GALL3NA) ; mais si le champ se recompose avec notamment l’apport de poulette ou poussin (PULLICENUS), la petite (PULLA) se mue en fille-mère et en vient à se substituer à la géline dans son rôle de pondeuse et de couveuse. Bref, la poule réfère à la mère tout en signifiant l’enfant.

29 Ce troisième temps de mise sous tension de la structure lexicale, après la création sur fond de représentation motivée de l’univers et l’appropriation collective sous forme de convention sociale d’usage n’est pas le moins important tant s’en faut. Il est rendu particulièrement difficile à maîtriser par le fait que le paradigme dans lequel s’installent les signes nouveaux-nés est flou. Le jeu des oppositions n’est opératoire que lorsque les virtuels sont bien définis. Or on sait bien que les savoirs des locuteurs varient considérablement de l’un à l’autre. Un chasseur sera tenté de distinguer dans son tableau de chasse une draine d’une litorne ou d’un mauvis ; mais la plupart des citadins n’y verront que des grives et ce dans le meilleur des cas ; le berger sera attentif à l’âge de ses bêtes et se gardera de mettre dans le même sac l’anounge (la bête de l’année), la bima, celle qui a deux ans ou qui a porté deux fois et les autres mais les autres locuteurs ne verront dans tout cela que des moutons ; le petit prince de Saint- Exupéry dit : « dessine moi un mouton ! », et non un mouton d’un an. Le terme dit générique s’introduit ainsi dans le jeu lexical, générique relatif : draine, litorne, musicienne, mauvis à un niveau, subsumés par grive mais, à un autre niveau, grive, merle, étourneau subsumés par passereau etc. Par ailleurs, le générique est censé être le prototype ; mais le référent à quoi renvoie le terme qui sert de prototype n’est pas constant, n’est pas le même partout ; LA grive (tout court) c’est ici la musicienne, mais là-bas la draine qui s’est sédentarisée, qui est devenue la « grive de chez nous » lig. turlu nostral. Il n’en reste pas moins que les locuteurs savent confusément qu’ils ne savent pas, qu’ils ne connaissent que très peu les grives mais que d’autres savent, qu’il y a donc un univers de référence dans lequel ces oppositions jouent ; ils n’ignorent pas que le paradigme n’est pas clos.

Corpus, 12 | 2013 125

30 Récapitulons. Les spécificités de la reconstruction lexicale par rapport à l’étymologie classique peuvent donc se résumer comme suit :

31 – La reconstruction lexicale s’opère indépendamment sur l’un et l’autre des deux plans du signe ; ce faisant, jouant sur deux claviers au lieu d’un, elle multiplie les chances d’élucidation des cas dits obscurs et donne une assise plus solide aux résultats obtenus. Une telle mise à égalité du signifié et de la forme phonique dans l’investigation étymologique revient à réconcilier approches onomasiologique et sémasiologique.

32 – Elle est fondamentalement comparatiste, logiquement achronique et atopique mais reste malgré cela profondément ancrée dans le linguistique du fait de la masse de faits triés et traités au cours de la phase préliminaire ; le socle d’hypothèses motivationnelles est solidement enfoncé dans le terreau dialectal.

33 – Elle est structurale et conçoit les états successifs du système lexical comme autant de systèmes spécifiques.

34 – Elle ne renonce nullement à l’étymon, mais fait de celui-ci un mot-jalon matérialisé doté d’une forme phonique et d’un sens corrélé.

35 – Elle est falsifiable dans la mesure où elle prédit la récurrence : il est donc aisé d’établir si les sémantismes fondamentaux qu’elle croit pouvoir proposer gardent une validité en dehors des aires géographiques ou des époques où elles ont été avancées. Rien n’interdit de mettre au banc d’essai d’autres systèmes linguistiques extérieurs au périmètre de l’étude initiale les hypothèses sémantiques et phoniques.

36 La première page de ce texte laissait voir une discipline dialectologique défaite, moribonde, rognée de toutes parts par ses voisines ; au terme de sa trajectoire elle apparaît ragaillardie et ayant retrouvé une place de choix au sein des sciences de langage ; c’est elle en effet qui relance et supporte la sémantique lexicale (reconstruction du signifié à partir du motif utilisé comme clef) ; c’est elle qui lance l’idée d’une double reconstruction des deux plans du signe (effectuée de manière autonome sur chacun des deux plans) ; c’est elle enfin qui, à travers le caractère alternatif du changement lexical tantôt initié sémantiquement, tantôt impulsé phoniquement, jette les bases d’un lexique conçu comme le croisement de la sémasiologie et de l’onomasiologie.

BIBLIOGRAPHY

DICTIONNAIRES ET ATLAS

ALE : (1986-). Atlas Linguarum Europae. Assen-Maastricht, Van Gorcum, puis Roma : Istituto Poligrafico e Zecca dello stato.

ALiR : (1996-). Atlas Linguistique Roman. Roma : Istituto Poligrafico e Zecca dello stato.

DCECH : Corominas J. & Pascual J.A. (1980-91). Diccionario Crítico Etimológico Castellano e Hispánico. Madrid : Gredos.

Corpus, 12 | 2013 126

DELF : Bloch O. & Wartburg W von (1950-57). Dictionnaire étymologique de la langue française. Paris : PUF.

TDF : Mistral F. (1978). Lou Tresor dòu Felibrige ou Dictionnaire Provençal-Français. Aix-en-Provence.

OUVRAGES ET ARTICLES

Alinei M. (1980). « The structure of meaning revisited », Quaderni di Semantica I : 289-305.

Alinei M. (1984). Dal totemismo al cristianesimo popolare. Sviluppi semantici nei dialetti italiani ed europei. Alessandria : Edizioni dell’Orso.

Alinei M. (1994). « Trentacinque definizioni di etimologia ovvero : il concetto di etimologia revisitato », Quaderni di Semantica XV : 199-221.

Alinei M. (1996). « Aspetti teorici della motivazione », Quaderni di Semantica XVII : 7-17.

Alinei M. (1996a). Origini delle lingue d’Europa. I. Teoria della continuità. Bologna : Il Mulino.

Alinei M. (2000). Origini delle lingue d’Europa. II. Continuità del Mesolitico all’età del Ferro nelle principali aree etnolinguistiche. Bologna : Il Mulino.

Bartoli M. (1945). Saggi di linguistica spaziale. Torino : Rosenberg & Sellier.

Benveniste E. (1966). Problèmes de linguistique générale, T. 1. Paris : Gallimard.

Benveniste E. (1969). Le vocabulaire des institutions indo-européennes. 1. économie, parenté, société. Paris : Editions de minuit.

Blank A. (2001). « Pour une approche cognitive du changement sémantique lexical : aspect sémasiologique », in J. François (éd.) Théories contemporaines du changement sémantique. Louvain & Paris : Peeters (Mém. Soc. Ling. de Paris), 59-74.

Caprini R. (2001). « Synthèse romane de la chenille », in M. Contini & G. Tuaillon (éd.) Atlas Linguistique Roman II. Roma, IPZS, 61-87.

Caprini R. (éd.) (2003). Parole romanze. Alessandria : Edizioni dell’Orso.

Chambon J.P. & Lüdi G. (éd.), (1991). Discours étymologiques. Tübingen : Niemeyer.

Dalbera J.Ph. (1994). Les parlers des Alpes-Maritimes. Etude comparative. Essai de reconstruction. London : AIEO.

Dalbera J.Ph. (1997). « Dimension diatopique, ressort motivationnel et étymologie. A propos des désignations romanes de l’orvet », Quaderni di Semantica XVIII : 195-21.

Dalbera J.Ph. (2002). « La géolinguistique : un nouveau souffle », Revue Belge de Philologie et d’Histoire 80(3) : 831-849.

Dalbera J.Ph. & Dalbera-Stefanaggi M.J. (2003). « Onomasiologie, sémasiologie, étymologie. Le cas de baudroie, crapaud et autres enflures », in J.C. Bouvier, J. Gourc, F. Pic (éd.) Sempre los camps auràn segadas resurgantas. Toulouse : Méridienne, 89-100.

Dalbera J.Ph. & Dalbera-Stefanaggi M.J. (2003). « La petite bête qui monte, qui monte. La dimension motivationnelle dans la dénomination du petit. Etymologie et reconstruction lexicale », in R. Caprini (éd.) Parole romanze. Alessandria : Edizioni dell’Orso, 113-138.

Dalbera J.Ph. (2005). « The reproductive cycle of zoonyms », in A. Minelli, G. Ortalli, G. Sanga (éd.) Animal names. Venezia : IVSA, 293-306.

Dalbera J.Ph. (2006a). Des dialectes au langage. Une archéologie du sens. Paris : Champion.

Corpus, 12 | 2013 127

Dalbera J.Ph. (2006b). « Zoonymes et relations parentélaires : réflexions sur la belette. De l’étymologie à la reconstruction lexicale », Quaderni di Semantica XXVII : 225-251.

Dalbera J.Ph. (2010). « Etude des noms romans des grives, merles et autres étouneaux. Essai de reconstruction lexicale », Quaderni di Semantica XXXI/1 : 13-40.

Dalbera J.Ph. (2012). « En amont de la phonologie diachronique du galloroman : nouvelles approches de l’étymologie et du changement lexical », in T. Scheer, P. Sauzet, M. Barra-Jover, J.Ph. Dalbera, G. Brun-Trigaud (éd.) Approches de la linguistique gallo-romane. Saint-Denis : PUV, 347-367.

Dalbera J.Ph. (2012). « When Dialectology studies contribute to lexical semantics and to Etymology. The contribution of the Romance language area », in J. Berns, H. Jacobs, T. Scheer (éd.) and Linguistic Theory. Selected papers from’Going Romance’ Nice 2009. Amsterdam : Benjamins, 89-115.

Dalbera J.Ph (à paraître). « Synthèse des dénominations romanes de la grive », in M. Contini (éd.) Atlas Linguistique Roman. Roma : IPZS.

Guiraud P. (1964). L’étymologie. Paris : PUF.

Guiraud P. (1967). Structures étymologiques du lexique français. Paris : Larousse.

Guiraud P. (1982). Dictionnaire des étymologies obscures. Paris : Payot.

Koch P. (2001). « Pour une approche cognitive du changement sémantique lexical : aspect onomasiologique », in J. François (éd.) Théories contemporaines du changement sémantique. Louvain & Paris : Peeters (Mém. Soc. Ling. de Paris), 75-95.

Lamberterie Ch. de (2001). « Problèmes sémantiques de la reconstruction en indo-européen », in J. François (éd.) Théories contemporaines du changement sémantique. Louvain & Paris : Peeters (Mém. Soc. Ling. de Paris), 109-134.

Martinet A. (1955). Economie des changements phonétiques. Berne : Francke.

Martins A.M. & Vitorino G. (1984). « Les désignations de l’hirondelle dans les parlers romans », Géolinguistique 1 : 129-145.

Nyckees V. (2001). « Changement de sens et déterminisme socio-culturel », in J. François (éd.) Théories contemporaines du changement sémantique. Louvain & Paris : Peeters (Mém. Soc. Ling. de Paris), 31-58.

Rastier F. (2001). « De la sémantique cognitive à la sémantique diachronique : les valeurs et l’évolution des classes lexicales », in J. François (éd.) Théories contemporaines du changement sémantique. Louvain & Paris : Peeters (Mém. Soc. Ling. de Paris), 135-164.

Rousseau A. (2001). « L’évolution lexico-sémantique. Explications traditionelles et propositions nouvelles », in J. François (éd.) Théories contemporaines du changement sémantique. Louvain & Paris : Peeters (Mém. Soc. Ling. de Paris), 11-30.

Swiggers P. (1991). « Le travail étymologique : typologie historique et analytique, perspectives, effets », in J.P. Chambon, G. Lüdi (éd.) Discours étymologiques. Tübingen : Niemeyer, 29-45.

Zamboni A. (1972). « Sul friulano cidivoc », Studi mediolatini e volgare XX : 223-239.

NOTES

1. Swiggers (1991).

Corpus, 12 | 2013 128

2. Rousseau (2001 : 11). 3. Voir notamment Alinei (1984). 4. Nous nous trouvons là dans une position qui rappelle beauoup celle que préconise Benveniste (1969 I. :12); il s’agit, écrit celui-ci « par la comparaison et au moyen d’une analyse diachronique de faire apparaître une signification là où, au départ il n’y a qu’une désignation ». 5. Sur cette notion de cycle motivationnel, cf. Dalbera (2006a) : 23-27. 6. Le lecteur trouvera l’analyse des dénominations du martinet dans plusieurs textes, notamment Dalbera (2002, 2006). 7. Tous ces mots s’emploient pour désigner l’oiseau martinet. La traduction littérale des mots de cette série serait la suivante : « martinet », « martinet », « petit marteau », « arbaletier », « faucille », « barbier », « sbire », « sorte d’ogre » ou « petite bestiole ». 8. Littéralement « « racleur » ; mais l’image prend d’autant plus de consistance que le ramoneur se dit rasclo chamineio et que le martinet est souvent désigné comme l’hirondelle de cheminée. 9. Cf. Martins & Vitorino (1984 : 144). 10. Parallèle à lieu-dit. 11. Au terme d’une analyse comparative, précisément, cf. DCECH. 12. Pour une analyse plus complète, cf. Dalbera (2006a :109-125). 13. Le cas où elles en viennent à converger constitue l’attraction paronymique ; mais ce n’est pas le cas général. 14. Il s’agit là des types lexicaux. Pour une analyse plus précise incluant les variations, on se réfèrera à Dalbera (2009a) et (à paraître). 15. On pourra se référer, pour une étude détaillée à Dalbera (2010) et Dalbera (à paraître). 16. Ce problème a fait l’objet d’une conférence (Madrid 2007). Le texte est à paraître, accompagné de cartes dans le volume 3 de l’ALiR signalé dans la note qui précède. 17. Guiraud (1967 : 40-50). 18. On sait par ailleurs qu’il est assez courant de désigner un animal (ou un produit) à l’aide du nom de la contrée d’où il provient. 19. Benveniste (1969 : 29-30). 20. Guiraud (1967). 21. Cf Guiraud (1967 : 30-40). 22. Toussenel in Rolland (1967) : 234. 23. Il s’agit de la racine sur laquelle est forgé TRIBULUM > cors. tribbiu. 24. Cf. encore fr. ressasser (= « trier et retrier ») une idée. 25. Par exemple des fausses-coupes (litorne : étourneau, quino : turquino), des éléments adjoints (sassello : sansonnet), etc.

ABSTRACTS

The Path of Dialectology within Linguistics. From the Reconstruction of Dialectal Systems to Lexical Semantics and Etymology At a time when major works are tending to renew markedly a certain number of disciplines, including lexical semantics and diachronic lexicology, it seems relevant to carry out a review of another related discipline, dialectology, the central point of this issue of Corpus.

Corpus, 12 | 2013 129

The main object of dialectology is, in our opinion, the comparative study of languages that take the form of entities – let us call them dialectal languages – that are disseminated in geographical and/or temporal space. Our approach aims to demonstrate that they are linked to one another by a genetic relatedness, or more precisely to determine the degree of relatedness when this link is already an established fact. The modeling of these dialectal languages in the form of a correlation of features leads to the reconstruction of the dialectal set: the hypothesis of a protosystem and a body of rules of evolution whose combined application provides an account of the observable facts. However, this pattern –which is valid for phonological and morphological reconstructions– must be rearranged when entering the field of lexical reconstruction. This article is a discussion of the innovative contribution of dialectology to this problem.

A l’heure où des travaux importants tendent à renouveler sensiblement un certain nombre de disciplines, au nombre desquelles la sémantique lexicale et la lexicologie diachronique, il apparaît intéressant de faire le point au plan conceptuel sur une autre discipline connexe, la dialectologie, puisque celle-ci est au centre de ce numéro de Corpus. La dialectologie a pour objet majeur, à notre sens, l’étude comparative de langues qui se présentent sous forme d’entités disséminées – convenons de les appeler langues dialectales – dans l’espace géographique et/ou temporel. La démarche a pour ambition, ce faisant, de démontrer qu’elles sont, les unes avec les autres, dans un rapport de parenté génétique, ou plus précisément d’établir le degré de celle-ci lorsque la parenté est un fait déjà avéré. La modélisation de ces langues dialectales sous forme de corrélations de traits permet alors d’aboutir à la reconstruction de l’ensemble dialectal considéré : hypothèse d’un protosystème et de faisceaux de règles d’évolution dont l’application combinée rend compte des observables. Mais ce schéma, valide pour des reconstructions phonologiques et morphologiques, doit être réaménagé si l’on veut envisager des reconstructions lexicales. Cet article constitue une discussion sur l’apport novateur de la dialectologie à ce problème.

INDEX

Mots-clés: dialectologie, reconstruction, parenté génétique, langue dialectale, motivation, étymologie, sémasiologie, onomasiologie Keywords: dialectology, reconstruction, genetic relatedness, dialectal language, motivation, etymology, semasiology, onomasiology

AUTHOR

JEAN-PHILIPPE DALBERA Univ. Nice Sophia Antipolis, CNRS, BCL, UMR 7320, 06300 Nice, France

Corpus, 12 | 2013 130

Aréologie de la réduction vocalique incompatible avec le RF induit par l’accent dans les variétés italo- romanes

Jonathan Bucci

1. Introduction

1 Cet article se propose d’étudier deux processus phonologiques bien distincts qui sont la réduction des voyelles atones à schwa que l’on trouve dans certains dialectes italiens et le redoublement phono-syntaxique induit par l’accent (Raddoppiamento Fonosintattico), désormais RF. IL semblerait que l’existence de ces deux phénomènes (le RF induit par l’accent et la réduction vocalique) soit en distribution complémentaire puisque l’analyse du coratin permettrait de mettre en lumière la motivation structurelle de cette incompatibilité. Cette étude va mettre à jour et vérifier cette prédiction avec des données diatopiques. En effet, le coratin dispose d’une contrainte pour que les voyelles soient réalisées non réduites rendant le RF déclenché par l’accent incompatible avec ce type de dialectes.

2 Ce travail exposera dans un premier temps l’analyse du coratin afin d’en formuler les caractéristiques de ce système. J’exposerai ensuite le second processus et je proposerai une prédiction en m’appuyant sur l’analyse du coratin basé sur ses contraintes structurelles puisque d’après son analyse, le RF induit par l’accent ne pourrait être présent dans les systèmes à réduction vocalique.

3 En ce qui concerne la réduction vocalique qui touche un grand nombre de dialectes italo-romans1, je m’appuierai sur les données ainsi que sur l’analyse du coratin2 proposées dans Bucci (2009)3. La manifestation de cette réduction se traduit par la réduction à schwa de toutes les voyelles atones dans un certain nombre de contextes sauf /a/. La généralisation proposée par Bucci (2009) est la suivante : les voyelles d’avant /i,e/ et d’arrière /u,o/ atones ne se réduisent pas lorsqu’elles sont adjacentes à

Corpus, 12 | 2013 131

une consonne palatale (pour /i,e/) ou vélaire/labiale (pour /u,o/). Il y a donc deux contextes où les voyelles ne se réduisent pas : lorsqu’elles sont toniques et lorsqu’elles sont adjacentes à une consonne partageant une partie des mêmes traits articulatoires que l’on appelle mélodie. Puisque ces deux contextes ont le même effet, i.e. la non- réduction, on s’attend à ce qu’ils aient quelque chose en commun afin de réduire la disjonction.

4 L’analyse de Bucci (2009) s’appuie sur Honeybone (2005) qui montre que le partage de primitives mélodiques entre segments confère de la force contre les réductions. Ce partage, matérialisé en tant que structures branchantes, soulève des questions théoriques plus générales dans deux domaines : 1) l’identification de l’accent tonique en tant qu’espace syllabique (cf. Chierchia, 1986 ; Larsen, 1998 ; Ségéral & Scheer, 2008), et 2) la longueur dite virtuelle (Bendjaballah, 1998, 2001 ; Lowenstamm, 1996).

5 Concernant le second processus, i.e. le RF (Chierchia, 1986 ; Loporcaro, 1997a et section 10), il sera démontré dans cet article la prédiction suivante : le RF déclenché par l’accent n’est pas compatible avec les dialectes à réduction vocalique, ce qui implique qu’un système ne peut avoir les deux. En d’autres termes, nous verrons qu’il n’est pas possible de trouver du RF induit par l’accent dans l’aire qui connaît la réduction vocalique. Pour visualiser la diffusion de ces phénomènes dans la zone qui nous intéresse, je présenterai une carte inédite de réduction/maintien vocalique pour toutes les variétés italo-romanes, puis des données diatopiques provenant d’articles et de monographies concernant le RF.

6 Le but sera d’éprouver la prédiction pour toute l’Italie en se basant sur l’analyse d’un seul dialecte (le coratin), en confrontant celle-ci aux données diatopiques. Si la prédiction est vérifiée, on ne pourra pas combiner la réduction vocalique et le RF déclenché par l’accent puisque les deux processus sont en distribution complémentaire.

7 L’analyse des faits sera formalisée dans un modèle phonologique neutre en utilisant des points squelettaux X de type « autosegmental » à la manière de Chierchia (1986).

2. Inventaire segmental du coratin et suffixation

8 Les dialectes de type apulo-barese comme le coratin ont vingt-deux consonnes (1) et sept voyelles en position tonique (2). En positon atone, se trouvent seulement deux voyelles : schwa et a, cf. Valente (1975). (1) Les consonnes du coratin

labiales dentales palatales vélaires

sourde p t c k occlusives sonore b d ɟ ɡ

sourde t͡s t͡ʃ affriquées sonore d͡z d͡ʒ

sourde f s ʃ

Corpus, 12 | 2013 132

sonore v z

nasales m n ɲ

vibrante r liquides latérale l

(2) Les voyelles du coratin en position tonique

avant central arrière

i u

e o

ɛ ɔ

a

9 Afin de tester le comportement des voyelles en postion atone, Bucci (2009) a établi une base empirique4 constituée de paires d’items, chacune faite d’un mot isolé et d’un mot suffixé. En effet, en coratin, les suffixes étant toujours toniques, ces paires permettent d’observer la voyelle radicale sous l’accent (en isolation) et en position atone (forme suffixée). Cette alternance entre les réalisations tonique et atone d’une voyelle radicale est illustrée en (3).

3. La réduction des voyelles atones

10 Nous avons vu en introduction la généralisation suivante : toutes les voyelles atones se réduisent à schwa lorsqu’elles ne sont pas adjacentes à une consonne qui partage un trait mélodique, sauf la voyelle a (cf. Bucci, 2009 ; D’Introno & Weston, 2000). Les données suivantes permettront d’illustrer cette généralisation. En effet, en (4a) se trouvent les données concernant les voyelles postérieures o, u tandis qu’en (4b), les données concernent les voyelles antérieures i, e.

Corpus, 12 | 2013 133

11 La réduction des voyelles atones aperçue en section 3 n’opère pas lorsque la voyelle postérieure est adjacente à une consonne qui partage avec elle un trait mélodique (cf. Bucci, 2009 ; D’Introno & Weston, 2000), i.e. soit la labialité soit la vélarité. Il en va également ainsi pour les voyelles antérieures lorsqu’elles sont adjacentes à une consonne palatale, ainsi que pour la voyelle a5. Les données en (5a) illustrent le maintien des voyelles postérieures atones alors qu’en (5b), elles illustrent les voyelles antérieures atones.

Corpus, 12 | 2013 134

12 Nous avons vu en section 4 que les voyelles ne sont pas réduites dans deux contextes : lorsqu’elles sont toniques et lorsqu’elles sont atones mais adjacentes à une consonne qui partage un trait mélodique. Pour les voyelles d’arrière, il s’agit du partage de la labialité ou de la vélarité cf. (5a) alors que pour les voyelles d’avant, il s’agit du partage de la palatalité cf. (5b).

13 Puisque ces deux contextes produisent le même effet, ils doivent partager une propriété commune et c’est cette propriété que je me propose de découvrir dans la section suivante. Il faudra pour cela donner une interprétation structurelle à l’immunité des voyelles atones adjacentes à une consonne particulière ainsi qu’aux voyelles toniques.

5. Le partage rend plus fort

14 Honeybone (2005) montre que le partage de primitives mélodiques6 entre segments consonantiques permet de résister aux différentes lénitions. Dans le cas du coratin, ce partage opère entre segments consonantique et vocalique formant ainsi une structure branchante. Une voyelle impliquée dans une structure branchante est garantie contre la lénition, dont la réalisation en coratin est une réduction à schwa.

15 En coratin, les voyelles postérieures demeurent non réduites lorsqu’elles sont adjacentes à une consonne labiale ou vélaire. Si les voyelles d’arrière réagissent de manière uniforme à ces deux catégories de consonnes, c’est qu’elles partagent une primitive mélodique avec ces dernières. En (6a) est représenté le partage de la primitive mélodique de la labialité (U) entre une consonne labiale m et une voyelle labiale atone o. Cette voyelle atone n’est pas réduite – étant associée à deux points squelettaux, alors qu’en (6b), la voyelle d’avant atone i, ne partageant pas de mélodie avec la consonne précédente m, est réduite à schwa puisqu’elle est associée à un seul point squelettal.

Corpus, 12 | 2013 135

6. Identification des voyelles toniques

16 Le second contexte de maintien se présente lorsque les voyelles sont toniques. Nous savons maintenant que les structures branchantes sont une garantie contre les réductions et que s’il n’y a qu’une cause contre la réduction, on en déduit que les voyelles toniques sont également des structures branchantes qui sont associées à deux points squelettaux.

17 Or, une voyelle qui branche est une voyelle structurellement longue : les voyelles toniques sont donc longues. Ce processus d’allongement tonique est bien connu puisqu’il est attesté que l’accent peut allonger les voyelles comme en italien (cf. D’Imperio & Rosenthall, 1999 ; Fava & Magno Caldognetto, 1976) et par exemple en islandais (cf. Gussmann 2006).

18 Pour la représentation de l’accent tonique, je suis [Chierchia, 1986 ; Larsen, 1998 et Ségéral & Scheer, 2008] qui proposent qu’il se matérialise en tant qu’espace syllabique formalisé par une unité [X] vide. Dans ce cadre, les voyelles en coratin branchent sur cet espace.

19 Une question se pose sur cet espace syllabique. En effet, il est primordial de savoir si cette unité vide est insérée à droite ou à gauche. Ségéral & Scheer (2008) ont observé que les effets de l’espace supplémentaire s’observent tantôt à gauche, tantôt à droite de la voyelle tonique. En revanche, l’effet de l’espace syllabique supplémentaire en coratin se produit à droite de la voyelle tonique et par conséquent, l’unité [X] accentuelle est insérée à sa droite, cf. (7a).

Corpus, 12 | 2013 136

20 En (7a), l’espace apporté par l’accent est inséré à droite de la voyelle tonique permettant ainsi à celle-ci de brancher et de se réaliser pleine, et donc d’être maintenue. En l’absence d’espace fourni par l’accent comme en (7b), la voyelle ne peut pas brancher et demeure brève, d’où sa réduction à schwa.

21 Il est indispensable de noter que dans les termes de cette analyse, le schwa n’est que de surface : lorsque le /u/ sous (7b) est atone, il s’agit toujours d’un u dans la représentation phonologique puisque son identité mélodique n’a pas été modifiée par la computation phonologique. En revanche, ce n’est que lors de l’interprétation phonétique de la structure phonologique qu’il est paramétriquement spécifié, en coratin, qu’une voyelle brève est prononcée schwa (cf. Cyran, 2012 ; Gussmann, 2007 ; Scheer, 2010).

22 La question qui se pose concernant la situation décrite supra est de savoir comment il peut y avoir des voyelles longues dans un système qui ne connaît pas d’opposition de longueur. La section 7 traitera de cette perspective nommée la « longueur virtuelle » et nous verrons que c’est justement parce qu’un système ne possède pas d’opposition de longueur en surface qu’il peut distinguer des longues et des brèves en phonologie. En outre, l’opposition de quantité n’est pas signalée par de la longueur en surface mais par un autre marqueur, ici, la (non) réduction à schwa.

7. La longueur virtuelle

23 Cette perspective suppose qu’il y a une différence entre la représentation phonologique d’un objet et sa réalisation phonétique. En effet, l’analyse proposée est basée sur des structures où l’opposition de longueur est définie dans les représentations phonologiques qui ne se réalisent pas comme de la longueur en surface.

24 L’idée qu’une différence phonétique donnée puisse réaliser une opposition de longueur en surface a été introduite par Lowenstamm (1991). Cette longueur phonologique qui se réalise en surface autrement que par de la longueur est appelée longueur virtuelle. Cette virtualité de longueur peut toucher aussi bien les consonnes que les voyelles.

25 La différence entre voyelles pleines et voyelles réduites en tant qu’exposant de la longueur vocalique a été documentée en afro-asiatique par Lowenstamm (1991) pour le sémitique, Bendjaballah (1998, 2001) ; Ben Si Saïd (2011) pour le berbère kabyle et Lahrouchi & Ségéral (2009, 2010) pour le berbère tashelhiyt.

26 En ce qui concerne les consonnes, des géminées phonologiques peuvent être signalées en surface, par autre chose que la durée (cf. Lowenstamm 1996). Il en est de même pour l’anglais (cf. Hammond 1997) ; pour l’allemand (cf. Caratini 2009) et pour le somali (cf. Barillot & Ségéral 2005). Enfin on retrouve cette longueur virtuelle dans l’analyse de Curculescu (2011) de l’islandais et des dialectes andalous où la pré-aspiration est la manifestation en surface de géminées phonologiques.

27 En outre, la condition pour l’existence de la longueur virtuelle est l’absence d’une opposition basée sur la durée en surface. Une langue qui oppose en surface des voyelles longues et brèves ne peut pas avoir de la longueur phonologique, i.e. une structure branchante.

28 Le système du coratin remplit donc les conditions pour l’accommodement de voyelles longues virtuelles puisqu’il n’y a pas d’opposition basée sur la quantité vocalique en

Corpus, 12 | 2013 137

surface. Pour résumer, en coratin, les voyelles sous-jacemment longues sont réalisées pleines tandis que les voyelles sous-jacemment brèves sont réalisées schwa, cf. (8) :

8. Représentation du maintien et de la réduction

29 Considérons à présent la représentation des deux cas où la réduction n’opère pas, c’est- à-dire lorsque la voyelle est tonique (9a) et lorsqu’elle est adjacente à une consonne avec laquelle elle partage de la mélodie (9b).

30 En (9a), la voyelle tonique branche sur l’espace apporté par l’accent, ce qui induit une réalisation de surface pleine. En (9b), la voyelle u du radical ne branche plus sur l’espace accentuel, l’accent étant sur le suffixe, mais sur la consonne suivante puisque le trait labial est partagé par les deux segments. En (9a) et (9b), la nature du branchement n’est pas la même mais le résultat est identique : une voyelle virtuellement longue est réalisée pleine en coratin.

31 Il s’agit maintenant de représenter en (10) le sort d’une voyelle atone qui ne partage aucune propriété avec les consonnes adjacentes.

Corpus, 12 | 2013 138

32 En (10a), la voyelle e peut brancher sur l’espace apporté par l’accent, d’où sa réalisation pleine, alors qu’en (10b), la voyelle du radical ne peut plus brancher sur l’espace accentuel puisque celui-ci est occupé par le suffixe et qu’aucun trait mélodique n’est partagé avec la consonne adjacente. La voyelle est donc phonologiquement brève et par conséquent se réalise schwa.

9. Dialectes à réduction vs dialectes à non réduction

33 Il est bien connu en Italie que les dialectes à réduction vocalique sont regroupés dans la partie centrale de l’aire méridionale alors que dans le reste de l’Italie, la réduction n’opère pas (cf. Loporcaro 1997b).

34 Partons du principe que tous les dialectes à réduction fonctionnent comme dans l’analyse du coratin présentée supra et résumée en (11a). Alors, les dialectes à non réduction vocalique en position atone se comporte de la manière résumée en (11b).

35 Nous connaissons maintenant les caractéristiques des deux types de dialectes, il convient maintenant de décrire le second phénomène qui est le « raddoppiamento fonosintattico ».

Corpus, 12 | 2013 139

10. Le « raddoppiamento fonosintattico »

36 Le raddoppiamento fonosintattico (RF) est un processus de sandhi externe qui se manifeste, dans une séquence de mot1 + mot2, par le redoublement de la consonne initiale du second mot causé par le premier mot (cf. Agostiniani, 1992 ; Chierchia, 1986 ; Loporcaro, 1997b)7. Ce processus est surtout connu en toscan. Les déclencheurs en italien standard sont listés en (12) :

37 Le RF en (12a) et (12b) consiste en un redoublement prosodique qualifié de régulier puisqu’il s’applique sur la base d’une règle phonologique : le RF est provoqué par des mots finissant par une voyelle accentuée. Alors qu’en (12c) et (12d), le RF est de type lexical8 et qualifié d’irrégulier. Ce RF irrégulier de type lexical apparaît dans une liste fermée de mots comme des prépositions, des formes d’auxiliaires, des conjonctions, etc., et n’est pas provoqué par une règle phonologique contextuelle. D’après Loporcaro (1997a), les cas (12a) et (12b), i.e. le RF régulier, constituent une catégorie ouverte et productive de mots devant être conforme à la règle phonologique (oxyton).

38 Je qualifierai le RF de (12a) et (12b) de RF accentuel puisqu’il est déclenché par l’accent final du mot 1 (oxyton) et le RF (12c) et (12d) de RF lexical puisque le redoublement de la consonne du mot 2 apparaît après une liste fermée de mots qui ont un pouvoir déclencheur du RF.

10. Prédiction à l’appui du coratin

39 Nous avons vu précédemment que l’accent tonique est matérialisé par de l’espace syllabique (une unité [X]) inséré à droite de la voyelle concernée. Nous savons que les voyelles toniques sont réalisées pleines tout comme les voyelles atones adjacentes à une consonne qui partage de la mélodie avec elles : la voyelle branche sur l’espace

Corpus, 12 | 2013 140

apporté par l’accent ou sur la mélodie de la consonne adjacente permettant ainsi l’immunité contre la réduction à schwa.

40 La prédiction réalisée à l’appui du coratin est que l’espace apporté par l’accent est en compétition soit avec la voyelle du radical, soit avec la consonne du mot suivant pour le déclenchement du RF par les oxytons.

41 Dans le cas des dialectes à réduction, il ne pourrait pas y avoir de RF déclenché par l’accent puisque l’espace accentuel est déjà utilisé pour le branchement de la voyelle tonique. En effet, le RF ne devrait pas être déclenché par l’accent dans ce type de dialectes puisque c’est la voyelle du radical qui gagne la compétition pour le branchement : une voyelle tonique (dans ces dialectes) doit brancher sur l’espace accentuel apporté par l’accent pour se réaliser pleine et par conséquent, la consonne du mot suivant ne peut plus brancher dessus pour être redoublée.

42 En revanche, dans le cas des dialectes à non réduction, l’analyse devrait être compatible avec le RF déclenché par l’accent. En effet, l’espace apporté par l’accent n’est pas utilisé par la voyelle tonique du radical, ce qui permet ainsi à la consonne du mot suivant de brancher et de rédupliquer.

43 Il s’agit bien évidemment d’une prédiction posée à partir de l’analyse d’un seul dialecte (le coratin) et il serait hasardeux d’en faire une généralisation pour toutes les variétés italo-romanes, soit une centaine de systèmes différents du coratin. L’objectif est de montrer ici avec des données diatopiques que la prédiction est valable, i.e. qu’un système ne peut pas combiner la réduction vocalique et le RF déclenché par l’accent, cf. (13a) et (13b).

44 En (13a), nous sommes en présence d’un dialecte à réduction comme le coratin où les voyelles ont besoin de brancher sur deux points squelettaux (X) pour être réalisées pleines. Il y a donc une compétition pour l’espace syllabique apporté par l’accent ([X]) entre la voyelle accentuée du radical ɛ et la consonne du mot suivant k. La voyelle doit brancher pour se réaliser pleine, i.e. ɛ, impliquant que la consonne du second mot ne peut pas brancher et rédupliquer puisque l’unité [X] accentuelle est déjà utilisée. Le RF déclenché par l’accent ne peut avoir lieu d’après la prédiction.

Corpus, 12 | 2013 141

45 Inversement, en (13b), il s’agit d’un dialecte à non réduction comme le florentin où les voyelles n’ont pas besoin de brancher sur deux points squelettaux pour se réaliser pleines. Ainsi, l’espace apporté par l’accent ([X]) n’est pas utilisé par la voyelle ɛ, ce qui permet alors à la consonne k du mot suivant de brancher dessus et de rédupliquer. Ici, suivant la prédiction, le RF déclenché par l’accent peut opérer.

46 En ce qui concerne le RF déclenché lexicalement (12c-d), il s’agit d’une liste fermée de mots (non oxytons) ayant un pouvoir déclencheur du redoublement de la consonne initiale du second mot. Dans ce contexte, ce ne peut pas être l’espace syllabique apporté par l’accent qui permette ce déclenchement.

47 En revanche, ces déclencheurs de RF possèdent une unité (X) vide en fin de mot, encodée lexicalement, lui donnant cette identité de déclencheur lexical. Si on suit la prédiction, on comprend pourquoi ces items permettent le redoublement de la consonne initiale du mot 2, cf. (14).

48 En (14), on voit que c’est l’unité (X) contenue à la fin du déclencheur lexical qui permet à la consonne initiale du mot suivant de brancher et de redoubler. Dans cet exemple, nous sommes en présence d’un dialecte à non réduction puisque l’unité accentuelle [X] n’est pas utilisée. Le RF lexical est compatible avec les dialectes à réduction dans la mesure où l’unité [X] est propre aux déclencheurs lexicaux et que celle-ci n’est jamais utilisée. Cela implique que le branchement de la consonne du mot suivant peut opérer.

49 Pour récapituler :

50 - les dialectes à réduction ne sont pas compatibles avec le RF induit par l’accent, MAIS compatibles avec le RF lexical ;

51 - les dialectes à non réduction sont compatibles avec le RF induit par l’accent et avec le RF lexical.

11. Distribution géolinguistique des zones de réduction / non réduction

52 En Italie, la distribution géolinguistique des dialectes à réduction vocalique en position atone concerne l’aire méridionale centrale alors que pour le reste de la péninsule, la réduction n’opère pas. Ces propositions sont issues de recherches exclusivement basées sur l’Atlante Linguistico Italiano9 (ALI) qui contient 1064 points d’enquête.

53 En effet, j’ai sélectionné un nombre important de cartes afin de tester les contextes de maintien et de réduction des voyelles atones10 dans le but de délimiter les aires de réduction11 et de non réduction. Il est attesté que dans beaucoup de dialectes italo- romans, les voyelles se réduisent en position atone, comme c’est le cas en coratin. La carte présentée en annexe permet de mettre en évidence la zone de réduction (en rose) et la zone de non réduction (en bleu). Sur ces cartes, on trouve également l’isoglosse

Corpus, 12 | 2013 142

(tracé en vert) La Spezia-Rimini (cf. Rohlfs 1966-1969) ou Massa-Fano (cf. Pellegrini 1977) délimitant les dialectes italo-romans du nord et ceux du centre et du sud. De plus, au sud de cette isoglosse, on trouve du RF alors qu’au nord, ce phénomène n’est pas attesté.

54 Si on suit la prédiction posée en section 10, dans la zone rose où la réduction opère, nous devons vérifier qu’il n’y a pas de RF déclenché par l’accent. En revanche, on peut y trouver du RF lexical. Dans la zone bleue, si la prédiction est correcte, on pourrait trouver du RF déclenché par l’accent, puisque l’unité [X] accentuelle n’est pas utilisée, mais aussi du RF lexical. La partie suivante va permettre de vérifier si la prédiction est compatible ou non avec les données dialectales.

12. Les données du RF

55 Avant de passer en revue les données concernant le RF, il est impératif d’expliciter la manière dont j’ai identifié le RF lexical. En effet, nous avons vu en note 7 que les déclencheurs lexicaux ne sont pas les mêmes d’un dialecte à l’autre. Dans certains cas, le choix peut s’avérer délicat. Je présente en (15) la démarche qui me permet de lever l’ambigüité.

56 Toutes les données utilisées dans les sections 1.2.1 et 1.2.2 sont exclusivement issues d’articles ou de monographies. Les raisonnements sont basés uniquement sur ces données. Pour certaines localités, les données peuvent être incomplètes.

1.2.1 Les données dans la zone de maintien

57 Dans la zone bleue de maintien, on trouve les données suivantes concernant le RF classées par région :

58 Dans la région de la Toscane, en florentin, on trouve du RF déclenché par l’accent comme par exemple [fˈɔmmˈale] « je fais mal » ; [venderˈattutto] « il vendra tout ». Il existe également, du RF lexical tel que [kˈomeffare] « comment faire ».

Corpus, 12 | 2013 143

59 A Lucques, il semble au prime abord y avoir du RF déclenché par l’accent comme [kosˈ ittardi] « si tard », [tʃittˈappulˈita] « ville propre », mais ce n’est pas le cas d’après la méthode d’identification du RF proposée en (15). En effet, dans [kˈisˈɛnte] « qui entend », l’accent ne déclenche pas le RF. Cet exemple est l’argument pour justifier que le RF à Lucques est déclenché lexicalement et non accentuellement (cf. Agostiniani, 1992 ; Loporcaro, 1997b).

60 On détecte également à Pise et Livourne du RF déclenché par l’accent comme dans [t͡ʃitt ˈavviʃˈɪne] « ville proche ». Puis également du RF lexical comme [kˈomeppontedˈæra] « comme Pontedera » (cf. Giannelli 2000).

61 A Arezzo, se trouve du RF accentuel, comme dans [mand͡ʒˈannamˈela] « manger une pomme », mais à Borgo San Sepolcro, plus à l’est, le RF accentuel n’opère pas. En effet, même si est attesté [fˈiffɛsta] « faire la fête », celui-ci est en réalité un RF lexical puisque nous avons relevé aussi [ˈɔkompro] « j’ai acheté » et [sarˈakostˈɛto] « il coûtera » (cf. Mattesini 1976).

62 A Sienne, le RF déclenché par l’accent est bien attesté : [apparlˈassikkˈeppˈɔssandi…] « à se parler pour qu’ils puissent dire… », […diɸarl'arebˈɛneperˈɔnnˈommiriɛʃʃˈe…] « de parler bien, en revanche je ne peux pas… » vs [pˈarlasˈɛmpre] « il parle toujours » (cf. Giannelli 2000).

63 Dans le Lazio, pour les variétés de Rome, il existe aussi du RF accentuel [vorˈapparlˈare] « il voudra parler », [pijˈakkwadrˈiːni] « prendre l’argent », mais [spˈɛnneɡwadrˈiːni] « dépenser de l’argent ». Le RF lexical opère également : [kˈomekkrˈisto] « comme le Christ » (cf. Loporcaro 1997b).

64 Dans la région d’Ombrie, à Città di Castello, d’après Moretti (1987), il y a une perte totale du RF ainsi qu’à Ancône (Marches), cf. Parrino (1967).

65 A Pérouse et l’aire environnante, on trouve du RF lexical, bien qu’on puisse croire a priori à un RF accentuel : [lɔfˈappertˈe] « je les ai fait pour toi ». En effet, il ne peut s’agir d’un RF accenuel car il se trouve des oxytons qui ne déclenchent pas le RF (['ɛd͡ʒˈitvˈia] « il est parti ») et des déclencheurs lexicaux [akkˈasa] « à la maison » (cf. Agostiniani, Castelli, & Bonucci, 1997 ; Moretti, 1974).

66 A Spoleto, il n’y a pas de RF accentuel puisque l’on dit [ˈɔfˈattu] « j’ai fait » face à [papˈ ammˈia] « mon papa » qui est en réalité ici un déclencheur lexical, comme dans [keffˈai] « qu’est-ce tu fais » (cf. Moretti 1987).

67 Dans la région des Marches, à Macerata, le RF induit par l’accent est inopérant [ˈaðitto] « il a dit », ce qui indique donc que dans [trˈɛddonne] « trois femmes », [trˈɛ] est un déclencheur lexical ainsi que [a] dans [akkˈasa] « à la maison » et [kˈome] dans [kˈ omemmˈe] « comme moi » (cf. Parrino 1967). En revanche, à Ascoli Piceno, le RF accentuel opère bien [aðˈebbˈello] « c’est beau » (cf. Tropea 1975). 68 A Servigliano, il n’y a pas de RF acentuel malgré les formes [lupatrˈobbˈonu] « le bon patron » ; [ˈebbˈitti] « je vois » puisque d’après Camilli (1929), [perˈo] et [perkˈe] ne déclenchent pas le RF alors qu’ils sont oxytoniques.

69 Au Nord de la Sardaigne, plus précisément à Porto Torres, il y a du RF déclenché par l’accent [ˈɛɖɖuvˈadd͡zi] « il fait » mais aussi du RF lexical [tuffˈai] « tu fais ». Il en va de même à Santa Teresa di Gallura avec du RF accentuel [kˈavvˈˈɛni] « qui viens » [ajˈo vvˈ ɛːni] « viens » et du RF lexical [kˈɔzaˈɛːniaffˈakkˈiːtʃi] « qu’est-ce que tu viens faire ici » (cf. Loporcaro 1997b).

Corpus, 12 | 2013 144

70 Dans cette zone bleue de maintien, on observe avec les données présentées supra que se manifestent du RF accentuel et du RF lexical, et dans certaines localités, uniquement du RF lexical.

71 Dans la région du Salento situé en zone méridionale extrême, d’après Fanciullo (1986), il n’y a pas de RF induit par l’accent : [totˈovˈɛne] « Toto vient » ; [kruʃʃˈɛpitt͡ʃˈinu] « petit crochet ».

72 En Calabre, à Pazzano, le RF accentuel ne fonctionne pas ([lattˈikarabbiniˈeri] « les autres carabiniers ») malgré la forme [trˈimmila] « trois milles » et le RF lexical attesté dans [ammˈanu] « à main » (cf. Falcone 1976). 73 A Cosenza et Catanzaro, l’accent ne déclenche pas le RF : [mand͡ʒˈaːvass'ɛmbre] « il mangeait toujours » (cf. Rohlfs 1982).

1.2.2 Les données dans la zone de réduction

74 Dans la région de Campagnie, en napolitain, les données comme [kafˈɛpavˈaːtə] « café payé » ; [fərnˈisubbətə] « finir tout de suite », montrent qu’il n’y a pas de RF accentuel. En revanche, le RF lexical est présent : [kəbbˈeːkkə] « que vois-je ? » (cf. Andalò & Bafile, 1991 ; Bafile, 1997).

75 A San Leucio del Sannio, d’après Iannace (1983), on ne trouve pas de trace de RF déclenché par l’accent, mais uniquement du RF lexical [iffˈemənə] « les femmes ».

76 Dans la région des Abruzzes, plus précisément pour les dialectes de l’aire de Teramo, d’après Passino (2012), le RF induit par l’accent n’est pas attesté. On ne trouve que du RF lexical.

77 Dans la région des Pouilles, à Molfetta, le RF par accentuel n’est pas actif [perˈɔtə fat͡ʃəvə] « mais il/elle te faisait… », [parlˈaku] « parler du… », alors que le RF lexical existe [rərrˈoesə] « les roses », cf. Merlo (1917). 78 A Altamura, les données telles que [fatiˈɔpˈɪkkə] « il travailla peu », [pətʃˈedˈɛrmə] « pourquoi dors-tu ? » montrent que le RF n’est pas déclenché par l’accent malgré [trˈɛ kkˈɛin] « trois chiens » qui est en réalité encore un déclencheur lexical (cf. Loporcaro 1994).

79 A Corato, d’après mes données personnelles, le RF n’est pas déclenché par l’accent [kaff ˈɛkˈallə] « café chaud », mais l’on trouve du RF lexical : [apprəvˈa] « à essayer ». 80 A Foggia, d’après les cas tels que [indˈosəpˈɔlkrə] « dans la tombe », le RF n’est pas déclenché par l’accent, mais on trouve du RF lexical comme dans [effat͡ʃˈevə] « et il faisait » (cf. Valente 1975).

81 A Bitonto, toujours d’après Valente (1975) dans les données suivantes comme [spənd ˈalaɡrəddˈani͡ə] « pousser le raisin aigre » ; [traspərtˈanavˈɔltə] « transporter une fois », l’accent ne déclenche pas le RF mais il existe du RF lexical : [rəssˈulfə] « le souffre ».

82 A Canosa di Puglia, seul le RF lexical est présent avec [trˈekkuˈattəpərsˈonə] « trois, quatre personnes » et on voit qu’il n’est pas déclenché par l’accent : [appid͡dʒˈalˈakkuə] « à prendre l’eau » (cf. Valente 1975).

83 A Grumo Appula, toujours d’après les données de Valente (1975), dans [st'atˈerrə] « cette terre », le RF n’est pas déclenché par l’accent mais le RF lexical est attesté : [attˈ utte] « pour tous ».

Corpus, 12 | 2013 145

84 Il en va de même à Bari, d’après Valente (1975), où le RF accentuel n’est pas attesté12 et seul se manifeste le RF lexical : [abbˈurdə] « à bord ».

85 Dans la Basilicate, à Rionero in Vulture, c’est la même situation avec du RF lexical, mais pas de RF accentuel : ([att◌͡ʃamˈaziiˈanətə] « à appeler ta tante », [paɡˈalaffˈittə] « payer la location » (cf. Lüdtke 1979).

86 A Senise, le RF lexical est également présent, mais pas le RF accentuel : [appid͡dʒˈal ˈakkuə] « à prendre l’eau », [trˈekkuˈattəpərsˈonə] « trois, quatre personnes », [abbˈ uddə] « à bouillir » (cf. Lüdtke 1979). 87 A Trebisacce, l’accent ne déclenche pas le RF [mand͡ʒˈaːvəss'ɛmbə] « il manɡeait toujours », cf. Rohlfs (1982).

1.2.3 Récapitulatif des données

88 En zone de maintien (cf. 1.2.1), on voit que l’on trouve du RF accentuel, mais pas obligatoirement. En effet, certains dialectes n’ont que le RF lexical.

89 En zone de réduction (cf. 1.2.2), les données montrent qu’il n’y a jamais de RF accentuel, mais seulement du RF lexical.

90 Sur la carte, les symboles représentés par un rond correspondent aux localités où l’on trouve du RF déclenché par l’accent alors que les croix correspondent aux localités où il n’y a pas de RF accentuel.

13. Conclusion

91 Les données vues en section 12 ainsi que la carte en annexe montrent qu’il n’y a pas de RF induit par l’accent en zone de réduction. La prédiction phonologique basée sur l’analyse du coratin se révèle exacte. En effet, les dialectes à réduction ont besoin de l’espace apporté par l’accent pour que la voyelle puisse brancher et se réaliser pleine, ce qui implique qu’ils ne sont pas compatibles avec le RF déclenché par l’accent tonique finale du mot 1 (cf. section 10). En ce qui concerne les dialectes à non réduction, d’après la prédiction, ils sont compatibles avec le RF accentuel et le RF lexical. Nous avons vu dans les données que c’est le cas. En revanche, les données montrent qu’un dialecte à non réduction n’a pas forcément de RF déclenché par l’accent, mais cela ne va pas à l’encontre de la prédiction puisque dans ce cas, l’espace accentuel [X] reste inutilisé.

92 Maintenant que les faits légitiment la prédiction, l’analyse du coratin qui a été étendue à tous les dialectes italo-roman a permis de faire une généralisation sur l’incompatibilité de la réduction et du RF accentuel dans toute l’Italie. Cette étude permet également de donner un argument supplémentaire concernant l’analyse du maintien/réduction vocalique en coratin mais aussi pour les autres dialectes qui se comportent de la même manière.

Corpus, 12 | 2013 146

Annexes

BIBLIOGRAPHY

Absalom M. & Hajek J. (1997). « Raddoppiamento sintattico : what happens when the theory is too tight ? », in M. Bertinetto et al. (éd.) Certamen Phonologicum III. Torino : Rosenberg & Sellier, 159-179.

Absalom M. & Hajek J. (1998). « Review of M. Loporcaro (1997). L’origine del raddoppiamento fonosintattico : saggio di fonologia diacronica romanza. Basel & Tübingen : Francke Verlag », Phonology 15(2) : 272-277.

Agostiniani L. (1992). « Su alcuni aspetti del “rafforzamento sintattico” in Toscana e sulla loro importanza per la qualificazione del fenomeno in generale », Quaderni del Dipartimento di Linguistic 3 : 1-28.

Agostiniani L., Castelli M. & Bonucci P. (1997). « Osservazioni su un fenomeno di sandhi nel parlato perugino », in L. Agostini et al. (éd.) Atti del Terzo Convegno della Società Internazionale di Linguistica e Filologia Italiana (Perugia, 27-29 giugno 1994). Napoli : Edizioni scientifiche italiane, 3-29.

Andalò A. & Bafile L. (1991). « On some morphophonological alternations in Neapolitan dialect », in P.M. Bertinetto et al. (éd.) Certamen Phonologicum II. Torino : Rosenberg & Sellier, 247-257.

Corpus, 12 | 2013 147

Anderson J. & John C. (1974). « Three theses concerning phonological representations », Journal of Linguistics 10 : 1-26.

Backley P. (2011). An Introduction to Element Theory. Edinburgh : Edinburgh University Press.

Bafile L. (1997). « L’innalzamento vocalico in napoletano : un caso di interazione fra fonologia e morfologia », in L. Agostiniani et al. (éd.) Atti del Terzo Convegno della Società Internazionale di Linguistica e Filologia Italiana. Napoli : Edizioni Scientifiche Italiane, 127-148.

Barillot X. & Ségéral P. (2005). « On phonological processes in the “3rd conjugation” of somali », Folia Orientalia 45 : 115-131.

Ben Si Saïd S. (2011). « Interaction between structure and melody : the case of Kabyle nouns », in K. Debowska-Kozlowska & K. Dziubalska-Kolaczyk (éd.) On words ans Sounds : A Selection of Papers from the 40th PLM 2009. Cambridge : Cambridge Scholars Publishing, 35-47.

Bendjaballah S. (1998). « Aspects apophoniques de la vocalisation du verbe berbère (Kabyle) », in P. Sauzet (éd.) Actes des colloques Langues et Grammaire 2 & 3 (1995, 1997). Paris : Université Paris 8, 5-24.

Bendjaballah, S. (2001). « The Negative Preterite in Kabyle Berber », Folia Linguistica 34 (3-4) : 185-223.

Borelli D. (2002). Raddoppiamento Sintattico in Italian : a cross-dialectal diachronic and synchronic study. London and New York : Routledge.

Bucci C. (1982). Dizionario etimologico coratino. Bari : Tipogr. Meridionale.

Bucci J. (2009). Réduction vocalique et partage mélodique en coratin. Mémoire de Master, Université Nice Sophia Antipolis.

Camilli A. (1929). « Il dialetto di Servigliano », Archivum Romanicum XIII : 220-271.

Caratini E. (2009). Vocalic and Consonantal Quantity in German : synchronic and diachronic perspectives. Thèse de Doctorat, Université Nice Sophia Antipolis.

Chierchia G. (1986). « Length, syllabification and the phonological cycle in Italian », Journal of Italian Linguistics 8 : 5-34.

Curculescu E. (2011). Preaspiration in Spanish : the case of Andalusian dialects. Communication présentée au 19th Manchester Phonology Meeting 19-21 mai 2011, Manchester.

Cyran E. (2012). « Cracow sandhi voicing is neither phonological nor phonetic. It is both phonological and phonetic », in E. Cyran et al. (éd.) Sound, Structure and Sense, Studies in Memoriam of Edmund Gussmann. Berlin : Mouton de Gruyter, 153-184.

D’Imperio M. & Rosenthall S. (1999). « Phonetics and Phonology of Main in Italian », Phonology 16(1) : 1-28.

D’Introno F. & Weston R. (2000). « Vowel Alternation, Vowel Consonant Assimilation and OCP Effects in a Barese Dialect », in L. Repetti (éd.) Phonological Theory and the Dialects of Italy. Amsterdam : Benjamins, 89-110.

Falcone G. (1976). « Calabria », Profilo dei dialetti italiani 18. Pisa : Pacini.

Fanciullo F. (1986). « Syntactic Reduplication and the Italian dialects of the Centre-South », Journal of Italian Linguistics 8 : 67-103.

Corpus, 12 | 2013 148

Fava E. & Magno Caldognetto E. (1976). « Studio sperimentale delle caratteristiche elettroacustiche delle vocali toniche ed atone in bisillabi italiani », in R Simone et al. (éd.) Studi di fonetica e fonologia. Rome : Bulzoni, 35-79.

Giannelli L. (2000). « Toscana », Profilo dei dialetti italiani 9. Pisa : Pacini.

Gussmann E. (2006). « Icelandic vowel length and governing relations in phonology », Lingua Posnaniensis 48 : 21-41.

Gussmann E. (2007). The phonology of Polish. Oxford : Oxford University Press.

Hammond M. (1997). « Vowel Quantity and Syllabification in English », Language 73 : 1-17.

Honeybone P. (2005). « Sharing Makes Us Stronger : Process Inhibition and Segmental Structure », in P. Carr et al. (éd.) Headhood, elements, specification and contrastivity : phonological papers in honour of John Anderson. Amsterdam : Benjamins, 167-192.

Iannace G. (1983). Interferenza linguistica ai confini fra stato e regno : Il dialetto di San Leucio del Sannio. Ravenna : Longo.

Kaye J., Lowenstamm J. & Vergnaud J.-R. (1985). « The Internal Structure of Phonological Elements : A Theory of Charm and Government », Phonology Yearbook 2 : 305-328.

Lahrouchi M. & Ségéral P. (2009). « Morphologie gabaritique et apophonie dans un langage secret féminin en berbère tachelhit », Revue Canadienne de Linguistique 54 : 291-316.

Lahrouchi M. & Ségéral P. (2010). « Peripheral vowels in Tashlhiyt Berber are phonologically long : Evidence from Tagnawt, a secret language used by women », Brill’s Annual of Afroasiatic Languages and Linguistics 2(1) : 202-212.

Larsen B. U. (1998). « Vowel Length, Raddoppiamento Sintattico and the Selection of the Definite Article in Italian », in P. Sauzet (éd.) Actes des colloques Langues et Grammaire 2 & 3 (1995, 1997). Paris : Université Paris 8, 87-102.

Loporcaro M. (1988a). Grammatica storica del dialetto di Altamura. Pisa : Giardini.

Loporcaro M. (1988b). « History and geography of raddoppiamento fonosintattico : remarks on the evolution of a », in P. M. Bertinetto & M. Loporcaro (éd.) Certamen Phonologicum. Torino : Rosenberg & Sellier, 341-387.

Loporcaro M. (1994). « Review of Tullio De Mauro (ed.) : Il romanesco ieri e oggi », Romance Philology 47 : 445-455.

Loporcaro M. (1997a). L’origine del raddoppiamento fonosintattico : saggio di fonologia diacronica romanza. Basel & Tübingen : Francke Verlag.

Loporcaro M. (1997b). « Lengthening and Raddoppiamento Fonosintattico », in M. Maiden & M. Parry (éd.) The Dialects of Italy. London : Routledge, 41-51.

Lowenstamm J. (1991). « Vocalic Length and Syllable Structure in Semitic », in A.S. Kaye Semitic Studies in Honor of Wolf Leslau on the occasion of his 85th birthday. Wiesbaden : Harrassowitz, 949-965.

Lowenstamm J. (1996). « CV as the only Syllable Type », in J. Durand & B. Laks (éd.) Current trends in Phonology-Models and Methods. Salford : University of Salford, 419-441.

Lüdtke H. (1979). « Lucania », Profilo dei dialetti italiani 17. Pisa : Pacini.

Mattesini E. (1976). « Tre microsistemi morfologici del dialetto di Borgo Sansepolcro (Arezzo) », in Problemi di morfosintassi dialettale. Atti dell’XI Convegno per gli Studi dialettali italiani, 177-202.

Merlo C. (1917). « L’articolo determinato nel dialetto di Molfetta », Studi romanzi 14 : 69-99.

Corpus, 12 | 2013 149

Moretti G. (1974). « Tre registri nel dialetto di Magione », in G. Tropea (éd.) Dal dialetto alla lingua. Atti del IX convegno di studi dialettali italiani (28 settembre-1 ottobre 1972). Lecce, Italia. Pisa : Pacini, 257-268.

Moretti G. (1987). « Umbria », Profilo dei dialetti italiani 11. Pisa : Pacini.

Napoli D. J. & Nespor M. (1979). « The syntax of word-initial consonantal gemination in Italian », Language 55 : 812-842.

Nespor M. & Vogel I. (1979). « Clash avoidance in Italian », Linguistic Inquiry 10 : 467-482.

Nespor M. & Vogel I. (1982). « Prosodic domains of external sandhi rules », in van der Hust & Smith (éd.) The structure of phonological representations. Dordrecht : Foris.

Nespor M. & Vogel I. (1986). Prosodic phonology. Dordrecht : Foris.

Parrino F. (1967). « Per una carta dei dialetti delle Marche », Bollettino della Carta dei Dialetti Italiani II : 5-37.

Passino D. (2012). « The weight of empty structure : Raddoppiamento Sintattico blocking in Teraman Abruzzese », Studi e Saggi Linguistici 1 : 105-134.

Pellegrini G. B. (1977). Carta dei dialetti d’Italia. Pisa : Pacini.

Repetti L. (1991). « A moraic analysis of raddoppiamento fonosintattico », Rivista di Linguistica 3 : 307-330.

Rohlfs G. (1966-1969). Grammatica storica della lingua italiana e dei suoi dialetti. Torino : G. Einaudi.

Rohlfs G. (1982). « Ein archaischer phonetischer Latinismus im nördlichen (“lateinischen”) Kalabrien », Zeitschrift für Romanische Philologie XCVIII : 547-550.

Scheer T. (2010). « Review of Gussmann (2007) The Phonology of Polish », Studies in Polish Linguistics 5 : 111-160.

Ségéral P. & Scheer T. (2008). « The Coda Mirror, stress and positional parameters », in J. Brandão de Carvalho et al. (éd.) Lenition and Fortition. Berlin : Mouton de Gruyter.

Sluyters W. (1990). « Length and stress revisited : A metrical account of diphthongization, vowel lengthening, consonant gemination and word-final vowel epenthesis in Modern Italian », Probus 2(1) : 65-102.

Tropea G. (1975). « Per una monografia sul dialetto dell’isola di Pantelleria », La ricerca dialettale I : 223-277.

Valente V. (1975). « Puglia », Profilo dei dialetti italiani 15. Pisa : Pacini.

Vincent N. (1988). « Non-linear phonology in diachronic perspective ; stress and word structure in Latin and Italian », in P. M. Bertinetto & M. Loporcaro (éd.) Certamen Phonologicum. Torino : Rosenberg & Sellier, 421-432.

Vogel I. (1982). La sillaba come unità fonologica. Bologna : Zanichelli.

NOTES

1. La réduction vocalique est un processus bien connu dans les dialectes italo-romans méridionaux cf. (Loporcaro, 1988a, p. 57 ; Rohlfs, 1966-1969). 2. Le coratin est un dialecte de l’aire apulo-barese parlé dans la ville de Corato située dans la région des Pouilles à environ 40 km au nord de Bari.

Corpus, 12 | 2013 150

3. Dans cet article, il y a deux auteurs différents portant le nom Bucci (Cataldo Bucci et Jonathan Bucci). 4. Le corpus que j’ai utilisé dans Bucci (2009) est basé sur le seul dictionnaire actuellement disponible à ma connaissance, celui de Bucci (1982) que j’ai numérisé. La version électronique de ce dictionnaire a permis d’extraire un corpus de 264 paires de mots qui a été ensuite soumis en enquête de terrain à deux locuteurs natifs du coratin. 5. Le maintien de la voyelle a a lieu avec n’importe quelle consonne adjacente. 6. Les primitives mélodiques utilisées sont de types unaires (Anderson & John, 1974 ; Backley, 2011 ; Kaye, Lowenstamm, & Vergnaud, 1985) mais l’analyse pourrait être menée avec des traits binaires. 7. La littérature concernant le processus du RF est abondante : Absalom & Hajek, 1997 ; Bafile, 1997 ; Borelli, 2002 ; D’Imperio & Rosenthall, 1999 ; Fanciullo, 1986 ; Larsen, 1998 ; Loporcaro, 1988b ; Napoli & Nespor, 1979 ; Nespor & Vogel, 1979, 1982, 1986 ; Repetti, 1991 ; Sluyters, 1990 ; Vincent, 1988 ; Vogel, 1982. 8. Cette liste fermée déclenchant le RF lexical peut subir quelques variations dans les différentes variétés dialectales de l’italo-roman. 9. L’ALl est une entreprise dont les enquêtes de terrain ont commencé en 1924 ; le premier volume de l’ouvrage a été publié en 1995 et, de nos jours, huit volumes sont déjà publiés. 10. Un dialecte est considéré comme à réduction lorsqu’au moins une de ses voyelles se réduit à schwa en position atone. 11. En ce qui concerne la région des Abruzzes, les cartes sélectionnées ne permettent pas de classer les dialectes comme ‘à réduction’ alors que la littérature récente parle de réduction vocalique en atone pour cette région. 12. Malheureusement, je n’ai pas de données pour l’illustrer.

ABSTRACTS

Areology of Vowel Reduction incompatible with the RF induced by Stress in the Italo-Romance Varieties The raddoppiamento fonosintattico (RF) results from stress. It is an external sandhi process that reduplicates the initial consonant of the second word in a sequence of two when the final vowel of the first word is stressed (e.g. città ppulita « clean city » vs casa pulita « clean city ») Loporcaro (1997a), Absalom & Hajek (1998). This process is well-known especially in Tuscany Chierchia (1986). This work correlates the RF resulting from stress with another phenomenon that at first appears to have no relationship with it, i.e. reduction of unstressed vowels to schwa in certain Italian dialects. Drawing on diatopy, the goal is to show that both phenomena are incompatible, i.e. no system can combine both.

Le raddoppiamento fonosintattico (RF) induit par l’accent est un processus de sandhi externe qui consiste, dans une séquence [mot1+mot2], à redoubler la consonne initiale du second lorsque la voyelle finale du premier est tonique (ex. : città ppulita vs casa pulita), cf. Loporcaro (1997a), Absalom & Hajek (1998). Ce processus est connu surtout en toscan Chierchia (1986). Ce résumé corrèle le RF induit par l’accent avec un autre phénomène qui, de prime abord, n’entretient aucun rapport avec lui : la réduction à schwa des voyelles atones que l’on observe dans certains

Corpus, 12 | 2013 151

dialectes italiens. L’objectif de cet article est de montrer, par la diatopie, que les deux sont incompatibles, i.e. qu’aucun système ne peut les combiner.

INDEX

Mots-clés: phonologie, dialectologie, réduction vocalique, redoublement phonosyntactique Keywords: phonology, dialectology, vowel reduction, phonotactic doubling

AUTHOR

JONATHAN BUCCI Univ. Nice Sophia Antipolis, CNRS, BCL, UMR 7320, 06300 Nice, France

Corpus, 12 | 2013 152

Stratégies de topicalisation en occitan

Richard Faure and Michèle Oliviéri

1. Les topicalisations romanes

1 Bien que l’ordre des constituants soit canoniquement SVO, les dialectes occitans manifestent une grande variabilité dans l’ordre des mots et l’on observe des dislocations diverses. Ainsi, Camproux (1958) et Lafont (1967) présentent différents cas de mise en relief comme marque d’« expressivité ». Ronjat (1913, 1937) constate une « grande liberté dans l’ordre des mots » qui constituent pour lui autant de « procédés stylistiques », tout comme Alibert (1976). En nissart, Gasiglia (1984) montre plusieurs types d’« emphase » et pour le béarnais, Hourcade (1986) indique une « modification de l’ordre des mots extrêmement fréquent ».

2 Cet article se propose d’examiner un type de topicalisation qui semble isoler une partie du domaine occitan au sein des langues romanes1 : la possibilité de topicaliser un constituant en tête d’une subordonnée avant le complémenteur comme en (1).

3 Pour cela, nous nous plaçons dans le cadre de la grammaire générative, dont les dernières avancées permettent de renouveler le problème. Le corpus que nous avons constitué pour ce travail est issu de diverses sources. Au premier chef se trouvent les exemples fournis par les auteurs qui nous ont précédés, Sauzet (1989) et surtout Lahne (2005) qui, à la suite de Sauzet (1989), a effectué une enquête spécifique. Les grammaires de l’occitan ont ensuite permis d’étoffer ce corpus et finalement, nous avons consulté la base de textes du THESOC2.

Corpus, 12 | 2013 153

4 Mais avant d’aborder l’étude de ce type de topicalisation en particulier, il convient de le replacer parmi les différents types de dislocation et de mises en relief dans la périphérie gauche de la proposition.

1.1 Topique vs Focus

5 Parmi les dislocations, il est fait une partition entre deux phénomènes qui semblent proches par leur structure, mais qui sont motivés par des opérations énonciatives différentes : la focalisation et la topicalisation exemplifiées respectivement en (2) et (3).

6 Ces deux structures se distinguent d’abord par leur intonation. En termes non techniques, en (2) ma bacho reçoit une accentuation plus intense qu’en (3). En outre, en (3), le syntagme disloqué peut (ou doit3) être repris par un clitique, ce qui est impossible en (2). Dans la structure (2), le syntagme en tête est dit « focalisé » : il s’agit de l’information nouvelle, le reste de la phrase constituant le support de cette information. Rizzi (1997) a montré qu’il s’agit d’un focus contrastif (qui s’oppose à une alternative), alors que le focus purement informatif reste in situ dans les langues romanes.

7 Au contraire, dans la structure exemplifiée en (3), le syntagme en tête de phrase est dit « topicalisé », c’est-à-dire qu’il s’agit d’un élément connu (ou du moins déjà mentionné 4), qui est le support de l’information et au sujet duquel le reste de la phrase apporte une information. Notons que ces définitions informelles5 interdisent à un constituant d’être topicalisé ET focalisé, puisqu’un même élément ne peut être à la fois support de l’information et information. Dans cet article, nous nous concentrons sur les constituants topicalisés. Ceux-ci appartiennent eux-mêmes à différents sous-types.

1.2 Topique « suspendu » et dislocation gauche

8 Les différents types de dislocations / topicalisations dans les langues romanes ont été bien étudiés et décrits depuis les années 1980. Ainsi, Cinque (1983/1997, 1990) a d’abord mis en évidence qu’il existe deux types de topicalisations dans les langues romanes. On peut illustrer ces deux stratégies avec les exemples français suivants6.

9 Ces deux structures diffèrent par plusieurs propriétés, détaillées par Cinque (1990 : 57-60). En (4), le DP est porteur de la préposition à, marque de datif et indice de sa

Corpus, 12 | 2013 154

fonction syntaxique, alors qu’en (5), le DP n’a pas de préposition, bien qu’il corresponde à la même fonction dans la phrase.

10 En outre, dans une structure comme celle de l’exemple (4), la reprise par un clitique est facultative (sauf s’il s’agit d’un objet direct), alors qu’en (5) elle est obligatoire, d’où l’agrammaticalité de (5b).

11 Enfin, en (4), le syntagme topicalisé n’est pas nécessairement un DP, contrairement à (5). Ainsi on peut trouver un PP, comme en (6).

12 Pour les phrases de type (4), différentes analyses ont été proposées. Cinque (1990) suppose que ces XPs sont générés dans leur position de surface, mais depuis Cecchetto (1999), on a tendance à considérer qu’il s’agit d’un mouvement à partir d’un « grand DP » dont le clitique serait la tête. Ce problème a été réexaminé récemment par López (2009) qui confirme le déplacement de ces topiques7. Ainsi, il est sensible aux effets d’îlots8. Par exemple en (7), l’extraction du syntagme de la vache depuis l’îlot wh- [à qui …] rend la phrase agrammaticale.

13 Diverses dénominations ont été successivement affectées à ce type de topicalisation. Nous adoptons ici le terme de « dislocation gauche », qui marque bien le déplacement du constituant9 (Left Dislocation, désormais LD).

14 En ce qui concerne les phrases de type (5), il y a un consensus sur le fait que le topique est généré sur place, ce qui est confirmé par plusieurs tests10. En particulier, il n’est pas sensible aux effets d’îlots, comme le montre l’acceptabilité de (8).

15 Comme pour la LD, différents termes ont été proposés. Celui que nous retenons ici est le plus communément utilisé : « topique suspendu » (Hanging Topic, désormais HT)11. Ainsi, comme Benincà (2001), nous opposons terminologiquement HT et LD.

16 Ces deux types de topicalisations ont probablement des fonctions pragmatiques différentes. On attribue en général au HT celle de topique-cadre (frame topic ou aboutness topic12) et à la LD celle de topique contrastif13. Un topique-cadre servant de support à l’ensemble de la phrase, on considère en général qu’il n’y a qu’un HT par phrase et qu’il ne peut pas être enchâssé14. Il doit se trouver en tête de la phrase. Cette particularité est cruciale pour la suite de la discussion.

17 A l’instar des autres langues romanes, l’occitan possède bien le HT et la LD, qui présentent les mêmes différences, comme l’illustre leur comportement à l’égard des îlots, testée par Lahne (2005 : 37-38). Les exemples (9) et (10) traduisent (7) et (8).

18 Néanmoins, un cas d’ambiguïté entre HT et LD doit être noté ici. Pour faire la différence entre HT et LD, il faut soit que le DP topicalisé soit en rapport avec un clitique ou un pro dans un îlot syntaxique (en ce cas, seules les phrases à HT sont viables) ; soit que le DP

Corpus, 12 | 2013 155

ait la possibilité de porter une marque casuelle ou de fonction syntaxique (typiquement, une préposition). Dans les autres cas (typiquement sujets et objets), comme (11) ou (12), on ne peut faire la distinction.

19 Dans une langue pourvue de marques d’accusatif et de nominatif, en (11) lo libre serait à l’accusatif s’il est une LD et s’il était un HT au nominatif, qui est généralement le cas assigné par défaut. En revanche, les langues romanes ne possédant pas de marque casuelle explicite pour le Nominatif et l’Accusatif, rien ne permet de détecter une différence entre HT et LD en (11-12). C’est pourquoi, dans la suite, nous appuierons notre démonstration autant que faire se peut sur des exemples où le syntagme topicalisé n’est en rapport ni avec le sujet, ni avec l’objet (direct) du verbe.

1.3 Un troisième type de topicalisation

20 Outre ces deux types de topicalisations, les grammaires de l’occitan notent un phénomène qui semble marquer l’originalité de cette langue dans l’espace roman. Ainsi, Camproux (1958 : 342) évoque ces « tournures expressives » et indique qu’on peut trouver le sujet de la subordonnée avant le complémenteur de manière très fréquente. Il donne ainsi des exemples tels que (13-14).

21 Il analyse plus loin (Camproux, 1958 : 499) cette « anticipation du sujet » comme une prolepse telle qu’elle existe en grec ancien avec les exemples (15-16) :

22 C’est également l’analyse de Lafont (1967 : 382) qui signale un « usage général dans la langue populaire [de la] prolepse », de même qu’en ancien et moyen occitan (17). Refusant d’analyser (18) comme une relative, il considère que « la proposition inaugurée par que est une simple explicitation de cet objet ».

Corpus, 12 | 2013 156

23 Enfin, Piat (1978 : 81) évoque une inversion fréquente de la conjonction et du sujet, « ce qui fait du sujet exprimé une sorte d’apposition, un terme explicatif qui se placera aussi bien avant qu’après le verbe », qu’il illustre avec l’exemple (19).

24 La particularité de cette structure a aussi été mise en évidence par Sauzet (1989) qui la met en perspective avec les autres types de topicalisation et la théorise. Comme le montrent les exemples suivants (empruntés à Lahne (2005 : 29-31)15), le HT et la LD peuvent aussi apparaître dans des phrases plus complexes, où ils sont placés dans la matrice tout en étant coréférents avec un clitique dans la subordonnée (20). En outre, la LD peut aussi apparaître dans une subordonnée (21).

25 Mais parallèlement, Sauzet (1989) isole les phrases comme (22) :

26 Ici, l’absence d’accord casuel interdit d’interpréter aquelas botas comme une LD. Comme on l’a vu, le fait que l’on ait affaire à un contexte enchâssé interdit de l’interpréter comme un HT. Descriptivement, le constituant (sujet ou complément) de la subordonnée est placé avant le complémenteur, comme s’il s’agissait d’un complément du verbe de la matrice. Sauzet propose donc qu’il s’agisse d’un troisième type de topicalisation et le rapproche, après d’autres, de la prolepse du grec ancien. L’existence de cette « troisième topicalisation » en occitan fait de cette langue un isolat parmi les langues romanes. En effet, nous n’avons trouvé d’attestation de cette structure que dans peu de travaux sur les langues romanes, et les locuteurs de l’italien, de l’espagnol et du français que nous avons interrogés indiquent avec une grande uniformité l’agrammaticalité de ces phrases16. Cependant, des structures similaires semblent

Corpus, 12 | 2013 157

exister dans certains dialectes italiens, qu’il conviendrait de comparer avec les faits occitans afin de préciser les différentes analyses17.

27 Nous nous proposons ici de revenir sur ce phénomène signalé depuis longtemps, mais qui s’explique mal. Dans un premier temps, nous examinons les analyses de Sauzet (1989) et de Lahne (2005), qui présentent l’une et l’autre des faiblesses théoriques et empiriques. Nous reprenons ensuite l’examen du problème d’un autre point de vue en suggérant une nouvelle analyse.

2. Les analyses antérieures de la « troisième topicalisation »

2.1 Sauzet (1989)

28 Le premier à avoir étudié cette structure qu’il nomme « prolepse » est Sauzet (1989) qui en propose une analyse originale. Parmi les exemples qu’il donne, on peut relever les phrases (23-25) ; (23) reprend (1) où le DP topicalisé correspond à un sujet (pro) ; (24-25)18 illustrent les autres cas de figure (Datif, Accusatif).

29 Sauzet (1989) montre que cette « prolepse » partage avec le HT19 certaines propriétés : reprise par un clitique ou pro ; constance référentielle (seul un DP défini est possible) ; même fonction pragmatique ; insensibilité aux îlots syntaxiques ; enchâssement profond possible.

30 Du point de vue de l’interprétation, il s’agit d’une topicalisation qu’il analyse comme une adjonction (donc générée sur place) à la proposition (CP ou IP). Pour expliquer l’isolement de l’occitan dans le domaine roman, il essaie de rapprocher ce phénomène d’autres particularismes de l’occitan. Ainsi, avec les verbes à montée (26-27), on peut avoir en occitan les structures (a, b) que l’on trouve dans les autres langues romanes, mais aussi (c).

Corpus, 12 | 2013 158

31 Il est crucial de noter que dans les phrases (c), Sauzet estime que le DP Joan n’a pas été

extrait de la subordonnée. La catégorie vide ei est probablement un pro. Il en veut pour preuve les phrases où le DP en position sujet dans la matrice n’a pas de terme coréférent dans la subordonnée, c’est-à-dire pas de catégorie qui soit une possible trace laissée par un mouvement.

32 Par conséquent, les phrases (c) partagent avec la « prolepse » l’anomalie qu’un DP qui ne reçoit pas de thêta-rôle dans la position où il est généré et qui se trouve en rapport avec un verbe qui ne peut lui assigner un thêta-rôle (rôle sémantique) puisqu’il n’entre pas dans la grille thêta de ce verbe (tous les rôles que ce verbe assigne ont déjà été assignés). La structure devrait donc être exclue, et de fait, elle l’est dans les autres langues romanes.

33 Sauzet (1989 : 244-245) fait donc l’hypothèse que l’occitan possède une propriété grammaticale qui lui est propre. Cette langue pourrait assigner un rôle à tout DP qui entre dans une relation prédicative, même si ce n’est pas avec un verbe. Ainsi un topique est en relation prédicative avec le reste de la phrase, de même qu’un sujet avec I’ etc. Ce rôle n’est pas un thêta-rôle, mais un rôle « katégorique », du grec kategoreîn ‘prédiquer’, et qu’il nomme κ. Ce κ-rôle légitime donc toute relation prédicative. Ainsi, (27c) s’analyse comme (28), où Joan est généré en relation prédicative avec la subordonnée en que. Il est ensuite disponible pour vérifier le trait EPP du I de la matrice, en concurrence avec un explétif (cf. Chomsky (2000) sur ce point).

34 L’intérêt de cette proposition est de rendre compte d’une façon uniforme de deux phénomènes qui isolent l’occitan dans le domaine roman. Cependant, ce κ‑rôle ne paraît pas indispensable. Il n’a aucune limitation car il est assigné de façon récursive pour justifier la récursivité des topiques. Le κ‑rôle peut se cumuler avec un thêta-rôle. Il légitime toute structure et a donc toutes les propriétés d’un outil théorique ad hoc. Mais surtout, il semble théoriquement inutile. En effet, si l’on admet que le DP est bien généré sur place20, il n’est pas généré en position argumentale (à l’intérieur du VP ou du IP) et le problème de l’assignation d’un thêta‑rôle ne se pose pas.

35 Sauzet répond à cette objection en signalant que la limitation du thêta-critère aux positions argumentales surgénère, puisque cela autorise des DP sans rôle thématique ou katégorique à apparaître ailleurs qu’à la marge du CP. Or il n’existe pas (en occitan) de DP sans thêta-rôle à la limite de VP, de DP, de NP, etc. Mais cette objection ne tient que dans la mesure où il traite la topicalisation comme une adjonction. Toutefois, cette position, qui était légitime en 1989, doit désormais être abandonnée. En effet, on admet au moins depuis Rizzi (1997) qu’un DP topicalisé n’est pas adjoint à CP ou à IP, mais se trouve dans une position fonctionnelle spécifique. L’absence de DP sans rôle thématique à la frontière de VP, DP, NP etc. s’expliquerait simplement par l’absence de projection fonctionnelle TOPIQUE dans la périphérie de ces syntagmes.

36 Si malgré ces objections l’on essaie de maintenir la position de Sauzet (1989), on se rend compte que les deux situations dont l’unification fonde son argumentation (verbes à montée et « prolepse ») sont en réalité hétérogènes, ce qui dissout le pouvoir explicatif du κ‑rôle. Les exemples présentant le verbe semblar sont tous à la troisième personne du singulier et il ne semble pas possible de faire varier la personne. Cela va dans le sens

Corpus, 12 | 2013 159

d’une analyse de sembla en (28) comme un impersonnel « il semble », précédé d’un topique : « Jean, il semble qu’il vienne ».

37 D’autres données viennent mettre à mal l’hypothèse. Selon Sauzet (1989 : 252) la « prolepse » n’est pas attestée avec les verbes à montée parce qu’ils ne peuvent assigner le Cas Accusatif (généralisation de Burzio (1986)). Cela explique l’agrammaticalité des phrases en (29), où le seul Cas que peut recevoir Joan dans ces exemples est le Cas Nominatif.

38 Ce Cas leur est attribué par I, ce qui implique une montée, illustrée par (30)21:

39 Néanmoins, il existe au moins une attestation de la structure (29), fournie par Piat (1978 : 43), ce qui affaiblit considérablement l’argument. En (31), acó semble bien être dans la position proleptique. Si l’on veut sauver l’hypothèse de Sauzet, il faut considérer que l’on a affaire à une inversion sujet-verbe.

40 Enfin, comme Sauzet le fait observer lui-même, si la prédication en occitan peut assigner un κ‑rôle dans le cas de s’atrobar, il n’y a pas de raison qu’une phrase avec se dire soit écartée. Or Sauzet (1989 : 248) fournit lui-même l’exemple (32) où « l’inaccessibilité de la position sujet » est justifiée « sans doute » par la présence d’une trace, sans préciser de quelle trace il s’agirait.

41 En réalité, il se trouve que la possibilité de montée et d’accord d’un sujet avec un verbe est limité en occitan à un groupe fermé de verbes : les prédicats de phase. Il s’agit des prédicats qui indiquent à quel point de l’action se trouve le référent dénoté par le sujet qui indiquent à quel point se trouve de l’action du référent dénoté par le sujet, comme en français se trouver, finir, être en train et en occitan s’atrobar, finir 22. Il est donc très probable que ce phénomène de montée soit dû à des propriétés de ces verbes et que finalement, le κ‑rôle ne serait utile que dans le cas de la « prolepse ».

42 Dans un mémoire de Master, Lahne (2005) réexamine le problème à partir de nouvelles données et soutient que la « prolepse » n’est ni plus ni moins qu’un HT en phrase indépendante, le verbe introducteur de la subordonnée étant susceptible d’une lecture parenthétique.

Corpus, 12 | 2013 160

2.2 Lahne (2005)

43 Lors d’une enquête de terrain menée en février 2005, A. Lahne a eu la possibilité de faire d’autres tests sur les structures que l’on étudie ici. Elle a en particulier montré que la « prolepse » avait toutes les caractéristiques du HT et s’opposait à la LD en subordonnée de la même façon qu’en phrase indépendante. Pour ce faire, elle a testé la reconstruction, un des tests qui distinguent dans la littérature ces deux phénomènes en phrase indépendante23. La reconstruction signifie que dans le module interprétatif, le syntagme qui s’est déplacé est interprété comme s’il était dans sa position de génération (in situ). Cela signifie qu’il doit respecter les principes du liage dans cette position.

44 Examinons par exemple (33)24 qui est un cas particulier de HT, où la reprise ne se fait pas par un clitique, mais par un DP coréférent à contenu évaluatif25.

45 En effet, on a remarqué depuis fort longtemps que la reprise du HT se faisait soit par un clitique, soit par un DP avec lequel il entretient une relation de synonymie (et qui a en général un contenu évaluatif). Ainsi l’ostal d’aquel òme et aquela roïna sont coréférents en (35). Si l’ostal d’aquel òme était issu d’un mouvement, il devrait être reconstruit dans la position qu’occupe aquela roïna, c’est-à-dire dans une position où pro c-commanderait aquel òme. Si c’était le cas, pro et aquel òme ne pourraient être coréférents, car cela résulterait en une violation du principe C de la théorie du liage. Or, ils peuvent être coréférents, ce qui montre que aquel òme n’est pas interprété dans une position c- commandée par pro, et donc qu’il n’y a pas reconstruction. S’il n’y a pas reconstruction, c’est parce qu’il n’y a pas eu mouvement.

46 Comme en indépendante, les deux types de topicalisations peuvent être co-occurrents et se placent dans l’ordre HT > LD, comme le montre l’exemple (34) où del livre ne peut être qu’une LD puisqu’il est porteur du cas repris par le clitique ne.

47 Si l’on accepte ces résultats, cette « troisième topicalisation » ne serait ni plus ni moins qu’un HT enchâssé et l’on retrouverait en occitan les deux types de topicalisations des langues romanes. Toutefois, il reste à expliquer pourquoi les topiques en occitan peuvent précéder le complémenteur que, et surtout pourquoi il est possible d’enchâsser un HT, alors que cette possibilité est exclue pour le reste des langues romanes26.

48 Lahne (2005) part de ce dernier constat pour réexaminer le problème. En effet, elle fait l’hypothèse que l’occitan, pas plus que les autres langues romanes, ne permet d’enchâsser les HT et que le prédicat enchâssant a une lecture parenthétique. La structure de (34) ne serait donc pas (35), mais (36) où cresi jouerait en quelque sorte le rôle d’un adverbe de phrase.

Corpus, 12 | 2013 161

49 Pour appuyer cette hypothèse, elle avance trois arguments.

50 Le premier argument repose sur le contraste entre les propriétés d’extraction d’une proposition en que surmontée d’un HT et celles d’une proposition surmontée d’une LD. Dans une structure où l’on a une séquence comme (37), on a affaire en réalité à une seule proposition, puisque le verbe parenthétique joue le rôle d’adverbe de phrase.

51 On a donc une séquence où le syntagme wh- précède le syntagme topicalisé. Or si l’on admet la structure de la périphérie gauche telle que proposée par Rizzi (1997) et les tenants de l’hypothèse cartographique27, les syntagmes wh- suivent les syntagmes topicalisés. Cela prédit donc qu’une phrase qui présente la structure (37) est agrammaticale. Or, on constate le contraste de grammaticalité suivant :

52 L’idée de Lahne est que l’on a l’effet attendu en (38), avec un HT, parce que la parenthétisation du verbe est effective, alors qu’en (39), avec une LD, il n’y a pas de parenthétisation. Le syntagme wh- est donc extrait de la subordonnée et vient prendre place dans une position dédiée à l’interrogation dans la périphérie gauche de la matrice. Cela est selon elle une preuve qu’il n’y a pas de HT enchâssé, puisque la présence d’un HT en tête de la subordonnée entraîne une parenthétisation du verbe matrice.

53 Il est cependant difficile de se fonder sur un seul exemple. Tout d’abord, on ne voit pas pourquoi la lecture parenthétique de ces verbes ne serait jamais possible avec une LD. En outre, la complexité a pu être source de confusion pour les locuteurs. En effet, Lahne soutient que (40) qui contient un DP focalisé est acceptable pour les mêmes raisons que la LD (extraction d’une subordonnée).

54 Toutefois, pour des raisons d’interprétation, il n’est pas possible qu’un focus et un interrogatif coexistent. En effet, le focus n’agit pas au seul niveau de la subordonnée, mais au niveau de toute la phrase, pour laquelle il crée des alternatives28. La phrase (40) serait donc à comprendre avec des alternatives que l’on peut représenter informellement comme en (41), où X représente le constituant qui ouvre le champ des alternatives à Sergì :

55 Le syntagme interrogatif wh- joue le même rôle, ce qui donne des alternatives de la forme (42) :

Corpus, 12 | 2013 162

56 La phrase (40) ne peut pas donner lieu à ces deux lectures concurrentes, sauf en cas de liage entre les deux X dans une structure comme (43), ce qui n’est pas le cas dans cette phrase.

Ainsi en français il est tout à fait possible d’avoir une clivée (marquant un focus contrastif) dans une subordonnée avec le verbe croire (44) ; il est possible de poser une question sur un sous-constituant de la subordonnée (45) ; mais l’association des deux conduit à une forte agrammaticalité (46).

57 Il est donc probable que dans (40), al Sergì soit non pas un syntagme focalisé, mais une LD, marquant éventuellement un topique contrastif29. Notons en passant que l’absence de reprise par un clitique n’empêche pas cette analyse puisque le clitique est facultatif dans les LD30, sauf avec les objets directs.

58 Cette brève démonstration montre qu’il est difficile de se fier à des données aussi complexes et qui n’ont pas été produites spontanément.

59 Le second argument de Lahne (2005) réside dans l’existence sporadique ou permanente (selon les variétés) d’un que énonciatif en occitan en indépendante31. En effet, si l’on fait de sabi, cresi , pensi une parenthèse en (23), (24), (25), (33), la présence du complémenteur que n’est plus justifiée par la subordination. Néanmoins, cela ne fait pas difficulté si l’on considère avec Lahne qu’il s’agit du marqueur énonciatif. Cet argument, qui justifie la présence de que, ne permet toutefois pas de trancher dans un sens ou dans l’autre. Notons toutefois que dans certains des dialectes qui présentent la « troisième topicalisation », ce que énonciatif n’apparaît que sporadiquement 32. Il devrait donc être facultatif quand le verbe croire a une lecture parenthétique, ce qui n’est pas le cas.

60 Enfin, le dernier argument de Lahne (2005) repose sur la théorie du liage. En effet, dans une lecture parenthétique du verbe introducteur, un verbe assertif au sens de Hooper & Thompson (1973), les relations de c-commande sont modifiées33. Ainsi, elle montre qu’en (47B), el ‘il’ et Joan ne peuvent pas être coréférents si el c-commande Joan, car cela résulterait en une violation du principe C du liage. Or, la phrase est acceptable avec cette interprétation coréférentielle, ce qui indique clairement que el ne c-commande pas Joan.

Corpus, 12 | 2013 163

61 L’explication réside, selon Lahne (2005), dans la lecture parenthétique de el crei, qui n’est possible que dans des phrases où la parenthèse est pragmatiquement orientée vers le locuteur, c’est-à-dire où elle peut constituer un commentaire qu’il fait sur la principale, de même que dans la phrase française (48) Jean et il peuvent être coréférents :

62 Malgré tout l’intérêt de cette hypothèse parenthétique, il nous semble difficile de la retenir. Outre les réserves que l’on peut formuler sur les données, elle se heurte à deux séries d’objections : les unes concernent la structure de ce tour, les autres la lecture parenthétique des verbes assertifs.

63 La première objection sur la structure que l’on peut faire à Lahne (2005) est l’usage qu’elle fait de Corver et Thiersch (2002). En effet, ces deux auteurs montrent sur des données du néerlandais que les deux lectures avec portée sont disponibles, mais dans tous les exemples, les verbes sont postposés, comme dans l’exemple français (48), tandis qu’une seule lecture est possible avec le verbe préposé suivi d’une complétive. L’occitan serait donc isolé dans sa capacité à permettre cette double lecture avec un verbe préposé. Cela demande vérification.

64 La seconde objection sur la structure réside dans la prédiction que l’on ne peut pas avoir un HT enchâssé profondément comme en (49), sauf à supposer une accumulation de parenthèses constituées par des verbes enchâssés. Il conviendrait de mener une nouvelle investigation afin de tester cette structure pour avoir la confirmation ou l’infirmation de l’hypothèse de Lahne.

65 Si l’on s’intéresse maintenant aux prédicats qui sont attestés dans les exemples de « troisième topicalisation », on se rend compte qu’ils appartiennent à deux classes : des prédicats assertifs faibles (croire) et des prédicats assertifs semifactifs (savoir). Ces deux classes partagent des propriétés qui les rendent transparents à des opérations extérieures. Ainsi, en anglais, à la première personne du singulier du présent de l’indicatif, il est possible de poser une question-tag sur le contenu de la subordonnée (50-51), alors que cela est impossible pour les autres classes de prédicats (52).

Corpus, 12 | 2013 164

66 Pour que la démonstration de Lahne (2005) soit complète, il faut donc prouver que le HT est impossible 1) avec les verbes qui n’ont pas cette propriété de transparence, 2) avec les verbes qui peuvent être transparents dans les circonstances où cette transparence est bloquée34.

67 Enfin, la définition des verbes parenthétiques pose problème, y compris chez Hooper et Thompson (1973). Si l’on reprend l’article sur lequel Lahne (2005) s’appuie, un verbe parenthétique est un verbe pour lequel la lecture avec une complétive (53) est la même que celle où le verbe est postposé (54) (les exemples sont de Hooper et Thompson (1973)).

68 Les verbes assertifs faibles et les verbes assertifs semifactifs ont bien cette faculté. Ainsi, en (55) notice est un semifactif assertif et il permet cette lecture parenthétique.

69 Toutefois, cela n’est pas possible avec tous les semifactifs assertifs. Ainsi know/savoir ne permet pas cela comme le montre (56), parallèle de (48). Une fois encore, l’occitan serait isolé en permettant une telle phrase et cela demande à être vérifié. Or la moitié des exemples sont avec saber ‘savoir’. Il nous semble donc difficile de retenir l’hypothèse parenthétique.

70 Nous avons donc vu que la topicalisation propre à l’occitan n’est pas due à un rôle « katégorique » que l’occitan possèderait (contra Sauzet (1989)), et qu’il s’agissait bien d’un phénomène en subordonnée (contra Lahne (2005)). Grâce à Lahne (2005), nous avons toutefois la preuve qu’il s’agit bien d’un HT. Il reste à proposer une explication de ce phénomène.

3. Les faits occitans : un HT enchâssé ?

71 Dans un premier temps, on peut essayer de prolonger le rapprochement esquissé par Sauzet (1989), à la suite des grammaires de l’occitan, avec les langues qui possèdent aussi des topiques enchâssés précédant le complémenteur, et au premier chef, le grec

Corpus, 12 | 2013 165

ancien et le latin35. Ce rapprochement se heurte toutefois à des disparités entre les deux phénomènes.

3.1 La prolepse en grec ancien et en latin

72 Il convient d’abord d’examiner les stratégies de topicalisation en grec ancien afin de voir quelle est la place de la prolepse. En phrase indépendante/principale, le grec ancien dispose de deux stratégies de topicalisation : le nominativus pendens, exemplifié en (57)36 et la topicalisation par déplacement, exemplifiée en (58)37.

73 Syntaxiquement, le nominativus pendens est souvent repris par un terme dans la phrase, sans que cela soit nécessaire38. Comme son nom l’indique, il est toujours au nominatif. Cette absence d’accord casuel, et parfois l’absence de reprise, montre qu’il est probablement généré sur place, bien que nous ne puissions pas appliquer les autres tests qui montrent le (non)déplacement. Le nominativus pendens est toujours un topique- cadre et précède les autres topiques. Il s’agit toujours d’un DP. Il a donc toutes les caractéristiques du HT.

74 Au contraire, la topicalisation par mouvement touche toutes sortes de constituants. Le constituant garde le Cas et donc la forme qu’il a dans sa position de génération. La présence de quantifieurs flottants montre le déplacement. Bien que le grec ne dispose pas de pronoms clitiques autres que pour les première et seconde personnes du singulier, ce type de topicalisation ressemble à la LD. En revanche, les fonctions pragmatiques de ce type de topicalisation sont variées : topique-cadre, topique contrastif, topique continu39 et il n’est pas certain qu’elles correspondent à celles définies pour la LD40 mais celles-ci sont mal connues et diffèrent d’une langue à l’autre41.

75 Enfin, en grec, les constituants focalisés ne montent pas dans la périphérie gauche de la proposition, mais restent dans une position basse42, probablement dans une position dédiée dans la périphérie gauche de vP, comme cela a été défendu pour d’autres langues43. Il n’y a donc pas de confusion possible entre un constituant focalisé et un constituant topicalisé44.

76 Si l’on examine à présent les topicalisations dans des contextes enchâssés, on note l’existence de la LD (59) 45 ainsi que d’un phénomène appelé prolepse (60) 46.

Corpus, 12 | 2013 166

77 La prolepse a les caractéristiques suivantes, listées en (61)47 :

78 Nous ne tenterons pas ici une analyse de la prolepse en grec ancien48 car elle n’est mentionnée dans cet article que pour éclairer les données de l’occitan.

3.2 Comparaison grec ancien / latin et occitan

3.2.1 Restriction au DP, passivation

79 La prolepse des langues anciennes et la « troisième topicalisation » occitane partagent la première propriété puisque le syntagme topicalisé est toujours un DP.

80 D’autre part, le deuxième critère n’est pas pertinent ici car il n’y a pas d’exemple de « troisième topicalisation » avec un verbe passivable en occitan.

3.2.2 Assignation du Cas : l’ancien occitan

81 En l’absence de cas en occitan, la seule façon de vérifier la troisième caractéristique serait de pronominaliser l’élément topicalisé. Or nous n’avons relevé aucun exemple avec pronom dans notre corpus. On ne peut donc pas se fonder sur ce troisième critère pour les dialectes modernes mais l’ancien occitan conservait encore un cas sujet et un cas régime. Les exemples de l’ancienne langue fournis par Lafont (1967 : 382) peuvent par conséquent servir de test et effectivement, dans certains cas, le DP est bien au cas régime, comme le DP proleptique grec (6249, 63 et 6450. :

Corpus, 12 | 2013 167

82 D’autres, en revanche, sont manifestement au cas sujet et se comportent donc différemment51 :

83 Un de ces exemples (67) montre clairement que le DP a été déplacé de la subordonnée.

84 En (67), le quantificateur tug est coindexé avec le DP e/lh lauzengier, il ne peut donc s’agir que d’un « quantificateur flottant », au sens de Sportiche (1988) : au cours de la dérivation, le DP tug e/lh lauzengier s’est scindé en deux, e/lh lauzengier continuant à monter, alors que tug est resté dans une des positions inférieures de la chaîne dérivationnelle que l’on peut décrire grossièrement comme en (68) (en passant sous silence certaines étapes).

85 Enfin, dans d’autres cas, comme dans les dialectes modernes, les mécanismes de syncrétisme ne permettent pas de déterminer le cas du DP topicalisé :

Corpus, 12 | 2013 168

86 Les exemples (67-70) sont manifestement des cas de LD, avec une dislocation depuis la subordonnée dans la matrice et ne peuvent être rapprochés de la prolepse des langues anciennes. Mais l’étroitesse de notre corpus ne nous autorise pas à tirer des conclusions de l’absence de données. Il est toutefois intéressant de noter qu’aucun DP au cas régime ne se sépare de la subordonnée, alors qu’en grec ancien, le DP proleptique vient jouer un rôle informationnel dans la matrice.

87 Au final, sur ces huit exemples, trois sont au cas sujet, trois au cas régime et deux restent indéterminés. Si l’on se fonde sur ces données, cela montre seulement que l’ancien occitan, à l’instar de l’occitan moderne et du grec ancien, a deux stratégies de topicalisation en subordonnée.

3.2.3 Assignation du Cas : l’occitan moderne

88 Dans les dialectes modernes, la plupart des exemples donnés par les différents auteurs concernent des cas où le DP topicalisé correspond au sujet de la subordonnée. Cela pose un certain nombre de problèmes, dans la mesure où (i) il n’est pas possible de déterminer le cas (Accusatif ou Nominatif) du DP topicalisé et (ii) on a vu qu’il n’existe pas de clitique nominatif dans ces dialectes. On ne peut donc pas savoir si le Cas est assigné au DP par le verbe matrice ou non, comme on le voit dans la phrase (15) ainsi que dans (71-75).

Corpus, 12 | 2013 169

89 L’exemple (75) présente un pronom neutre ou qui annonce la subordonnée précédée d’un topique. En grec ancien, l’annonce d’une subordonnée par un pronom neutre et la prolepse sont toutes deux fréquentes. Elles apparaissent avec les mêmes verbes, mais ne sont jamais co-occurrentes52. Si l’on veut maintenir le parallèle avec le grec ancien, les exemples avec un pronom neutre qui annonce la subordonnée ne peuvent être que des exemples de LD enchâssées.

3.2.4 Fonctions pragmatique et syntaxique du topique

90 En revanche, les quatrième et cinquième points de (61) montrent que nous avons affaire à deux structures différentes dans les langues anciennes, d’une part, et en occitan, d’autre part. En effet, il est des cas en occitan où le DP est coréférent non pas du sujet, mais d’un terme qui occupe une autre fonction dans la subordonnée : (76) avec un datif, (77) avec un ablatif. Dans cette configuration, on voit à la forme du clitique que le Cas du DP dans la matrice n’est pas celui du terme coréférent dans la subordonnée sans pour autant pouvoir déterminer si le verbe matrice lui assigne un Cas.

Corpus, 12 | 2013 170

91 En outre, tous les exemples de notre corpus présentent un DP « figé » en tête de la subordonnée (toujours adjacent au complémenteur que), alors que dans les langues anciennes, le DP a la possibilité de se déplacer dans la matrice. Si en occitan, le DP se déplaçait en tête de la matrice, il n’y aurait pas moyen de distinguer une prolepse qui s’est déplacée en tête de la matrice et un HT généré sur place, à moins qu’ils ne se différencient par leur fonction pragmatique, ce qui ne semble pas être le cas. De plus, le HT est un topique, alors que le DP proleptique peut parfois être focalisé dans la matrice. En effet, le plus souvent le DP joue un rôle de topique, comme on le voit dans l’exemple (60) où tḕn mákhēn ‘le combat’ est topique de l’ensemble de la phrase et comme cela a été analysé pour le latin par Bortolussi (2012). Toutefois, celui-ci relève aussi un curieux exemple53 où le DP proleptique est dans le focus. On ne peut donc pas ramener directement ce phénomène au cas de la prolepse en grec ancien.

92 Le tableau présenté en (78) compare prolepse et « troisième topicalisation ». Les cinq premiers points reprennent (61). Les deux dernières caractéristiques sont ressorties de la comparaison entre l’occitan et les langues anciennes.

93 Dans ce tableau, la prolepse et la « troisième topicalisation » présentent une image en négatif l’une de l’autre pour les propriétés 3-4 d’une part et 6-7 d’autre part. Cela suggère une corrélation entre ces traits, qui pourrait bien être l’explication des comportements différents de ces deux langues à l’égard de la structuration de l’information dans les phrases complexes.

94 Dans les langues anciennes, la coréférence avec le seul sujet peut trouver sa source dans l’absence de reprise pronominale explicite. En effet, dans les langues romanes, la forme du clitique indique clairement la fonction avec laquelle est lié le DP coréférent.

Corpus, 12 | 2013 171

Le topique n’est donc pas limité au seul sujet. En revanche, en grec ancien et en latin, on peut supposer une complication cognitive pour identifier le rôle du topique dans la subordonnée54.

95 De la même façon, la limitation de la place du topique en occitan à la frontière immédiate de la subordonnée, qu’il s’agisse d’une tendance ou d’une règle, peut s’expliquer par une contrainte cognitive. Le marquage en Cas étant explicite en grec ancien et en latin, le DP déplacé dans la matrice depuis la périphérie gauche de la subordonnée est porteur du Cas qu’il lui a été assigné par le verbe matrice dans sa position d’origine. Ce Cas est l’indice clair que le DP a son origine dans la subordonnée.

96 En revanche, en occitan, l’absence de marque casuelle peut entraîner une confusion par exemple entre un topique et le sujet du verbe, puisque la plupart des dialectes occitans sont pro-drop. Cela explique peut-être aussi pourquoi la prolepse a accès à davantage de fonctions pragmatiques que la « troisième topicalisation ». En effet, quelle que soit la fonction pragmatique occupée, la fonction syntaxique du DP reste lisible. Ce n’est pas le cas pour l’occitan pour qui restreindre le DP à une seule position syntaxique est la seule garantie de lisibilité de sa fonction pragmatique.

97 D’un point de vue théorique, cela signifie que le trait pragmatique porté par le DP est vérifié dans la périphérie gauche de la subordonnée en occitan, ce qui entraîne son gel (« criterial freezing » de Rizzi (2007)), tandis qu’en grec, le DP peut n’y vérifier qu’un trait purement formel et ne pas être figé. Il continue à se déplacer vers une position où le trait pragmatique sera vérifié (Rizzi 2007).

98 On observe donc là un faisceau de traits dont la complémentarité est des plus intéressantes. Il reste à comprendre ce qu’est cette structure occitane.

3.3 HT enchassé et paramètre du trait déclaratif

99 Les différences de propriétés entre l’occitan et le grec ancien, d’une part, les difficultés théoriques à poser un κ‑rôle, d’autre part, et l’improbabilité de la lecture parenthétique, enfin, engagent à un nouvel examen de ce phénomène de topicalisation enchâssée.

100 Cette structure semble effectivement étrange et rare, et on a vu que la définition du HT comme phénomène limité aux indépendantes a contraint Sauzet (1989) suivi de Lahne (2005) à chercher une explication autre à cette « troisième topicalisation », qui a pourtant toutes les propriétés d’un HT. Nous proposons maintenant d’examiner l’hypothèse dans la perspective inverse. Si l’on part de l’idée que la « troisième topicalisation » est bien un HT, quelles sont les conditions qui permettrait son enchâssement en occitan et pas dans les autres langues romanes ?

101 Ainsi, si l’on considère dans un premier temps les phrases simples avec un DP topicalisé qui correspond au complément du verbe, du type (79), il est manifeste que le DP topicalisé est un HT :

Corpus, 12 | 2013 172

102 Si cette hypothèse présente l’avantage de la simplicité et de ne pas se heurter aux objections faites aux analyses précédentes, elle pose pourtant d’autres problèmes théoriques, d’ordre pragmatique et d’ordre syntaxique.

103 Du point de vue pragmatique, même s’il prend la forme d’une phrase complexe, un énoncé est porteur d’un unique acte de langage. Un topique qui porterait sur l’énonciation devrait donc prendre l’ensemble de l’énoncé dans sa portée, de la même façon qu’un adverbe portant sur l’énonciation doit se trouver en tête de phrase. Cela prédit leur limitation aux indépendantes. Ainsi, franchement en (81) porte sur l’énonciation, tandis qu’en (82), il sert d’intensifieur dans l’énoncé. C’est pourquoi (81) ne peut pas être enchâssé (83), alors que (82) peut l’être (84).

104 Ainsi, on considère en général qu’un HT dénote un topique-cadre de l’énonciation55. Cela prédit qu’il ne peut y en avoir qu’un par phrase et par ailleurs qu’il doit prendre l’ensemble de la phrase dans sa portée et donc ne pas être enchâssé. Cette question doit trouver une réponse commune à celle du problème syntaxique.

105 En ce qui concerne le point de vue syntaxique, il reste à trouver la contrainte qui interdit cette structure dans certaines langues et l’autorise dans d’autres. Comme on va le voir, cette question peut être traitée en termes de paramètres déjà connus.

106 Le problème pragmatique peut être résolu si l’on considère que l’occitan traite les structures [Verbe + HT + subordonnée] comme un cas de discours indirect et qu’il est plus permissif que le français par exemple. L’occitan aurait la faculté de citer un énoncé complet en enchâssant également les modifieurs de l’énonciation. Cela n’est bien entendu possible que s’il y a une indexation entre le sujet du verbe introducteur et le terme énonciatif enchâssé, par exemple, en (83), si franchement exprime le jugement de Pierre.

107 Pour qu’une telle structure soit possible, il faut que l’occitan dispose en outre de la possibilité syntaxique d’accueillir dans la périphérie gauche de la proposition ces termes énonciatifs. Benincà (2001) a fait l’hypothèse que certaines langues possèdent, au-dessus de la position Force, une position Discours qui serait propre à accueillir les HT. Il nous semble qu’il est possible de faire une hypothèse qui va dans le même sens, mais plus économique. En effet, on peut supposer que c’est Force qui accueille dans son spécifieur le HT56. Théoriquement, cela peut s’expliquer si l’on reprend le traitement des complémenteurs que l’on trouve dans Chomsky (1995 : 289-293).

Corpus, 12 | 2013 173

108 Dans ce chapitre, Chomsky propose d’expliquer le contraste entre les langues qui ont une montée obligatoire du syntagme wh- dans les questions (typiquement l’anglais) et celles où il reste in situ (typiquement le japonais). Il fait l’hypothèse que cela est dû à la force du trait [wh-] dont est revêtue la tête fonctionnelle Q qui surmonte la structure. En anglais, cette tête est pourvue d’un trait fort, qui doit être vérifié localement. Cela entraîne donc la montée du syntagme wh- dans le spécifieur de la tête. Dans les questions totales, ce trait fort est vérifié (i) dans les interrogatives directes par la montée du verbe en C, et (ii) dans les interrogatives indirectes par l’adjonction du complémenteur if à la tête fonctionnelle. En revanche, dans les langues comme le japonais, aucune de ces opérations n’est obligatoire. Chomsky oppose ensuite à la tête interrogative Q, la tête déclarative, qui est, elle, en anglais, porteuse d’un trait faible. Ce trait n’a pas besoin d’être vérifié explicitement, c’est pourquoi le complémenteur n’est pas explicite dans les phrases indépendantes (85) et est facultatif dans les subordonnées (86).

109 Si l’on revient maintenant à l’occitan, on se rend compte que le trait porté par la tête déclarative a toutes les caractéristiques d’un trait fort. En effet, dans les phrases indépendantes, l’occitan autorise, voire privilégie (pour certaines variétés) la présence d’un complémenteur que, généré dans une position inférieure, dédiée au marquage des propositions finies (probablement Finitude°57) et qui monte en Force° pour vérifier ce trait. Dans les systèmes58 qui connaissent la « troisième topicalisation », ce complémenteur serait obligatoirement présent dans les subordonnées. Nous proposons que ce trait fort puisse aussi être vérifié par la montée dans le spécifieur de la tête d’un topique, et singulièrement d’un HT59.

110 Cette idée d’un trait /Force/ fort se trouve chez Morin (2006) à propos des énonciatifs gascons mais formulé en d’autres termes. Dans les indépendantes, l’auteur suppose que le complémenteur que est généré en Fin°, car il est toujours immédiatement adjacent au verbe (théoriquement monté en T°). Dans les subordonnées, les données sont plus variées. Un DP topique surmonte parfois le complémenteur, qui est rédupliqué en Force pour vérifier le trait fort (schéma que-DP-que). En outre, on a parfois un DP qui s’interpose entre C et le verbe. D’après Morin (2006), le complémenteur est en Force et le DP est un topique. Mais rien n’empêche de considérer que le DP est plus bas, dans le domaine IP, dans le spécifieur de T. Nous proposons pour notre part une analyse différente, où le DP est dans le spécifieur de Force°.

111 Le caractère fort du trait porté par Force serait le corrélat de la possibilité pragmatique qu’ont certains parlers occitans d’enchâsser un acte de langage complet. Il est intéressant de lier avec la position Force (illocutoire) une opération (la topicalisation) qui joue un rôle dans l’énonciation. Par ailleurs, cela produit une symétrie avec une position inférieure. En effet, Rizzi (1997) suggère que Interrogation et Focus sont la même projection, alors que Topique et Force sont dissociés. Si on les réassocie autour de ce modèle, on parvient à un modèle plus minimaliste, avec deux types de têtes impliquées dans les opérations énonciatives de hiérarchisation de l’information et de marquage du type d’énoncé. L’une est associée à l’absence de certitude, ce qui se

Corpus, 12 | 2013 174

décline en interrogation et focus (INT/FOC), et l’autre associée à la connaissance, ce qui se décline en assertion/déclaration et topique (DECL/TOP). La force des traits portés par ces têtes fonctionnelles rend compte des variations à travers les langues, telles que présentées dans le tableau en (87)60.

(87) Interrogatif

+ –

+ languedocien japonais Déclaratif – anglais chinois ?61

112 Ainsi, il apparaît que les langues qui ont le plus de traits pragmatiques forts à vérifier sont les langues où l’ordre des mots a été décrit comme le plus libre. En effet, cette stratégie de topicalisation n’est pas généralisée à l’ensemble du domaine occitan. Si cette construction semble bien attestée en languedocien, elle paraît absente (ou du moins très marginale) en provençal. Ainsi, aucune grammaire du provençal ne la mentionne et nous n’en avons pas trouvé d’exemple dans le THESOC62. Elle est apparemment également exclue en catalan63 et elle n’est pas signalée non plus en gascon, qui connaît cependant d’autres mécanismes que l’on pourrait rapprocher de celui-ci. Or, il est manifeste que les parlers de l’ouest du domaine autorisent plus de liberté dans l’ordre des mots que les dialectes provençaux64. Dans le continuum linguistique occitan, il pourrait y avoir une progression d’est en ouest, l’ordre des mots étant de plus en plus variable en allant vers l’ouest, le provençal restant plus limité dans les stratégies de topicalisation et le gascon connaissant apparemment la plus grande mobilité des constituants. Dans cette perspective, cette « troisième topicalisation » représenterait un état intermédiaire entre le provençal (plus contraint) et le gascon (où le système des particules énonciatives donne un statut particulier à que).

4. Conclusion

113 Alors que certaines langues présentent deux stratégies de topicalisation (HT et LD), qui prennent des formes variées à travers les langues (reprises par un clitique ou non), d’autres présentent un troisième phénomène. C’est le cas de l’occitan, du latin ou du grec ancien. Mais cette troisième stratégie n’est toutefois pas justiciable de la même interprétation dans ces trois langues. Alors qu’en grec et en latin, il s’agit d’une véritable troisième stratégie, l’occitan ne fait qu’exploiter davantage une des deux possibilités existantes : le HT. En effet, l’occitan possède manifestement dans la périphérie gauche de la proposition une tête fonctionnelle porteuse d’un trait fort qui s’accorde avec un DP topical et l’attire (en subordonnée ou en indépendante).

114 Les dialectes occitans montrent alors une partition en fonction de ce paramètre, comme le montre la distribution du phénomène dans l’aire occitane, puisque tous les parlers ne le connaissent pas. Elle est manifestement attestée en ancien et moyen occitan et dans les dialectes modernes situés en Lozère, dans l’Aude, les Cévennes gardoises, l’Uzège… mais elle semble inconnue dans le reste du domaine.

Corpus, 12 | 2013 175

115 D’un point de vue diachronique, il faudrait également pouvoir déterminer si cette structure est héritée d’un état de langue antérieur ou s’il s’agit d’une innovation. S’agit- il d’un vestige de l’ancienne prolepse latine ou ces dialectes modernes ont-ils développé une stratégie particulière de topicalisation ?

116 S’il s’agit d’une structure héritée et si cette répartition géographique se confirme, on pourrait alors supposer que le languedocien (et sans doute alors le gascon) manifeste des états de langue plus conservateurs que le provençal, ce que Piat (1978) suggère du moins pour le gascon. Mais cette hypothèse, par ailleurs contestée65, reste fragile et demande à être confrontée à d’autres faits. En outre, il faudrait alors expliquer pourquoi les dialectes provençaux sont plus novateurs que les dialectes plus occidentaux.

117 Mais, si notre analyse est correcte, il n’y a pas de raison de supposer qu’il s’agisse d’une structure archaïque, puisque nous avons établi que la « troisième topicalisation » n’était pas une prolepse comparable à celle du grec ancien et du latin. Dans ce cas, ce sont les parlers qui connaissent cette stratégie de topicalisation qui ont innové en modifiant la valeur du paramètre de la tête Force. Il est manifeste qu’une enquête complémentaire sera maintenant nécessaire pour parfaire notre vision des faits et mettre à l’épreuve nos hypothèses.

BIBLIOGRAPHY

Alibert L. (1976). Gramatica occitana. Montpellier : Institut d’Estudis Occitans.

Bayer J. (2004). « Decomposing the left periphery : dialectal and cross-linguistic evidence », in H. Lohnstein & S. Trissler (éd.) The Syntax and Semantics of the Left Periphery. Berlin : Walter de Gruyter, 59-95.

Benincà P. (2001). « The Position of Topic and Focus in the Left-Periphery », in G. Cinque & G. Salvi (éd.) Current Issues in Italian Syntax. Essays offered to Lorenzo Renzi. Amsterdam : Elsevier, 39-64.

Benincà P. & Poletto C. (2004). « Topic, focus, and V2 », in L. Rizzi (éd.) The Cartography of Syntactic Structures. Volume 2, The Structure of CP and IP. Oxford : Oxford University Press, 52-75.

Bertrand N. (2010). L’ordre des mots chez Homère : structure informationnelle, localisation et progression du récit. Thèse de Doctorat, Université Paris-Sorbonne (Paris IV).

Burzio L. (1986). Italian syntax : A government-binding approach. Dordrecht : Reidel.

Camproux C. (1958). Etude syntaxique des parlers gévaudanais. Paris : Presses Universitaires de France.

Cecchetto C. (1999). « A comparative analysis of left and right dislocation in Romance », Studia Linguistica 53(1) : 40-67.

Corpus, 12 | 2013 176

Chomsky N. (2000). « Minimalist inquiries : The framework », in R. Martin, D. Michaels & J. Uriagereka (éd.) Step by step : Essays on minimalist syntax in honor of Howard Lasnik. Cambridge : MIT Press, 89-155.

Cinque G. (1977). « The Movement Nature of Left Dislocation », Linguistic Inquiry 8(2) : 397-412.

Cinque G. (1983/1997). « ‘Topic’ constructions in some European languages and Connectedness », in E. Anagnostopoulou, H. van Riemsdijk & F. Zwarts (éd.) Materials on Left Dislocation. Amsterdam : Benjamins, 93-118.

Cinque G. (1990). Types of A’-dependencies. Cambridge : MIT Press.

Corver N. & Thiersch C. (2002). Remarks on Parentheticals, in M. van Oostendorp & E. Anagnostopoulou (éd.) Progress in Grammar. Articles at the 20th Anniversary of the Comparison of Grammatical Models Group in Tilburg. http:// www.meertens.knaw.nl/books/progressingrammar/.

Dal Lago N. (2010). Fenomeni di prolessi (pro)nominale e struttura della periferia sinistra nel greco di Senofonte. Thèse de Doctorat, Université de Università degli studi di Padova.

Dalbera J.-P., Oliviéri M., Ranucci J.-C., Brun-Trigaud G. & Georges P.-A. (2012). « La base de données linguistique occitane THESOC. Trésor patrimonial et instrument de recherche scientifique », Estudis Romànics 34 : 367-387.

Erteschik-Shir N. (1997). The Dynamics of Focus Structure. Cambridge : Cambridge University Press.

Erteschik-Shir N. (2007). Information structure : the syntax-discourse interface. New York : Oxford University Press.

Faure R. (2010). Les Subordonnées interrogatives dans la prose grecque classique : les questions constituantes. Thèse de Doctorat, Université Paris-Sorbonne (Paris IV).

Faure R. (2012). « Resolutive predicates and the syntactic and semantic selection of questions », in Actes du colloque GLOW in Asia IX, Mie University (Japon), 93-112.

Frascarelli M. & Hinterhölz R. (2007). « Types of topics in German and Italian », in K. Schwabe & S. Winkler (éd.) On Information Structure, Meaning and Form. Amsterdam : Benjamins, 87-116.

Gasiglia R. (1984). Grammaire du nissart. Nice : Institut d’études niçoises.

Havers W. (1925). « Der sog.’nominativus pendens’ », Indogermanische Forschungen 43 : 207-257.

Hooper J.B. & Thompson S.A. (1973). « On the applicability of root transformations », Linguistic Inquiry 4(4) : 465-497.

Hourcade A. (1986). Grammaire béarnaise. Pau : Association Los Caminaires.

Jayaseelan K.A. (2001). « IP-internal topic and focus phrases », Studia Linguistica 55(1) : 39-75.

Lafont R. (1967). La phrase occitane. Paris : Presses Universitaires de France.

Lahne A. (2005). Die linke Satzperipherie im Okzitanischen. Mémoire de Master, Friedrich Schiller Universität, Jena.

Lambrecht K. (1994). Information structure and sentence form : topic, focus, and the mental representations of discourse referents. Cambridge / New York : Cambridge University Press.

Ledgeway A. (2003). « Il sistema completivo dei dialetti meridionali : la doppia serie di complementatori », Rivista italiana di dialettologia 27 : 89-147.

Ledgeway A. (2005). « Moving Through the Left Periphery : The Dual Complementiser System in the Dialects of Southern Italy », Transactions of the Philological Society 103 : 336-396.

Corpus, 12 | 2013 177

Ledgeway A. (2012). From Latin to Romance : Morphosyntactic Typology and Change. Oxford : Oxford University Press.

Longrée D. & Halla-Aho H. (éd.) (2012). Etudes sur la prolepse. De lingua latina 7. Revue de linguistique latine du centre Alfred Ernout.

López L. (2009). A Derivational Syntax for Information Structure. Oxford-New York : Oxford University Press.

Matić D. (2003). « Topic, focus, and discourse structure : Ancient Greek Word Order », Studies in Language 27(3) : 573-633.

Morin A. (2006). On the Syntax of Clause Type Particles : Evidence from Gascon, Innu and Quebec French. Master Thesis, Université de Concordia University, Montreal (Canada).

Oliviéri M. (2010). « Syntaxe et Corpus », Corpus 9 : 7-19.

Oliviéri M. & Sauzet P. (à paraître). « Occitan », in A. Ledgeway & M. Maiden (éd.) The Oxford Guide to the Romance Languages. Oxford : Oxford University Press.

Panhuis D. (1984). « Prolepsis in Greek as a Discourse Strategy », Glotta 62(1/2) : 26-39.

Piat L. (1978). Grammaire générale populaire des dialectes occitaniens. Essai de syntaxe. Raphèle-lès- Arles : Marcel Petit.

Reinhart T. (1981). « Pragmatics and Linguistics : An Analysis of Sentence Topics », Philosophica 27 : 53-94.

Rizzi L. (1997). « The fine structure of the left periphery », in L. Haegeman (éd.) Elements of grammar. Dordrecht : Kluwer, 281-337.

Rizzi L. (2007). « On Some Properties of Criterial Freezing », CISCL Working Papers on Language and Cognition 1 : 145-158.

Ronjat J. (1913). Essai de syntaxe des parlers provençaux modernes. Macon : Protat Frères.

Ronjat J. (1937). Grammaire Istorique des Parlers Provençaux Modernes. Genève / Marseille : Slatkine / Laffitte Reprints.

Rooth M. (1992). « A theory of focus interpretation », Natural Language Semantics 1(1) : 75-116.

Ross J.R. (1967). Constraints on variables in syntax. Thèse de Doctorat, Massachusetts Institute of Technology. Publié dans Ross, J.R. (1986). Infinite Syntax ! Norwood : Ablex.

Sauzet P. (1989). « Topicalisation et prolepse en occitan », Revue des langues romanes 93(2) : 235-273.

Shaer B. & Frey W. (2004). « ‘Integrated’ and ‘non integrated’ left peripheral elements in German and English », in B. Shaer, W. Frey & C. Maienborn (éd.) Dislocated Elements Workshop, novembre 2003. Berlin : Zentrum für Allgemeine Sprachwissenschaft, ZAS Papers in Linguistics 35 : 465-502.

Sportiche D. (1988). « A theory of floating quantifiers and its corollaries for constituent structure », Linguistic Inquiry 19(3) : 425-449.

NOTES

1. Cf. Ledgeway (2003, 2005), Benincà et Poletto (2004). 2. La base de textes du Thesaurus Occitan (THESOC) a pour vocation de regrouper tous les textes oraux disponibles en occitan (Cf. notamment Dalbera et al. (2012)). L’implémentation de la base

Corpus, 12 | 2013 178

étant en cours, tous les textes ne sont pas encore disponibles et la plupart sont dans des dialectes provençaux. 3. Cf. infra. 4. Cf. López (2009). 5. Cf. Lambrecht (1994) et Erteschik-Shir (1997, (2007) pour de plus amples détails. 6. Il a été noté des différences d’acceptabilité selon les locuteurs, mais ces structures sont régulièrement produites en français spontané. 7. D’un point de vue technique, chez Cinque (1990), les arguments pour le mouvement sont : (i) la sensibilité à l’effet de croisement faible (Weak Cross Over), (ii) la sensibilité aux îlots faibles ; les arguments contre sont (i) le fait que la LD ne légitime pas les vides parasites (parasitic gaps), (ii) le fait qu’elle ne soit pas sensible à la sous-jacence. López (2009 : chapitre 6) montre que ces arguments contre le mouvement doivent être écartés, parce que les données étaient faussées pour le premier, et par une redéfinition des frontières de la sous-jacence pour le second. A ces quatre tests est venue s’ajouter la reconstruction (cf. Cecchetto (1999) et section 2.2). 8. Les îlots syntaxiques (en anglais islands) sont des syntagmes d’où l’extraction est impossible ou soumise à contraintes. 9. Nous éviterons le terme ambigu de Left Dislocation (CLLD), car il y a une reprise par un clitique dans les deux cas (HT et LD) et le clitique est facultatif en LD. Historiquement, le terme remonte à Ross (1967), mais il n’a été restreint à ce type de topicalisation que plus tard. 10. Cf. pour l’occitan Sauzet (1989 : 239-240). 11. Cf. Cinque (1977 : 406), qui l’attribue à A. Grosu. 12. Cf. Reinhart (1981). 13. Cf. Benincà & Poletto (2004), Frascarelli & Hinterhölz (2007). 14. Cf Cinque (1990 : 58), López (2009 : 6). Toutefois López nuance son jugement en reconnaissant que toute l’échelle de la grammaticalité est parcourue en fonction des langues et des locuteurs. L’occitan serait la langue dans laquelle ces structures sont pleinement acceptables, tandis que l’on trouve sporadiquement des attestations pour d’autres langues. Ainsi dans Benincà (2001 : 48, 54), l’on trouve les phrases (i) et (ii) présentées comme acceptables. De notre côté, nous avons interrogé deux informateurs. Elles sont notées comme tout à fait agrammaticales par un informateur, comme légèrement agrammaticales par l’autre (et plus familières), avec le sentiment que « le che n’est pas le même que dans une complétive habituelle ». Nous considérerons donc que l’italien est moins permissif que l’occitan pour ces structures. (i) ??Sono certa questo libro che non ne ha mai parlato nessuno. Je suis certaine ce livre que personne n’en a jamais parlé. (ii) ??Penso il tuo libro che ne parleremo. Je pense ton livre que nous en parlerons. 15. Lahne (2005) a repris et testé les phrases analysées par Sauzet (1989) car il s’appuyait sur des phrases ambiguës, le syntagme disloqué étant sujet ou objet. 16. Sauf dans le cas d’exclamatives, avec un verbe de perception, comme « Tu as vu la petite fille comme elle est jolie ! ». En occitan, comme on va le voir, la structure que nous examinons a une extension plus large. 17. Cf. note 1. 18. On verra que l’exemple 24 est susceptible de deux lectures (i) « je ne crois pas que les enfants leur ont donné des gâteaux », (ii) « je ne crois pas qu’ils ont donné des gâteaux aux enfants ». C’est cette seconde lecture que Sauzet (1989) retient et qui nous intéressera ici. 19. Dans la terminologie utilisée par Sauzet (1989), le HT est nommé « topicalisation » par opposition à la « dislocation » qui correspond à la LD. 20. Cf. infra.

Corpus, 12 | 2013 179

21. Exemple cité (et adapté) par Sauzet (1989) extrait de Fabre, J.-B. (1839 : 263). « Histouèra dé Jan-l’an-prés » in Obras patouèzas de M. Favre. T. 3. Montpellier : A. Virenque, Source Gallica.bnf.fr, 225-280. 22. Cf. Sauzet (1989 : 247). 23. Cf. note 7. 24. Tous les exemples occitans de cette section sont de Lahne (2005 : 42, 59). 25. Ce type de reprise, mis en évidence dans les années 1980, est cité par exemple dans Benincà et Poletto (2004 : 65). 26. Cf. López (2009 : 6). 27. Cf. en particulier Benincà & Poletto (2004). 28. Cf. Rooth (1992). 29. On relève la même confusion chez López (2009 : 124). 30. Cf. section 1.2. 31. Cette occurrence de que est surtout connue en gascon, mais est décrite dans toutes les grammaires occitanes. Cf. notamment Ronjat (1937 :536), Camproux (1958 : 446), Lafont (1967 : 350) ou Gasiglia (1984 : 400-403). 32. C’est le cas dans les dialectes languedociens. 33. Pour cela, elle s’appuie sur une étude de Corver & Thiersch (2002) sur le néerlandais. 34. Cf. Hooper et Thompson (1973 : 475-476). 35. Le phénomène est exactement le même dans les deux langues. Voir récemment Dal Lago (2010), Faure (2010), Longrée & Halla-Aho (2012) et leurs références. 36. Xénophon. Economique, 1.14. 37. Hérodote 7.187.3. 38. Cf. Havers (1925). 39. Cf. Bertrand (2010). 40. Cf. Benincà & Poletto (2004). 41. Cf. la comparaison de l’italien et de l’allemand dans Frascarelli & Hinterhölz (2007). 42. Cf. Matić (2003), Bertrand (2010). 43. Cf. parmi beaucoup d’autres Jayaseelan (2001). 44. Cf. section 1.1. 45. Platon République, 493a-b. 46. Xénophon Cyropédie, 2, 1, 7. 47. Cf. les références bibliographiques citées à la note 35. 48. Des analyses avec et sans mouvement sont en concurrence. 49. (62) reprend (17). 50. La traduction de cette phrase (et de la suivante) peut être contestée et donne lieu à débat. Nous adoptons ici l’interprétation de Lafont (1967) pour qui il ne s’agit pas d’une relative (cf. 1.3.). Nous tenons à remercier ici Sylvain Casagrande et Philippe Del Giudice pour leurs avis éclairés et leur aide dans l’interprétation des exemples occitans. 51. Outre la difficulté d’interprétation (cf. note précédente), les manuscrits donnent des variantes pour cette phrase la honor (ambigu entre cas sujet et cas régime) et lo honor (cas régime). On ne peut donc se fonder sur elle. 52. Cf. Faure (2010 : chapitre 1). 53. Térence, Eunuque, 853-855. 54. Il est intéressant à cet égard de noter que le grec moderne a acquis des clitiques et se comporte désormais comme les langues romanes. 55. Cf. supra et les analyses qui proposent que les HT ne soient pas intégrés à la phrase (Shaer & Frey (2004)).

Corpus, 12 | 2013 180

56. Notons en passant que rien n’empêche cela dans les données présentées par Benincà (2001), qui montrent seulement que les HT sont dans une position supérieure à la position Topique qu’elle attribue à LD. 57. Pour une hypothèse semblable de génération du marqueur de proposition ou de subordonnée finie dans Finitude°, cf. Bayer (2004), Ledgeway (2012). 58. Par « système » ici, nous entendons tout « lecte » au sens de Oliviéri (2010). Ainsi, il peut s’agir d’un dialecte ou d’un ensemble de dialectes, de même que d’idiolectes. 59. En ce cas, le que qui le suit resterait dans la position Finitude°. Rappelons aussi que l’on trouve aussi bien des HT que des LD avant le complémenteur en occitan (cf. 34). 60. Ce n’est pas le lieu de développer un tel propos ici, mais on trouvera des idées voisines dans Faure (2012). 61. Nous suggérons que le chinois puisse être un représentant de ce type de langue, mais cette hypothèse repose sur une analyse controversée des particules et des complémenteurs en chinois. Il appartiendra donc aux spécialistes du domaine de la confirmer ou de l’infirmer. 62. Pour les locuteurs de dialectes provençaux que nous avons interrogés, il s’agit, dans le meilleur des cas, d’une relative. 63. Cf. Lopez (2009). 64. Cf. Oliviéri & Sauzet (à paraître). 65. Notamment par P. Sauzet (communication personnelle).

ABSTRACTS

Occitan Topicalisation Strategies Though Romance languages are rather uniform in that they display two types of left-sided topicalizations: Hanging Topic (HT, main clauses) and Left Dislocation (LD, main and embedded clauses), some Occitan (along with some Italian) dialects depart from this pattern and allow for HT to be embedded. We point out the drawbacks of the theories where such topics are taken to be licensed by a specific predicative role (Sauzet 1989) or not to be embedded (Lahne 2005), and show that Occitan leftmost functional head (Rizzi’s 1997 FORCE°) is endowed with a strong feature attracting topical DP (possibly a declarative feature). The strength of this feature is parameterized and makes interesting typological predictions.

Alors que toutes les langues romanes connaissent les deux types de topicalisation à gauche : le topique suspendu (HT, dans les propositions principales) et la dislocation gauche (LD, dans les propositions principales et les subordonnées), quelques dialectes occitans (et peut-être quelques dialectes italiens) se distinguent en présentant aussi un topique suspendu enchâssé. Cet article met en évidence les difficultés soulevées par les analyses antérieures, notamment celle de Sauzet (1989) qui suppose qu’un rôle prédicatif spécifique légitime ce type de topique et celle de Lahne (2005) qui postule que le topique n’est pas enchâssé. Nous montrons que, en Occitan, la tête fonctionnelle la plus à gauche (FORCE° de Rizzi 1997) porte un trait (déclaratif) fort qui attire le DP topicalisé dans la périphérie gauche de la proposition. La force de ce trait est ainsi paramétrée, ce qui permet de faire des prédictions typologiques intéressantes.

Corpus, 12 | 2013 181

INDEX

Keywords: topic, prolepsis, hanging topic, left dislocation, Occitan Mots-clés: topique, prolepse, topique suspendu, dislocation gauche, occitan

AUTHORS

MICHÈLE OLIVIÉRI Univ. Nice Sophia Antipolis, CNRS, BCL, UMR 7320, 06300 Nice, France

Corpus, 12 | 2013 182

Testing linguistic theory and variation to their limits: The case of Romance

Adam Ledgeway

1 Drawing on a number of corpus studies, including a considerable amount of data taken from my own corpora of textual and fieldwork studies on the dialects of Italy, I shall explore, in a manner which is accessible to both general scholars of the Romance languages and linguists, how the richly documented diachronic and synchronic variation exhibited by the Romance languages, and especially their dialectal varieties, offers an unparalleled wealth of linguistic data (often of a typologically exotic nature) of interest not just to Romance linguists, but also to general linguists. This perennially fertile and still under-utilized testing ground, I will show, has a central role to play in challenging linguistic orthodoxies and shaping and informing new ideas and perspectives about language change, structure and variation, and should therefore be at the forefront of linguistic research and accessible to the wider linguistic community. At the same time, a familiarity with current key ideas and assumptions in theoretical linguistics has an important role to play in understanding the structures and patterns of Romance, and, in particular, those known to us only through the texts of earlier periods where native speakers are not available to provide crucial grammaticality judgments and fill in the missing empirical pieces of the relevant puzzle.

2 Following a brief introduction in §1 to linguistic variation across Romance in relation to parameters, universals and language typology, I shall then explore in §2 some case studies of microvariation across Romance which highlight what Romance can do for syntactic theory by way of testing, challenging and expanding our theory of language and the empirical base. By the same token, the tools and insights of current theories of syntax can also be profitably used to throw light on many of the otherwise apparently inexplicable facts of Romance microvariation, the topic of the §3 where I shall highlight what syntactic theory can do for Romance through the exploration of a number of Romance case studies which have traditionally proven, at the very least, extremely difficult to interpret in a unitary and satisfactory fashion.

Corpus, 12 | 2013 183

1. Linguistic variation

1.1 Parameters

3 One of the areas in which research into Romance has proven particularly influential is the investigation of linguistic parameters, those dimensions of linguistic variation along which natural languages are said to vary. To cite just one simple example, in his Issues in Italian Syntax, Rizzi (1982) observed that whereas in languages like English it is impossible to move a relative pronoun like to whom in (1a) from the embedded indirect question which lies they told… to the next clause up, such movement is possible in the corresponding Italian example (1b), where a cui successfully raises out of the embedded clause headed by che bugie.1

4 Rizzi’s solution, subsequently widely adopted, was to propose that the difference between English and Italian observable in (1) is a consequence of a different parametric setting on the boundaries for movement in natural languages (viz. subjacency): in English inflected verb phrases (IPs) constitute boundaries for movement, of which a maximum of only one can be crossed in any one derivation, whereas in Italian complementizer phrases (CPs) count as boundaries for movement, of which again only one can at most be crossed. Therefore, the ungrammaticality of (1a) follows because the phrase to whom illicitly moves over two boundaries, namely I wonder and they told, whereas (1b) is grammatical because the relative a cui crosses only one boundary, the CP introduced by che bugie.

5 In more recent years the significance of Romance dialects for the generative enterprise has also been increasingly recognized, inasmuch as they offer fertile, and often virgin, territory in which to profitably study parametric variation. While neighbouring dialects tend to be closely related to each other, manifestly displaying in most cases a high degree of structural homogeneity, they do nonetheless often diverge minimally in significant ways which allow the linguist to isolate and observe what lies behind surface differences in particular parametric settings across a range of otherwise highly homogenized grammars. By drawing on such microvariation, it is possible to determine which phenomena are correlated with particular parametric options and how such relationships are mapped onto the syntax. A clear example of such reasoning comes from the so-called dative shift construction, a phenomenon attested in a number of Germanic languages whereby an underlying indirect object, such as to Mary in (2a), can be reanalyzed and promoted to direct object, where Mary now comes to precede the old direct object a book. Furthermore, it has been claimed that the possibility of dative shift is linked to another structural property, that of stranding prepositions in wh-questions and relative clauses, as demonstrated in (2b)

Corpus, 12 | 2013 184

6 In contrast, it is claimed that Romance languages do not display either dative shift or preposition stranding (Kayne 1984; Larson 1988: 378; Demonte 1995: 8), as the sharp ungrammaticality of the Italian examples in (3) demonstrates:

7 This apparent Germanic vs Romance parametric variation is complicated by the fact that something very similar, if not identical to dative shift, is found in many southern Italian dialects (Sornicola 1997: 35-36; Ledgeway 2000: 46-52; 2009a: 844-847), witness the representative Neapolitan and Cosentino examples in (4):

8 Beginning with the Neapolitan example (4b), we see that the RECIPIENT argument a Mario, the underlying indirect object in (4a), has been advanced to direct object and is now marked by the prepositional accusative (PA), as shown by its position in front of the old direct object na torta and by the fact that a Mario is now referenced by an accusative clitic pronoun o “him”, and not the third person dative pronoun nce in (4a). Other neighbouring southern dialects such as Cosentino, by contrast, exhibit a more constrained type of dative shift, inasmuch as RECIPIENT arguments (cf. dative clitic cci “to him” in (4d)) may only surface as direct objects (cf. accusative clitic u “him” in (4e)) in monotransitive clauses.

9 These Italian dialects reveal therefore three important things. Firstly, dative shift is not a Germanic vs Romance parametric option. Secondly, the supposed link between dative shift and preposition stranding, argued to be derivable from a single parametric option, does not hold, the presence of both phenomena in languages like English simply representing a fortuitous combination rather than the principled outcome of a particular parameter setting, since preposition stranding is not found in these same southern dialects (cf. 4c). Thirdly, it is incorrect to subsume all instances of accusative marking of RECIPIENT arguments under the generic heading of dative shift, since some of the dialects of southern Italy prove sensitive to the mono- vs ditransitive distinction (cf. 4e). It follows therefore that what might otherwise be taken to represent the surface reflexes of a single parametric setting, in dialects like Neapolitan, namely the accusative marking of all RECIPIENT arguments irrespective of whether they occur in

Corpus, 12 | 2013 185

mono- or ditransitive clauses, turns out in fact to conceal two distinct structural operations in the light of evidence gleaned from dialects such as Cosentino.

1.2 Language universals

10 Romance varieties also have much to contribute in the area of so-called universal principles of language, essentially a system of rules forming part of the genetic endowment known as Universal Grammar which are believed to hold of all human languages. A good illustration of the valuable role that Romance can play in testing linguistic universals concerns the licensing of nominative Case. Within current theory, it is assumed that Infl, the locus of verbal inflection, may be specified as [+tense] or [- tense], featural specifications which in turn are argued to correlate respectively with the verb’s ability or otherwise to license a nominative Case-marked subject. This [±tense] distinction is supported by the evidence of many of the world’s languages, including French where tensed verbs license nominative subjects (5a), but untensed verbs such as infinitives and gerunds only allow null (Caseless) PRO subjects (5b):

11 Yet, the evidence of Romance dialects reveals that the supposed universal correlation between the specification of Infl and the availability of nominative Case is entirely spurious (Ledgeway 1998; 2000: ch. 4; Mensching 2000).14 In particular, dialects from the length and breadth of the Romance-speaking world demonstrate an abundant use of overt nominative subjects in conjunction with infinitival verbs:

1.3 Typological variation

1.3 Typological variation

12 Data like those exemplified in (6) also illustrate how investigations of Romance dialects frequently reveal that the extent of typological variation within Romance, and indeed

Corpus, 12 | 2013 186

even within Indo-European, can in particular cases prove to be considerably greater than is traditionally assumed. In this respect, one only has to think of such examples as the Romance inflected infinitives, gerunds and participles illustrated in Tables 1 and 2 with representative examples in (7)2, which, as intermediate categories, clearly throw into turmoil traditionally narrow interpretations of finiteness in terms of a binary finite vs non-finite dichotomy (cf. Ledgeway 2007c): Table 1. Romance inflected infinitives (cant- “sing”)

Infinitive 1sg 2sg 3sg 1pl 2pl 3pl

Glc. cantar -Ø -es -Ø -mos -des -en

OLeo. cantar -Ø -es -Ø -mos -des -en

ONap. cantar(e) -Ø -Ø -Ø -mo -vo -no

(E)Pt. cantar -Ø -es -Ø -mos -des -em

Srd. cantare -po -s -t -mus -dzis -n

Table 2. Romance inflected gerunds & participles (cant- “sing”)

Gerund Present/Past Participles

Glc. Pv. de At. ONap.

cantando cantand(o) cantanno cantante cantato

1sg -Ø -Ø -Ø -Ø -Ø

2sg -Ø -s -Ø -Ø -Ø

3sg -Ø -Ø -Ø -Ø -Ø

1pl -mos -mos -mo – –

2pl -des -eis -vo (-ve) – –

3pl – -em -no (-ne) -no -no

Corpus, 12 | 2013 187

13 Another acute example comes from the unique infectious development of inflection in the Marchigiano dialect of Ripatransone.3 Simplifying somewhat, in addition to the usual person/ number agreement, the Ripano finite verb simultaneously displays masculine/feminine gender agreement with the subject, not to mention the possibility of agreement with a so-called third person neuter subject, by means of final inflectional vowel contrasts which, to all appearances, seem to have been grafted onto the verbal paradigm from the nominal paradigm. By way of example, we illustrate below in Table 3 the nominal paradigm for fijj- “son, daughter” and prəʃuttə “ham” together with the present tense paradigm of the verb magnà “to eat” and piovərə “to rain”: Table 3. Ripano nominal & present indicative paradigms

Masc. Fem. Neut. Pers. Masc. Fem. Neut.

1sg

Sg. fijju fijje prəʃuttə 2sg magnu magne

3sg piovə

1pl magnemi magnema

Pl. fijji fijja 2pl magneti magneta

3pl magni magna

14 Far from being limited to finite verbs, such a rich and complex system of agreement has come to permeate even non-finite verb forms such as past participles (8a), gerunds (8b) and infinitives (8c), not to mention other parts of speech including predicative nominal complements of the copula avé “to have” (9a), wh-interrogatives (9b) and quite remarkably, on a par with such languages as Welsh, prepositions (9c):

Corpus, 12 | 2013 188

1.4 Interim conclusions

15 From the preceding introductory discussion, it is clear that the wealth of Romance standard and especially dialectal data, although frequently overlooked in the past, have a great deal to contribute to research into such areas as parametric variation, linguistic universals and typological variation. Nonetheless, the syntax of the dialects still represents a relatively poorly understood area of , to the extent that there still remains a considerable amount of fieldwork to be done in recording and cataloguing the linguistic diversity within the Romània, as well as in bringing such facts to the attention of the wider linguistic community. With this in mind, in what follows we shall offer a number of valuable insights into the little-studied syntax of the Romance dialects in an attempt to highlight their significance for issues in general linguistic theory and their potential as relatively unexplored experimental territory in which to investigate new ideas about language structure, change and variation. Keeping the technical detail to a minimum, we shall discuss a number of issues relating to the syntax of Romance under the two broad headings of what Romance can do for syntactic theory and what syntactic theory can do for Romance. Under the former heading we shall review a number of assumptions about language structure and variation that have been proposed in the literature, demonstrating how in the specific cases examined the Romance dialect data contradict such principles and parameters, rendering them either invalid or in need of further elaboration. Under the latter heading, by contrast, we shall bring to light some of the less familiar and more problematic aspects of Romance syntax which can be shown to find an enlightening interpretation in light of current theoretical assumptions.

2. What Romance can do for syntactic theory

2.1 Pro-drop parameter

16 Undoubtedly, one of the best known and most widely studied parameters is the so- called pro-drop (or null subject) parameter (for a recent overview, see Biberauer, Holmberg, Roberts and Sheehan 2009). Limiting our attention to Romance and Germanic, it is traditionally claimed that, with the exception of modern French, morphological Agr(eement) for person and number on the Romance verb is sufficiently rich to license a null subject (11a), whereas in such languages as English Agr is so impoverished that that it is unable to recover the identity of a null pronominal subject which must instead be phonologically expressed (10a). By the same token, it is also assumed (cf. Chomsky 1981: 28; Rizzi 1986: 410; Haider 2001: 285) that expletive (or non-referential) pronouns are null in the former (11b) but overt in the latter (10b).4

Corpus, 12 | 2013 189

17 On a par with others, Rizzi (1982: 143ff.) derives this supposed universal distinction from the pro-drop parameter, which he argues yields the four language types illustrated in Table 4: Table 4. Typology of null subjects

Type 1 Type 2 Type 3 Type 4 Pronoun English Spanish German ?

Null referential – + – +

Null expletive – + + –

18 Language types 1 and 2 are exemplified by English and Spanish, respectively. In Spanish both null expletives and null referential pronouns are licensed, whereas in English both types of null pronoun are excluded. Type 3 is argued to characterize German where, in contrast to referential pronouns which are invariably overt (12a), overt expletive pronouns are only licensed when they occur in clause-initial position (12b):

19 On the other hand, Rizzi (1982: 143) explicitly argues that type 4 languages with overt expletive subjects but null referential subjects are “excluded for intrinsic reasons”. However, the evidence of a number of non-standard Romance varieties demonstrates that type 4 languages do indeed exist. For example, although Neapolitan is a pro-drop language (13a), it also displays structures such as those in (13b) where the subject position is filled by the overt expletive chello “that” (Sornicola 1996; Ledgeway 2009a: 290-294; 2010), a pattern replicated by a number of other Romance varieties (14a-e).

Corpus, 12 | 2013 190

20 With the exception of the northern Occitan example in (16f), for which see Kaiser, Oliviéri and Palasis (in press), in most cases the use of the overt expletive in such examples is associated with specific pragmatic functions (Sornicola 1996: 325-326; Ledgeway 2003; 2009a: 290-291; Hinzelin 2009), typically marking the illocutionary force of the clause as exclamative (cf. 14c) or interrogative (often with rhetorical overtones; cf. 14d-e), a usage which still requires much more detailed investigation. Summing up, the data considered here lead us to conclude, with Kaiser, Oliviéri and Palasis (in press), that the ability to drop referential pronouns and the availability of overt expletives are not necessarily mutually exclusive or, for that matter, two interrelated properties of a single pro-drop parameter. At the same time, however, the overt expletives of most of these Romance dialects cannot be equated tout court with those of languages like English and French in view of the marked pragmatic functions of the former and the purely syntactic nature of the latter.

21 The wealth and extent of the Romance evidence is such that our typology of null subjects does not, however, stop here. Turning our attention to medieval Romance, it has long been noted (Adams 1987; Roberts 1993: §3.2; Benincà 1994; 2006; 2010: §3.2.1; Salvi 2004: 16f., 26-31; Ledgeway 2012a: 74-75) that these varieties display an asymmetric distribution of null subjects, a pattern more robustly represented in Gallo- Romance (French, Occitan, and northern Italian dialects) than either in Ibero-Romance or central-southern Italo-Romance (Salvi 2004: 30f.). In particular, whereas in root clauses null subjects are freely licensed (15a-c), in subordinate clauses pronominal subjects must usually be phonologically expressed (16a-c), although not interpreted as emphatic or contrastively-focused. Illustrative in this respect is the old Umbro-Tuscan example in (16c), where, despite the coreference of main and embedded clause subjects, the latter is overtly realized yielding a structure which would be judged ungrammatical, for example, in modern Italian where the presence of an overt pronoun in the same context would typically signal switch reference.

Corpus, 12 | 2013 191

22 This asymmetrical distribution leads us to conclude that null subjects in medieval Romance were not licensed exclusively, if at all, by rich verb inflection for person and number, insofar as verbal Agr is equally rich in both root and subordinated clauses, but by a structural property (to be discussed below in §3.2) which aligns the verb with distinct positions in both clause types. Indeed, the unreliability of verb morphology as a diagnostic for correctly predicting the distribution of null subjects is further evidenced by Ripano, a pro-drop variety, whose verb was seen in Table 3 above, witness the three singular persons of the paradigm (namely. magnu (m.) vs magne (f.)), to privilege the marking of gender over that of person, despite traditional claims that the licensing of null subjects is directly linked to the overt marking of the person feature.

23 In summary, the null pronominal types seen in medieval Romance and Ripano cannot be readily accommodated in terms of currents theories of a binary null subject parameter (cf. also Oliviéri 2009; Kaiser, Oliviéri and Palasis in press) and, in particular, the typology of null subjects predicted by such models as that observed in Table 4 above which ultimately reduce tout court the distribution of null pronominals to the availability of rich morphological Agr for person on the finite verb.

2.2 Verb positions

24 The confines of the verbal domain are generally taken to extend beyond the immediate v-VP shell, where the external and internal arguments are first-merged, to include a dedicated structural position Infl(ection) (Chomsky 1981; 1986) > T(ense) (Chomsky 1995). The latter represents the locus of verbal inflection and licenses the external

Corpus, 12 | 2013 192

argument’s Case and phi-features with which it enters into a Spec-head configuration upon raising of the subject to its associated specifier position (SpecIP > SpecTP). Not only can this head position be lexicalized by distinct auxiliaries (cf. epistemic use of Catalan auxiliary deure “must” to express supposition in (17a)) but, in the absence of the latter, may be overtly filled by the raised lexical verb where its finite inflectional features can be licensed (cf. epistemic use of the future in substandard Catalan to express supposition in (17b); see Badia I Margarit 1962, I: 391).

25 These structural assumptions provide a natural way of interpreting the observed contrast in the (unmarked) position of the finite verb in languages like English (18a) on the one hand and French (18b) on the other:

26 Exploiting the fixed positions of VP-adverbs like “always” as a diagnostic indicator of the left edge of the v-VP complex, we can now straightforwardly distinguish between overt verb-raising languages like French, where the finite verb raises to the Infl position to the left of VP‑adverbs, and languages like English, where the verb remains in situ to the right of such VP-adverbs and the Infl position is not overtly lexicalized in the syntax, a difference traditionally retraced to the respective richness of verbal inflection in the two languages (Emonds 1978; Pollock 1989; Belletti 1990).

27 Nonetheless, recent research has revealed a much more nuanced interpretation of Romance verb movement than these familiar broad-brush treatments which classify Romance tout court as having overt verb movement. Following the seminal work of Cinque (1999), Infl is now commonly interpreted as a general label for the rich inflectional area of the clause (the I‑domain) made up of a series of distinct functional projections dedicated to marking various temporal, aspectual, modal and distinctions ranging over the lexical verb, its arguments, and possible adjuncts which can also be identified by the semantically corresponding adverbial modifiers they host (cf. also Cinque 2002; 2006; Belletti 2004; Rizzi 2004). Armed with these assumptions about a universal fixed hierarchy of adverb positions and corresponding functional projections, we can now construct a fine-grained typology of Romance varieties along the lines of (19):

28 Although in all three varieties exemplified in (19) the finite lexical verb invariably leaves its base position to vacate the verb phrase, witness its position to the left of the completive adverb “everything” immediately adjacent to the VP, it raises to different

Corpus, 12 | 2013 193

functional projections within the I-domain as illustrated by its differential position with respect to different adverb classes. For example, in Spanish (19a) the finite verb raises to the head position of the continuative aspectual projection immediately below the adverb “still”, whereas in Italian (19b) it appears to raise slightly higher to the head position of the habitual aspectual projection below the adverb “usually”, and in French (19c) it raises to the highest available position above all adverb classes.

29 On the basis of evidence like this, let us assume that the various adverbs and their associated functional projections making up the inflectional core of the clause can be broadly divided into two “spaces” termed the Lower Adverb Space (LAS) and the Higher Adverb Space (HAS). Broadly speaking, the HAS comprises modal functional projections variously spelt out by speaker-oriented adverbs marking such categories as evidential (e.g. “apparently”), epistemic (e.g. “presumably”) and irrealis (e.g. “perhaps”) modality, whereas the LAS principally includes aspectual functional projections lexicalized by adverbial classes including perfective (e.g. “always”) and continuative

(e.g. “still”) aspects, with temporal projections and associated adverbs (e.g. TPast-

“then”, TAnterior “already”) variously scattered across both spaces. Assuming in this way the clause to consist of a highly articulated functional structure, we can interpret a number of surface differences across Romance in terms of the varying extent of verb movement around different adverb classes in these two adverbial spaces, as illustrated in (20a-e):

30 It can be seen that whereas in French (20e) the finite lexical verb raises to the highest position within the HAS (Rowlett 2007: 106f.), in Calabrian (20a), Romanian (20b) and Spanish (20c) they typically raise only as far as the LAS.5 Italian (20d) represents an intermediate case insofar as the finite lexical verb targets a clause-medial position sandwiched between the HAS and the LAS (Cinque 1999: 31, 110f., 180 fn. 80; Ledgeway and Lombardi 2005: 87f.).

31 These same assumptions about the fixed positions of adverbs also allow us to plot the differential position of non-finite verbs such as the active participle in the following examples:6

Corpus, 12 | 2013 194

32 In contrast to what was observed with the finite verb (cf. 20e), the active participle moves least in French (21a), staying very low in the clause within the LAS to the right of the manner adverb “well” just above the v-VP, whereas in Calabrian (21d), Romanian (21e) and Spanish (21f) the active participle, unlike the finite verb in (20a-c), moves to the highest available position in the HAS beyond the perfective aspectual projection spelt out by the “always” adverb. In Sardinian and Italian, on the other hand, the position of the active participle displays greater freedom, raising in Sardinian (21b) no higher than “always” in the LAS, and possibly above “always” to a position in the HAS in Italian (21c).

33 In the literature there is no general consensus regarding the correct interpretation of V-movement to different clausal positions (for an overview, see Schifano 2011; in prep.), although traditionally there have been many attempts, as noted above, to relate the extent of movement to the richness or otherwise of the inflectional Agr of the verb, 7 witness Baker’s (1985; 1988: 13) Mirror Principle and Bobaljik’s (2002) Rich Agreement Hypothesis. In essence, approaches of this type attempt to drive syntactic operations from crosslinguistic morphological differences in individual languages. Admittedly, this view finds some initial support in the Germanic vs Romance contrast in (17a-b) where the Romance verb form, undoubtedly the inflectionally richest of the two, raises the highest. However, a brief comparison of the results reported in (20)-(21) above suffices to dispel such an approach, inasmuch as all the Romance varieties we have examined are what may be termed inflectionally rich languages, yet they display some quite marked differences in the extent of finite lexical and non-finite V-movement. This conclusion is further substantiated by the observation that much of the rich inflection of the modern French verb, unlike that of the other varieties examined, is predominantly orthographic, yet it shows higher verb movement of finite lexical verbs to the HAS than all other varieties.

34 Thus, to conclude, we have seen that the rich comparative evidence of multiple verb positions across Romance forces us to recognize a richer functional structure for the clause than has traditionally been assumed. More generally, we have established that from an empirical and a theoretical perspective broad-brush characterizations of Romance as invariably involving overt V-raising prove neither descriptively nor explanatory adequate, inasmuch as a more nuanced picture has to be recognized. At the same time, this same evidence has highlighted the danger of assuming a direct correlation between the richness of inflection and the extent of V-movement. 2.3 Mapping the left periphery of the clause

35 As seen in the previous section, one area of considerable interest in much recent syntactic research has been the investigation of the fine structure of the clause. Traditionally, the structure of the clause in a typical SVO language, of which almost all the modern Romance varieties are examples, has been taken to present (at least) the positions indicated in the linear template in (22a), exemplified from Italian in (22b):

36 The linear arrangement in (22a-b) reflects the standard idea that the confines of the clauses can therefore be identified with the preverbal subject position situated at the

Corpus, 12 | 2013 195

left edge of IP and the complement or adjunct position situated at the right edge of VP (23a). However, in recent years research within generative syntax has been increasingly directed towards the investigation of the fine structure of the left periphery, the syntactic space immediately to the left of the sentential core (23b), culminating in the seminal work of Rizzi (1997) which has given rise to a widely- accepted view of the fundamental cartography of the C(omplementizer)-domain (cf. also Benincà and Munaro 2010).

37 Significantly, a considerable amount of work on the split C-domain has been conducted on the basis of the rich (dialectal) variation offered by Romance varieties (for an overview and relevant bibliography, see Ledgeway 2012a: 154-171), which in many cases provide invaluable overt evidence with which to map the fine structural organization of the left periphery. In particular, the left periphery, traditionally defined in terms of CP and its associated Spec(ifier) and head positions hosting wh- operators and complementizers (Chomsky 1986: §1), respectively, is now conceived as a split domain, hierarchically articulated into several fields and associated projections. Revealing in this respect are Italian topicalization examples such as (24a-c), where one of the constituents of the sentential core in (22b) conveying old/given information has been fronted to the left periphery and picked up, where available, by a resumptive clitic pronoun on the verb in the sentential core, a case of (clitic) left dislocation.8 This, however, does not exhaust all available structural possibilities, witness the examples in (25a-d) where as many as two constituents have been fronted under (clitic) left dislocation, illustrating the fact that topic is a recursive category and capable of multiple realizations within the same utterance.

38 Further support for the richly articulated structure of the left periphery comes from a consideration of focus structures such as the Italian examples in (26), where a constituent of the sentential core in (22b) is fronted under contrastive focus to correct a previous assertion (cf. 26a-c). Significantly, however, fronted focused constituents are not in complementary distribution with fronted topicalized constituents, as the

Corpus, 12 | 2013 196

traditional simplex CP structure with its single left-peripheral position would lead us to believe, but can co-occur with left-dislocated topics in the strict order Topic + Focus, as shown in (27a-d).

39 Evidence like this from Italian and other Romance varieties suggests that the existence of a single left-peripheral position is empirically inadequate. Rather, the relevant left- peripheral positions must be reconceived as distinct ragmatic-syntactic spaces along the lines of Benincà & Poletto (2004), according to which we can identify from left to right at least two fields termed Topic and Focus, respectively (see also Cruschina 2012). Not only is this demarcation between Topic and Focus justified at a ragmatic-semantic level, in that elements appearing in the Topic field are generally interpreted as “old” or “given” information whereas the Focus field is typically associated with informationally “new” elements, but it also finds confirmation at the syntactic level. For instance, in contrast to elements appearing within the Topic field, which often call for a resumptive pronominal (clitic) where available (cf. 24a-b, 25a-d), those appearing within Focus (cf. 26d) typically prove incompatible with a pronominal copy (Benincà 2001: 43ff.). Moreover, we have already observed that topic is a recursive syntactic category allowing several reiterations within a given utterance, whereas focus is restricted to just one occurrence per utterance.

40 Robust evidence like this demonstrates that topicalized and focused constituents indeed target distinct spaces within the left periphery, forcing us to recognize a representation of the C-domain along the lines of (28) below:

Complementizer positions

41 In addition to the Topic and Focus fields highlighted above, the left periphery of the clause also hosts complementizers. Now alongside finite complementizers derived from QUOD/QUID and QU(I)A “(because >) that” which introduce tensed clauses (cf. (a) examples below), Romance varieties also present a series of non-finite complementizers derived from the prepositions DE “of, from” and AD “to” to introduce infinitival clauses (cf. (b)

Corpus, 12 | 2013 197

examples below), which to all intents and purposes parallel the use of their finite counterparts:

42 Despite appearances, the presumed parallelism between finite and non-finite complementizers is not, however, perfect, as revealed by their respective positions in relation to topics and foci: whereas finite complementizers precede topics and foci (31a), non-finite complementizers invariably follow both types of fronted constituent (31b).

43 Evidence like this forces us to assume that the Topic and Focus fields outlined above are, in turn, closed off upwards by a higher complementizer position (termed Force) marking the illocutionary force of the clause and hosting such items as the Romance finite declarative complementizer que/che “that”, and downwards by a complementizer position (termed Fin(iteness)) specifying the modality and/or finiteness of the clause and hosting such items as the Romance infinitival complementizers de/ di “of”, as schematicized in (32).

44 Indeed, some Romance varieties present dual finite complementizer systems which appear to exploit both the higher and lower complementizer positions within the left periphery. Such is the case in Romanian and many southern Italian dialects,9 which contrast an indicative/declarative complementizer (QU(I)A “because” >) că/ca that lexicalizes the higher complementizer position, and therefore precedes topics and foci (33a), and a subjunctive/irrealis complementizer (e.g. SI “if” > Ro. să) that lexicalizes the lower complementizer position, and therefore follows topics and foci (33b):

Corpus, 12 | 2013 198

45 Such dual complementizer systems are widely found in the dialects of southern Italy, as illustrated in Table 5 (Rohlfs 1969: 190; Ledgeway 2004a; 2005; 2006; 2009b; 2012b): Table 5. Southern Italian dual complementizer systems

penso che verrà voglio che lui mangi It. “I think that he’ll come” “I want that he should eat”

Sic. pensu ca vèni vògghiu chi mmanciassi

Mes. critu ca vèni ògghiu mi mancia

S.Cal. pensu ca vèni vogghiu mu (mi) mangia

N.Cal. criju ca vèni vuogliu chi mmangia

Sal. crisciu ca vène ogghiu cu mmancia

Nap. pènsə ca vènə vògliə chə mmangə

N.Pgl. pènsə ca vènə vògghiə chə mmangə

Abr. pènsə ca vènə vòjjə chə mmangə

46 Further compelling evidence for these two complementizer positions comes from those varieties which allow the simultaneous lexicalization of both positions around a fronted topic or focus constituent (a a case of so-called “recomplemenation”), including many early Romance varieties (34a-b; Wanner 1998; Paoli 2003a; Ledgeway 2004a: §4.3.2.2; 2005: 380-389; Vincent 2006), and a number of modern Italian dialects (34c; Paoli 2002; 2003a,b; 2005; D’Alessandro and Ledgeway 2010) and modern Ibero-Romance varieties (34d; Demonte and Fernández-Soriano 2009; Gupton 2010: 227-234; Villa- García 2010).

Corpus, 12 | 2013 199

47 Finally, unique within Romance is the situation encountered in Gascon since around the sixteenth century, where the [+finite] feature of affirmative root clauses is exceptionally spelt out in the systematic lexicalization of the lower complementizer position Fin through the complementizer que “that”.10 Firm proof that que spells out the lower complementizer head is provided by the observation that, apart from object , nothing can intervene between que and the finite verb such that all preverbal lexical subjects must occur to the left of que. This latter observation highlights the fact that, unlike in other Romance varieties, there is apparently no preverbal subject position within the sentential core in Gascon, such that all subjects have to be syntactically fronted to a topicalized (typically if old and definite; 35a) or focalized (typically if new and indefinite; 35b) position within the left periphery. These facts find an immediate explanation in the assumption that que lexicalizes the Fin position, since finiteness is standardly assumed to license nominative Case, hence Gascon would appear to have grammaticalized the locus of finiteness and, by implication, the licensing of nominative subjects within the left periphery (as happens in V2 varieties), rather than in the sentential core.

48 The fine structure of the left periphery can therefore be summarized as in (36):

Corpus, 12 | 2013 200

2.4 Interim conclusions

49 The discussion so far has highlighted the importance of Romance data, and especially those from the still under-utilized non-standard varieties and dialects, in making us rethink some of our most basic assumptions about language structure and variation. In particular, we have seen that standard interpretations of the null subject parameter prove insufficient in terms of the limited range of null and overt pronominal subject types they predict, the limited predictive power of rich inflection in the distribution of null subjects, and the non-universality of inflection for person in licensing null subjects. Within the verbal domain we have established that the now classical typological distinction between V-raising and non-V-raising languages, which places Romance among the former, proves empirically inadequate. By contrast, we have observed that the extent of V-movement across Romance varies enormously, revealing a whole host of different positions which can, in turn, be taken to spell out the vast range of functional projections that make up the rich architecture of the sentential core. In a similar vein, this rich functional design of the clause has been shown to extend to the left periphery, where the Romance evidence forces us to recognize a richly-articulated functional space composed, at the very least, of topic and focus fields sandwiched in turn, between two complementizer positions.

3. What linguistic theory can do for Romance

3.1 Word order

50 Undoubtedly one of the most striking differences between modern and medieval Romance varieties is manifested in the, often, radically differing word order patterns they permit in root clauses. By way of illustration, consider the old Neapolitan sentences in (37a-b) and their modern Italian translations in (38-b):

51 (37a-b) exemplify a common early Romance structure in which the preverbal position is occupied by some constituent other than the subject, namely the direct object (viechy) and a non-subcategorized adverbial phrase (de poy queste parole), respectively. In the former case, the fronted rhematic direct object, which conveys new information, constitutes an example of informational focus (Lambrecht 1994: ch. 5; Cruschina 2012), and contrasts sharply with many modern Romance varieties such as Italian (cf. 26-27),

Corpus, 12 | 2013 201

where preposing of rhematic constituents is only found under quite restrictive pragmatic conditions (namely, to license contrastive focus), insofar as rhematic objects conveying informational focus canonically occur in postverbal position (cf. 38a). Similarly, example (37b) demonstrates how when the preverbal position is occupied by a constituent distinct from the subject, the latter, whenever overtly realized, is generally required to follow the verb, giving rise to an apparent case of verb-subject inversion. Significantly, in this and similar examples of inversion the subject does not simply follow the verb but also precedes any other sentential constituents (subcategorized or otherwise), witness the order subject (lo messayo) + direct object (licencia) in (37b). In modern Italian, by contrast, postverbal subjects generally follow their associated objects and other sentential constituents, and in such cases are typically associated with rhematic interpretations, whereas the postverbal subject in (37b) is clearly thematic. Consequently, in the modern Italian translation of (37b) illustrated in (38b) the thematic subject obligatorily occurs in preverbal position.

52 Word order patterns such as those just considered, which can be easily replicated for other early Romance varieties (cf. 39a-g), have led a number of linguists to argue that medieval Romance word order is characterized by a verb second (V2) constraint.11 During this V2 stage sentences consist therefore of two principal parts (39a), a sentential core (IP) with fixed S V O Adv order on a par with what we have already witnessed in §2.3 for modern Romance, and a richly-articulated left periphery (CP) along the lines of (36) to whose lowest C(omplementizer) position (Fin) the finite verb raises in root clauses, where it is preceded by one or more elements fronted from the sentential core to the Topic and Focus fields to be assigned a pragmatically salient reading. In embedded clauses, by contrast, the left periphery generally hosts an overt Comp(lementizer) and the finite verb is consequently forced to remain within the sentential core, yielding the order S+V+O+Adv (39b). Thus, as the following representative early Romance examples demonstrate, alongside S+V+X (39c) we also

frequently find in main clauses O+V(S) (39d), IO+V(S) (39e), OPP+V(S) (39f), and Adv+V(S) (39g), whereas embedded clauses invariably display rigid S+V+ O+Adv (39h):

Corpus, 12 | 2013 202

53 In conclusion, we thus see that the fine structure of the sentential core (§2.3) and the left periphery (§2.3.1) independently established above on the basis of modern Romance data provide us with the necessary pragmatico-syntactic tools to interpret the facts of medieval Romance word order.

3.2 Pro-drop parameter revisited

54 Returning to our observation regarding the distribution of null subjects in medieval Romance (cf. examples (15)-(16) in §2.1), this same generalized raising of the finite verb to C(omp) under V2 also provides us with an elegant and highly natural explanation for the asymmetric distribution of null subjects in early Romance. In particular, when the verb raises to the vacant C position, null subjects are freely licensed (40a), whereas in subordinate clauses, where the finite verb is forced to remain in situ within the sentential core, pronominal subjects must be phonologically expressed (40b), although not interpreted as emphatic or contrastively-focused.

55 This asymmetrical distribution leads us to conclude that null subjects in medieval Romance were not licensed exclusively, if at all, by rich verb inflection for person and number, but, by a property which the finite verb uniquely acquires by raising to the

Corpus, 12 | 2013 203

vacant C position, presumably the locus of finiteness in medieval Romance (cf. Ledgeway 2012a: §3.4.1).

56 Interestingly, this archaic pattern has been exceptionally retained in modern Corsican (Marchetti 1974: 25, 51, 85, 94, 119), which behaves as a canonical Romance null subject variety in root clauses (41a-b), but which in embedded contexts usually requires referential (41a-c) and non-referential (41d) pronominal subjects to be overtly realized, albeit in reduced clitic form (cf. tonic/clitic eio/e, o (1sg), tù/tu (2sg), ellu/ella / (e)llu/ (e)lla (3m/fsg), noi/no (1pl), voi/vo (2pl), elli/elle / (e)lli/(e)lle (3m/fpl)). This distribution of null and overt pronouns is however only superficially similar to medieval Romance, in that modern Corsican is not a V2 variety and the finite verb occurs in the sentential core in all cases, irrespective of the realization of the pronominal subject. However, when the finite verb does raise to the vacant C(omplementizer) position, as happens in polar interrogatives (41e), realization of the clitic subject pronoun is blocked in a similar fashion to what was seen for medieval Romance (cf. 40a).

3.3 Placiti cassinesi

57 We now turn to the area of Romance philology and, in particular, the Placiti cassinesi (Bartoli 1944-45; Castellani 1973: 59-76; Bianchi, De Blasi and Librandi 1993: 211-212). Ignoring the Indovinello veronese, the Latin features of which are hardly negligible, these four brief, formulaic, sworn declarations composed in Capua, Sessa Aurunca and Teano (all situated in the modern-day southern Italian region of Campania) and dating between 960 and 963 are generally taken to represent the first documented attestations of the vernacular within the Italian Peninsula. Below is reproduced the first of these, the Placito capuano from March 960, which relates to a land dispute between the abbot of Montecassino and a certain Rodelgrimo who claimed, through inheritance, ownership of the lands which the abbot maintained had been the property of the

Corpus, 12 | 2013 204

monastery of St. Benedict of Montecassino for thirty years. In the absence of any official documentation of ownership, the judge ordered the abbot to produce three witnesses to authenticate his claim, each of which was reported to have sworn the oath in (42):

58 Although a very short text, the Placito capuano is not without its problems, raising a number of qualitative and interpretive issues for the philologist. In particular, given the extremely brief and formulaic nature of the text, it is legitimate to question what is the value, if any, of the linguistic evidence that such a short piece can genuinely offer the historian of the language. Indeed, this is a problem which arises with many of the earliest attestations of the Romance vernacular including, for example, the earliest Romance text, the Strasbourg Oaths of 842, another short sworn oath produced in an early French dialect of disputed origin.12

59 Another unresolved issue thrown up by the Placito capuano concerns the correct reconstruction of the pragmatico-semantic interpretation of the fronted constituents stacked up at the beginning of the embedded clause (namely, kelle terre, per kelle fini…, trenta anni), our reading of which is without doubt greatly hindered by the limited nature of our textual evidence. Again this is a frequent problem faced by philologists reading early texts, which in many cases only offer a rather brief glimpse of the language, especially when they only exist in fragmentary form, and whose linguistic physiognomy is often deliberately limited by the specific style and register of the text type.

60 A final observation concerns the appearance of the complementizer ko “that” in (42). Contrary to our expectations in light of the discussion of dual complementizer systems above (cf. Table 5 in §2.3.1), the epistemic main clause predicate sao “I know” selects for an indicative clausal complement headed, not by the expected indicative complementizer ca, but by what appears to be the subjunctive complementizer ko. How are we then to interpret the appearance of ko in this instance? Is it an example of a scribal error, or should it be taken at face value? As we shall see below, a consideration of this question in light of our preceding discussion of the fine structure of the left periphery provides an illuminating solution.

61 Putting together the results of the discussions of the previous sections regarding the fine structure of the left periphery of the clause (§2.3) and the philological evidence of the Placito capuano, it becomes clear that a knowledge of the relevant linguistic and philological facts can profitably complement one another. In particular, we begin by observing how, despite only providing a glimpse of the early vernacular, the Placito capuano is of immense interest both to the historian of the language and the historical linguist since, although a very short text, it is nonetheless astonishingly rich in linguistic evidence. More specifically, it is quite remarkable that such a short text, and the first one from the Italian Peninsula no less, should provide such extensive early

Corpus, 12 | 2013 205

evidence of the fine structure of the left periphery and, above all, incontrovertible proof for the existence of the two left-peripheral fields postulated in §2.1, which, in turn, hold the key to a proper pragmatico-semantic interpretation of the fronted constituents stacked up at the beginning of the embedded clause. In particular, the rigid ordering of the Topic + Focus fields postulated in §2.1, together with our observations regarding the potential recursiveness of topics but not focus, which is limited to a single occurrence, allows us to infer that the left periphery of the embedded clause hosts two thematicizations within the Topic field, namely kelle terre “those lands” (picked up by the resumptive clitic pronoun le “them”) and per kelle fini que ki contene “with those borders which are contained here”, and a contrastive focus trenta anni “(for) thirty years” within the Focus field, as illustrated in (43).

62 Turning now to the unexpected used of the complementizer ko (< QUOD) rather than ca, this too finds a principled explanation in terms of the structural organization of the complement clause. As demonstrated in Ledgeway (2004a; 2005), in the early dialects of southern Italy, including those of Campania, the distribution of the two complementizers co/che (< QUOD/ QUID) and ca (< QU(I)A) is not quite as neat as the traditional descriptions reviewed in §2.3.1 would lead us to expect (cf. Table 5). Whereas all types of subjunctive clause are introduced by che, indicative complement clauses are headed either by ca or che. Simplifying the facts somewhat (for detailed discussion, see Ledgeway 2005: §3), it will suffice to note here that either ca (44a) or che (44b) are employed when the left periphery of an embedded indicative clause does not contain any topics or foci, whereas che alone is found in the presence of fronted topics/ foci (44c), as witnessed by the following old Neapolitan examples:

63 In view of these distributional facts, it is possible to argue that old Neapolitan had just one indicative complementizer ca generated in the lowest complementizer position (Fin) which, whenever raised to the higher complementizer position (Force), as proves

Corpus, 12 | 2013 206

obligatory whenever topics or foci are present, is morphologically spelt out in the form F0 che (namely, caFin DE cheForce). In short, the overt form assumed by indicative co/che is interpreted as nothing more than the surface morphological reflex of raising ca from its base position to the higher complementizer position within the left periphery. Indeed, this analysis is directly supported by old Neapolitan recomplementation examples such as (34b) above where, crucially, the higher complementizer invariably surfaces in the morphological form co/che but the lower position is always spelt out as c(h)a, and never vice versa.

64 In this light, we can now return to the apparently erroneous selection of ko in the Placito in (42). It turns out after all that the use of ko here is not a scribal error or a singular mistake, but reflects the availability and use of two different complementizer positions determined by the informational structure of the embedded clause (cf. 45a) which, as we have seen in (43), contains a contrastively focused constituent preceded by two topicalized constituents. It is the activation of these Topic-Focus fields in the embedded left periphery which is directly responsible for the presence of ko, inasmuch as the complementizer ca is forced to move to the higher complementizer position in the presence of fronted topics or foci where it is spelt out as ko (45b). It now comes as no surprise therefore that the complementizer ca (or its graphic variants ka, cha) should not be employed in (42).

65 This example also highlights the dangers of dismissing too hastily the linguistic attestations offered to us by even the most meagre of philological evidence. In this F0 particular case, the Placito capuano provides an invaluable early example of the ca DE che alternation, which is not attested again in our textual record for the Campania region for at least another 350 years. Thanks however to this early attestation, we can conclude with confidence that the relevant complementizer alternation and associated positions licensed by the absence/presence of fronted topics and foci, otherwise richly attested in texts from the fourteenth century onwards (Ledgeway 2004a; 2005; Vincent 2006), must date back to at least the tenth century. Of course, it might be objected that the linguistic evidence of the texts is so formulaic that its value for the linguist is questionable on a number of counts. Indeed, a comparison of the Placito capuano with the other three Placiti cassinesi produced three years later in the nearby localities of Sessa Aurunca (46a) and Teano (46b-c) reveals such an extraordinarily high level of structural, discourse and lexical uniformity across all four texts that it would be naïve to imagine that all four sworn oaths represent authentic testimonies of the spontaneous spoken vernacular of the time.

Corpus, 12 | 2013 207

66 On the contrary, given the nature of the four oaths, which all had the specific purpose of persuading the court that a set of disputed lands had been in the possession of a given monastery for thirty years and consequently a legitimate part of the latter’s estate, it is more than likely that the illiterate peasants enlisted by the Church to serve as “independent” witnesses, presumably under the promise of personal financial reward, were given very precise instructions regarding what they were required to swear under oath. Nonetheless, it would be rash to disregard the evidence of these four short, highly formulaic written testimonies on these grounds alone; rather, given the Church’s deliberate efforts to place presumably authentic-sounding words and structures of the vernacular in the mouths of their witnesses, it is still possible to see in the language of these four texts a deliberate hypercharacterization of some of the most salient traits of the spoken language of the time such as the fronting of topicalized and focused constituents, which still constitutes to this day a characteristic feature of the spoken, rather than written, registers of Romance (cf. Duranti and Ochs 1979).

67 The discussion in this section has demonstrated that, when theory and philological evidence are considered together, the results of traditional philological and linguistic scholarship can be considerably enhanced. More specifically, we have seen that current theoretical assumptions about the design and architecture of the left periphery of the clause provide us with some novel and powerful tools to shed light on the interpretation and linguistic choices of one of the earliest Romance texts. At the same time, the Placiti cassinesi provide independent and robust evidence for these same syntactic assumptions. In short, and as abundantly demonstrated in this case study,

Corpus, 12 | 2013 208

linguistics and philology should complement each other to produce enlightening results, rather than be seen as alternatives to be pursued in isolation from each other.

3.4 Dual complementizer systems

68 Above in §2.3.1 we observed how Romanian and a number of southern Italian dialects employ a dual complementizer system (cf. Table 5) which distinguishes between a realis complementizer derived from QUIA (> ca, că) and an irrealis complementizer derived from QUID (> che, chi), QUOD (> cu), MODO (> mu, ma, mi) or SI (> să): while the former heads clauses selected by declarative and epistemic predicates (typically marked by the indicative; 47a), the latter is employed after predicates such as volitionals that characterize the state or events of their complements as unrealized at the time of speaking (typically marked by the subjunctive; 47b).

69 We also saw that both complementizers differ with respect to their relative positions in conjunction with fronted topicalized and focused constituents. For instance, as the preceding Salentino examples demonstrate, while ca precedes all such fronted elements (47a), cu must follow (47b). Facts like these led us to propose in terms of Rizzi’s (1997) split CP perspective that the realis complementizer (e.g. ca) lexicalizes the higher Force head and the irrealis complementizer (e.g. cu) the lower Fin head, as sketched in (48):

70 A further distinction between the two complementizers which, at first sight, does not seem to immediately follow from (48) concerns their phonological realization (Calabrese 1993; Terzi 1994; 1996; Ledgeway in press). For example, while in Salentino ca must always be pronounced (49a), cu may optionally remain unpronounced (49b), a case of what we may term C-drop.

71 Strikingly, even in those Romance varieties which do not display a dual complementizer system it is not infrequent for the finite complementizer (viz. que/che) to remain phonologically unpronounced, on condition that it introduces an irrealis complement (50b, 51b, 52), but not, crucially, when it introduces a realis complement (50a, 51a).13

Corpus, 12 | 2013 209

72 In view of the superficial similarity in the conditions regulating the distribution of C- drop in varieties with dual complementizer systems and languages such as Spanish, Italian and Occitan with apparently only one complementizer, it is tempting to extend the analysis of dual complementizer systems to languages of the latter type. In particular, we have established on the basis of dual complementizer systems that C- drop is a property uniquely licensed by the lowest C-related position, presumably

involving a residual V2 effect with raising of the modally-marked finite verb to CFin in the absence of the irrealis complementizer (Poletto 2001), but not by the realis complementizer which lexicalizes the highest C-related position Force and hence unavailable to finite verb raising under V2. By the same token, in its irrealis uses standard Romance que/che must also lexicalize Fin, thereby explaining its complementary distribution with finite verb raising under C-drop, in contrast to its realis uses where it lexicalizes the highest position Force.

73 In short, we are led to conclude that the dual complementizer system explicitly attested for such varieties as Romanian and the dialects of southern Italy must also be assumed to hold more generally for Romance where, despite the difference between the two complementizers not being overtly lexicalized, the relevant distinction between the two homophonous complementizers (que/che) is marked indirectly by their differential positions within the left periphery and their compatibility with C- drop (53a-c).

3.5 Noun positions

74 Oversimplifying somewhat, prenominal and postnominal adjectives positions typically correlate with the following respective interpretations in the modern standard varieties of Romance:14 (i) inherent / non-inherent (54a); (ii) descriptive / distinguishing (54b); (iii) subjective / objective (54c); and (iv) figurative / literal (54d).

Corpus, 12 | 2013 210

75 Matters were, however, quite different in early Romance, insofar as contrastive readings were not necessarily associated with the postnominal position as in modern Romance, but could equally be licensed in the prenominal position (Ledgeway 2007a; 2009a: 214f; Vincent 2007; Thiella 2008: ch. 4; Giusti 2010: 599-609).15 This is illustrated in the following near minimal pairs, where the adjective in each case invariably gives rise to a contrastive reading irrespective of its pre- or postnominal position.

76 Strikingly similar is the situation found in modern Walloon (Bernstein 1991), where all adjectival classes (apart from those expressing nationality) occur in prenominal position (56a-c), perhaps representing a conservative feature, although one cannot also exclude the (reinforcing) influence of neighbouring Flemish varieties.

77 By contrast, in a number of, especially non-standard, Romance varieties including Occitan (57a; cf. Wheeler 1988: 268), Sardinian (57b; cf. Jones 1993: 42) and central- southern Italian dialects (57c; cf. Rohlfs 1969: 330; Ledgeway 2007a), the prenominal adjectival position is extremely restricted and generally replaced by the postnominal position, which is neutral to the contrastive vs non-contrastive distinction:16

Corpus, 12 | 2013 211

78 Building on our discussion and analysis in §2.2 of variable verb positions around different adverbial classes distributed across the clause, it is possible to make sense of the variation witnessed in (54)-(57) along parallel lines in terms of the varying extent of N(oun)-movement in different Romance varieties. In particular, distinct adjectival positions can be reinterpreted as the surface reflex of the head noun variously moving across a rigidly-ordered series of different adjectival classes situated immediately above the NP, as shown in the structural representation in (58):

79 Assuming the much-simplified structure in (59a) in which AP1 and AP2 can be broadly understood as the “areas” in which non-contrastive and contrastive adjectives, respectively, are generated, we can now formally capture in a highly simple manner the differences between the non-standard varieties in (57a-c) on the one hand and standard Romance varieties (54a-d) on the other: in the former the nominal head typically raises to the highest available position above the highest adjectival projection

(AP1), which hosts non-contrastive adjectives from where it precedes both non- contrastive and contrastive adjectives (59b), whereas in the latter the noun only targets

the higher adjectival projection (AP1), from where it precedes non-contrastive adjectives but follows those with a contrastive reading (59c):

80 By the same line of reasoning, we can explain the frequent prenominal position of contrastive adjectives in early Romance (cf. 55a-c) by assuming that N-raising is only optional in the early varieties (60a-b), an archaic pattern still preserved to the present- day in Walloon where the nominal head barely moves at all (60c):

81 In conclusion, we see that there are truly striking parallels between the nominal and verbal domains and the functional structures associated with these, as revealed by the fixed positions of distinct classes of adjectival and adverbial modifiers, respectively. In particular, we have seen how different diachronic and diatopic varieties of Romance

Corpus, 12 | 2013 212

provide clear evidence for some considerable microvariation in terms of the extent of N-movement. Among the various patterns observed, we also identified a strong diachronic tendency for Romance nouns to climb progressively higher within the available nominal functional structure, the end result of which has given rise in a number of non-standard varieties to a semantic neutralization of the erstwhile interpretive difference between contrastive and non-contrastive adjectival readings.

Conclusion

82 Although modern linguistics as a discipline developed in large part out of the philological study of individual languages and language families such as Romance, it is a striking characteristic of contemporary research in both Linguistics and in Romance Studies that the traditional link between the two disciplines is often not as strong and prominent as it might be. To be sure, analyses within Romance linguistics which fail to take account of the most enlightening ideas and principles of linguistic theory risk overlooking and/or misconstruing the relevance of all or part of the available empirical evidence they are so at pains to correctly reconstruct, evaluate and interpret. By the same token, linguistic analyses which are blindly driven by theory-internal considerations with little or no real interest in actual data such as those offered by textual corpora and the numerous dialectal varieties of Romance run the risk of presenting a largely idealized and, by definition, necessarily selective representation of the available linguistic evidence. The result is a partial theory which is only capable of accounting for a subset of the available data that largely ignores the imperfections and irregularities characteristic of authentic linguistic productions. The discussion of the preceding sections, by contrast, has demonstrated that when theory and Romance evidence are considered together, the results of traditional Romance and linguistic scholarship can be considerably enhanced.

BIBLIOGRAPHY

Abeillé A. & Godard D. (1999). “La position de l’adjectif épithète en français: Le poid des mots”, Recherches linguistiques de Vincennes 28: 9-32.

Abeillé A. & Godard D. (2003). “Les prédicats complexes dans les langues romanes”, in D. Godard (ed.) Les langues romanes: Problèmes de la phrase simple. Paris: Editions de la CNRS, 125-184.

Adams M. (1987). , Null Subjects, and Verb Second Phenomena. UCLA: unpublished thesis.

Alisova T. (1967). “Studi di sintassi italiana. II. Le posizioni dell’aggettivo nel gruppo sintattico del sostantivo”, Studi di filologia italiana 25: 250-313.

Arnholdt K. (1916). Die Stellung des attributiven Adjektivs im Italienischen und Spanischen. Greifswald: Von Bruncken.

Corpus, 12 | 2013 213

Ayres-Bennett W. (1996). A History of French through Texts. London: Routledge.

Badia i Margarit A. (1962). Gramática catalana (2 vols). Madrid: Gredos.

Baker M. (1985). “The Mirror Principle and Morphosyntactic Explanation”, Linguistic Inquiry 16: 373-416.

Baker M. (1988). Incorporation. Chicago: University of Chicago Press.

Bec P. (1967). La langue occitane. Montpellier: PUF.

Belletti A. (1990). Generalized Verb Movement. Turin: Rosenberg & Sellier.

Belletti A. (ed.) (2004). Structures and Beyond. The Cartography of Syntactic Structures. Volume 3. Oxford: Oxford University Press.

Benincà P. (1994). “Un’ipotesi sulla sintassi delle lingue romanze medievali”, in P. Benincà (ed.) La variazione sintattica. Studi di dialettologia romanza. Bologna: il Mulino, 177-194.

Benincà P. (1995). “Complement Clitics in Medieval Romance: The Tobler-Mussafia Law”, in A. Battye & I. Roberts (eds) Clause Structure & Language Change. Oxford: Oxford University Press, 325-344.

Benincà P. (2006). “A Detailed Map of the Left Periphery of Medieval Romance”, in R. Zanuttini, H. Campos, E. Herberger & P. Portner (eds) Crosslinguistic Research in Syntax and Semantics. Negation, Tense, and Clausal Architecture. Washington: Georgetown University Press, 53-86.

Benincà P. (2010). “L’ordine delle parole e la struttura della frase : La periferia sinistra”, in G. Salvi & L. Renzi (eds) Grammatica dell’italiano antico (II volumi). Bologna: il Mulino, I, 27-59.

Benincà P., & Munaro N. (eds) (2010). Mapping the Left Periphery. The Cartography of Syntactic Structures, Volume 5. Oxford: Oxford University Press.

Benincà P. & Poletto C. (2004). “Topic, Focus, and V2. Defining the CP Sublayers”, in L. Rizzi (ed.) The Structure of CP and IP. The Cartography of Syntactic Structures. Volume 2. Oxford: Oxford University of Press, 52-75.

Bernstein J. (1991). “DPs in French and Walloon: Evidence for Parametric Variation in Nominal Head Movement”, Probus 3: 101-126.

Bernstein J. (1993). Topics in the Syntax of Nominal Structure Across Romance. CUNY: unpublished thesis.

Berruto G. (1998). “Sulla posizione prenominale dell’aggettivo in italiano”, in G. Bernini, P. Cuzzolin & P. Molinelli (eds) Ars linguistica. Studi offerti a Paolo Ramat. Rome: Bulzoni, 95-105.

Bianchi P., De Blasi N. & Librandi R. (1993). I’ te vurria parlà. Storia della lingua a Napoli e in Campania. Naples: Tullio Pironti.

Biberauer T., Holmberg A., Roberts I. & Sheehan M. (2009). Parametric Variation. Null Subjects and in Minimalist Theory. Cambridge: Cambridge University Press.

Bobaljik J. (2002). “The Rich Agreement Hypothesis in Review”, in Y. Abe (ed.) Complex Predicates and Argument Structure. Nanzan University, Nagoya: Research report for the Ministry of Education Grant-in-Aid for Scientific Research, 63-109.

Bosque I. (1996). “On Specificity and Adjective Position”, in J. Gutiérrez-Rexach & L. Silva-Villar (eds) Perspectives on Spanish Linguistics. Volume 1. UCLA: Department of Linguistics, 1-13.

Corpus, 12 | 2013 214

Calabrese A. (1993). “The Sentential Complementation of Salentino: A Study of a Language without Infinitival Clauses”, in A. Belletti (ed.) Syntactic Theory and the Dialects of Italy. Turin: Rosenberg & Sellier, 28-98.

Carballo Calero R. (1981). “Um exemplo de gerúndio flexional”, in Problemas da língua galega. Lisbon: Sá da Costa, 129-133.

Castellani A. (1969). “L’ancien poitevin et le problème linguistique des Serments de Strasbourg”, Cultura Neolatina 29: 201-234.

Castellani A. (1973). I più antichi testi italiani. Edizione e commento. Bologna: Pàtron.

Chomsky, N. (1981). Lectures on Government and Binding. Dordrecht: Foris.

Chomsky N. (1986). Barriers. Cambridge Mass.: MIT Press.

Chomsky N. (1995). The Minimalist Program. Cambridge Mass.: MIT Press.

Cinque G. (1999). Adverbs and Functional Heads. A Cross-Linguistic Perspective. Oxford: Oxford University Press.

Cinque G. (ed.) (2002). The Structure of DP and IP: The Cartography of Syntactic Structures, Volume 1. Oxford: Oxford University Press.

Cinque G. (2006). Restructuring and Functional Heads. The Cartography of Syntactic Structures. Volume 4. Oxford: Oxford University Press.

Cinque G. (2010). The Syntax of Adjectives. Cambridge, MA: MIT Press.

Cruschina S. (2012). Discourse-related Features and Functional Projections. Oxford & New York: Oxford University Press

D’Alessandro R. (2010). “The Verbal Domain: TP-VP Structure & Auxiliaries”, in R. D’Alessandro, A. Ledgeway & I. Roberts (eds) Syntactic Variation: The dialects of Italy. Cambridge: Cambridge University Press, 27-38.

D’Alessandro R. (2011). Agreement, Ergativity, Doubling and the Parametrization of Probes. Univeristy of Leiden: unpublished manuscript.

D’Alessandro R. & Ledgeway A. (2010). “At the C-T Boundary: Investigating Abruzzese Complementation”, Lingua 120: 2040-2060.

DeGraff M. (1997). “Verb Syntax in, and beyond, Creolization”, in L. Haegeman (ed.) The New Comparative Syntax. London: Longman, 69-94.

Demonte V. (1995). “Dative alternation in Spanish”, Probus 7: 5-30.

Demonte V. (1999). “A Minimal Account of Spanish Adjective Position and Interpretation”, in J. Franco, A. Landa & J. Martín (eds) Grammatical Analyses in Basque & Romance Linguistics. Papers in Honor of Mario Saltarelli. Amsterdam/ Philadelphia: Benjamins, 45-76.

Demonte V. & Fernández-Soriano O. (2009). “Force and Finiteness in the Spanish Complementizer System”, Probus 21: 23-50.

Dobrovie-Sorin C. (1994). The Syntax of Romanian. Berlin / New York: Mouton de Gruyter.

Dupuis F. (1989). L’expression du sujet dans les subordonnées en ancien français. Université de Montréal: unpublished thesis.

Duranti A. & Ochs E. (1979). “La pipa, la fumi? Un studio sulla dislocazione a sinistra nelle conversazioni”, Studi di grammatica italiana 8: 269-301.

Corpus, 12 | 2013 215

Emonds J. (1978). “The Verbal Complex V'-V in French”, Linguistic Inquiry 9: 151-175.

Ewert A. (1935). “The Strasbourg Oaths”, Transactions of the Philological Society 34: 16-35.

Fontana J. (1993). Phrase Structure & the Syntax of Clitics in the History of Spanish. University of Pennsylvania: unpublished thesis.

Fontana J. (1997). “On the Integration of Second Position Phenomena”, in A. van Kemenade & N. Vincent (eds) Parameters of Morphosyntactic Change. Cambridge: Cambridge University Press, 207-249.

Giorgi A. (2009). “Toward a Syntax of the Subjunctive”, in J. Quer (ed.) Twists of Mood: The Distribution and Interpretation of Indicative & Subjunctive. Special Issue of Lingua 119.12: 1837-1858.

Giorgi A. (2010). About the Speaker. Towards a Syntax of Indexicality. Oxford: Oxford University Press.

Giorgi A. & Longobardi G. (1991). The Syntax of Noun Phrases: Configuration, Parameters and Empty Categories. Cambridge: Cambridge University Press.

Giorgi A. & Pianesi F. (1997). Tense and Aspect: From Semantics to Morphosyntax. Oxford: Oxford University Press.

Giorgi A. & Pianesi F. (2004). “Complementizer Deletion in Italian”, in L. Rizzi (ed.) The Syntax of CP and IP. Oxford: Oxford University Press, 190-210.

Giusti G. (2010). “Il sintagma aggettivale”, in G. Salvi & L. Renzi (eds) Grammatica dell’italiano antico (II volumi). Bologna: il Mulino, I, 593-616.

Gonzaga M. (2004). “The Structure of DP in – Evidence from Adjectives & Possessives”, Harvard Working Papers in Linguistics 10: 19-49.

Gupton T. (2010). The Syntax-Information Structure Interface: Subjects and Clausal Word Order in Galician. University of Iowa: unpublished thesis.

Haider H. (2001). “Parametrisierung in der Generativen Grammatik”, in M. Haspelmath, E. König, W. Oesterreicher & W. Raible (eds) Language Typology and Language Universals. An International Handbook. Volume I. Berlin: de Gruyter (= Handbücher zur Sprach- und Kommunikationswissenschaft, 20.1), 283-293.

Harder A. (1998). “La declinazione dei verbi in un dialetto di transizione nelle Marche”, in G. Ruffino (ed.) Atti del XXI congresso internazionale di linguistica e filologia romanza. Centro di studi filologici e linguistici siciliani, Università di Palermo 18-24 settembre 1995. Volume V, sezione 5, Dialettologia, geolinguistica, sociolinguistica. Tübingen: Niemeyer, 389-399.

Hinzelin M.-O. (2009). “Neuter pronouns in Ibero-Romance: Discourse reference, expletives and beyond”, in G. Kaiser & E.-M. Remberger (eds) Null Subjects, Expletives & Locatives in Romance. Konstanz: Konstanzer Arbeitspapiere des Fachbereichs Sprachwissenschaft (No. 123), 1-25.

Jones M. (1993). Sardinian Syntax. London: Routledge.

Joseph, J. (1992). “The Gascon Enunciative as [sic] Syntactic Solution”, in C. Laeufer & T. Morgan (eds) Theoretical Analyses in Romance Linguistics. Amsterdam/Philadelphia: Benjamins, 481-495.

Kaiser, G.A., M. Oliviéri & K. Palasis. (in press). “Impersonal constructions in northern Occitan”, in X.A. Álvarez Perez, E. Carrilho & C. Magro (eds) Current Approaches to Limits and Areas in Dialectology. Cambridge: Cambridge Scholars Press/CSP.

Kayne R. (1984). Connectedness and Binary Branching. Dordrecht: Foris.

Corpus, 12 | 2013 216

Lambrecht K. (1994). Information Structure and Sentence Form. Topic, Focus and the Mental Representations of Discourse Referents, Cambridge: Cambridge University Press.

Lapesa R. (1975). “La colocación del calificativo atributivo en español”, in Homenaje a la memoria de Don Antonio Rodríguez-Moniño 1910-1970. Madrid: Castalia, 329-345.

Ledgeway A. (1998). “Variation in the Romance Infinitive: The Case of the Southern Calabrian Inflected Infinitive”, Transactions of the Philological Society 96: 1-61.

Ledgeway A. (2000). A Comparative Syntax of the Dialects of Southern Italy: A Minimalist Approach. Oxford: Blackwell.

Ledgeway A. (2003). “Linguistic Theory and the Mysteries of Italian Dialects”, in A. L. Lepschy & A. Tosi (eds) Multilingualism in Italy: Past & Present. Oxford: Legenda, 108-140.

Ledgeway A. (2004a). “Il sistema completivo dei dialetti meridionali: La doppia serie di complementatori”, Rivista italiana di dialettologia 27: 89-147.

Ledgeway A. (2004b). “Extraordinary Agreement: The Case of the Ripano Verb”, Italian Linguistics Round Table, St Catherine’s College, University of Cambridge.

Ledgeway A. (2005). “Moving Through the Left Periphery: The Dual Complementiser System in the Dialects of Southern Italy”, Transactions of the Philological Society 103: 336-396.

Ledgeway A. (2006). “The Dual Complementiser System in Southern Italy: Spirito greco, materia romanza?”, in A.L. Lepschy & A. Tosi (eds) Rethinking Languages in Contact: The Case of Italian. Oxford: Legenda, 112-126.

Ledgeway A. (2007a). “La posizione dell’aggettivo nella storia del napoletano”, in D. Bentley & A. Ledgeway (eds) Sui dialetti italoromanzi. Saggi in onore di Nigel B. Vincent (The Italianist 27, Special supplement 1). Norfolk: Biddles, 104-125.

Ledgeway A. (2007b). “Old Neapolitan Word Order: Some Initial Observations”, in A.L. Lepschy & A. Tosi (eds) Histories and Dictionaries of the Languages of Italy. Ravenna: Longo, 121-149.

Ledgeway A. (2007c). “Diachrony and Finiteness: Subordination in the Dialects of Southern Italy”, in I. Nikolaeva (ed.) Finiteness: Theoretical & Empirical Foundations. Oxford: Oxford University Press, 335-365.

Ledgeway A. (2008). “Satisfying V2 in early Romance: Merge vs Move”, Journal of Linguistics 44: 437-440.

Ledgeway A. (2009a). Grammatica diacronica del napoletano (Beihefte zur Zeitschrift für romanische Philologie Band 350). Tübingen: Niemeyer.

Ledgeway A. (2009b). “Aspetti della sintassi della periferia sinistra del cosentino”, in D. Pescarini (ed.), Studi sui dialetti della Calabria (Quaderni di lavoro ASIt n.9). Padua: Unipress, 3-24.

Ledgeway A. (2010). “Subject Licensing in CP: The Neapolitan Double-Subject Construction”, in P. Benincà & N. Munaro (eds) Mapping the Left Periphery. The Cartography of Syntactic Structures, Volume 5. Oxford: Oxford University Press, 257-296.

Ledgeway A. (2012a). From Latin to Romance. Morphosyntactic Typology and Change. Oxford: Oxford University Press.

Ledgeway A. (2012b). “La sopravvivenza del sistema dei doppi complementatori nei dialetti meridionali”, in P. Del Puente (ed.) Atti del II Convegno Internazionale di Dialettologia - Progetto A.L.Ba. Rionero in Vulture: Calice Editore, 151-176.

Corpus, 12 | 2013 217

Ledgeway A. (in press). “Reconstructing Complementiser-drop in the Dialects of the Salento: A Syntactic or Phonological Phenomenon?”, in T. Biberauer & G. Walkden (eds) Syntax Over Time: Lexical, Morphological, & Information-structural Interactions. Oxford: Oxford University Press.

Ledgeway A. & Lombardi A. (2005). “Verb Movement, Adverbs and Clitic Positions in Romance”, Probus 17: 79-113.

Lemieux M. & Dupuis F. (1995). “The Locus of Verb Movement in Non-asymmetric Verb-second Languages: The Case of ”, in A. Battye & I. Roberts (eds) Clause Structure & Language Change. Oxford: Oxford University Press, 80-109.

Lightfoot D. & Hornstein N. (eds) (1994). Verb Movement. Cambridge: Cambridge University Press.

Lobo M. (2001). “On Gerund Clauses of ”, in A. Veiga, V. M. Longa & J. Anderson (eds.), El verbo. Entre el léxico y la gramática. Lugo: Tris Tram, 107-118.

Lois X. (1989). Aspects de la syntaxe de l’espagnol et théorie de la grammaire. Université de Paris VIII: unpublished thesis.

Lombardi A. (1997). The Grammar of Complementation in the Dialects of Calabria. University of Manchester: unpublished thesis.

Lombardi A. (1998). “Calabria greca e Calabria latina da Rohlfs ai giorni nostri: La sintassi dei verbi modali-aspettuali”, in P. Ramat & E. Roma (eds) Sintassi storica. Atti del XXX congresso internazionale della Società di linguistica italiana, Pavia, 26-28 settembre 1996. Rome: Bulzoni, 613-626.

Lombardi A. & Middleton R. (2004). “Alcune osservazioni sull’ordine delle parole negli antichi volgari italiani”, in M. Dardano & G. Frenguelli (eds) SintAnt. La sintassi dell’italiano antico. Atti del Convegno internazionale di studi. Rome: Aracne, 553-582.

Longa V. (1994). “The Galician Inflected Infinitive and the Theory of UG”, Catalan Working Papers in Linguistics 4: 23-44.

López Alcaraz J. (1994). Los juramentos de Estrasburgo y La cantilena de Santa Eulalia. Comentario filológico de los dos primeros textos franceses. Murcia: Universidad de Murcia.

Loporcaro M. (1986). “L’infinito coniugato nell’Italia centro-meridionale: Ipotesi genetica e ricostruzione storica”, Italia dialettale 49: 609-665.

Lüdtke H. (1974). “Die Mundart von Ripatransone – ein sprachtypologisches Kuriosum”, Acta Universitatis Carolinae – Philologica 5: 173-177.

Lüdtke H. (1976). “La declinazione dei verbi in un dialetto di transizione marchigiano-abruzzese”, Abruzzo 14: 79-84.

Mancini A. M. (1993). “Le caratteristiche morfosintattiche del dialetto di Ripatransone (AP), alla luce di nuove ricerche”, in S. Balducci (ed.) I dialetti delle Marche meridionali. Alessandria: Edizioni dell’Orso, 111-136.

Manzini M. R. & Savoia L. (2005). I dialetti italiani e romanci. Morfosintassi generativa (3 vols). Alessandria: Edizioni dell’Orso.

Marchetti P. (1974). Le corse sans peine. Chennevières-sur-Marne: Assimil.

Maurer T. (1968). O infinito flexionado português. Estudo histórico-descritivo. São Paulo: Editora Nacional.

Mensching G. (2000). Infinitive Constructions with Specified Subjects. A Syntactic Analysis of the Romance Languages. Oxford: Oxford University Press.

Corpus, 12 | 2013 218

Monachesi P. (2005). The Verbal Complex in Romance. A Case Study in Grammatical Interfaces. Oxford: Oxford University Press.

Motapanyane V. (2000). “The Generative Approach to Romanian Grammar. An Overview”, in V. Motapanyane (ed), Comparative Studies in Romanian Syntax. Amsterdam: Elsevier, 1-48.

Oliviéri M. (2009). “Syntactic Parameters & Reconstruction”, in G. Kaiser & E.-M. Remberger (eds) Null Subjects, Expletives and Locatives in Romance. Konstanz: Konstanzer Arbeitspapiere des Fachbereichs Sprachwissenschaft 123: 27-46.

Paoli S. (2002). “Il doppio ‹che› nei dialetti piemontesi”, in G. Marcato (ed.) La dialettologia oltre il 2001. Padua: Unipress, 231-236.

Paoli S. (2003a). COMP and the Left-Periphery: Comparative Evidence from Romance. University of Manchester: unpublished thesis.

Paoli S. (2003b). “Mapping out the Left Periphery of the Clause: Evidence from North-Western Italian Varieties”, in J. Quer, J. Schroten, M. Scorretti, P. Sleeman & E. Verheugd (eds.), Romance Languages and Linguistic Theory 2001. Amsterdam/Philadelphia: Benjamins, 267-285.

Paoli S. (2005). “COMP: A Multi-talented Category. Evidence from Romance”, in L. Brugè, G. Giusti, N. Munaro, W. Schweikert & G. Turan (eds.), Contributions to the XXX Incontro di Grammatica Generativa. Venice: Cafoscarina, 185-202.

Parrino F. (1967). “Su alcune particolarità della coniugazione nel dialetto di Ripatransone”, L’Italia dialettale 30: 156-166.

Poletto C. (2001). “Complementizer Deletion and Verb Movement in Standard Italian”, in G. Cinque & G. Salvi (eds) Current Studies in Italian Syntax. Essays Offered to Lorenzo Renzi. Amsterdam: Elsevier, 265-286.

Pollock J.-Y. (1989). “Verb Movement, Universal Grammar, and the Structure of IP”, Linguistic Inquiry 20: 365-424.

Pountain C. (1998). “Nuevo enfoque de la posición del adjetivo atributivo”, in G. Ruffino (ed.) Atti del XXI congresso internazionale di linguistica e filologia romanza. Centro di studi filologici e linguistici siciliani, Università di Palermo 18-24 settembre 1995. Volume II, sezione 2, Morfologia e sintassi delle lingue romanze. Tübingen: Niemeyer, 697-708.

Radatz H.-I. (2001). Die Semantik der Adjektivstellung. Tübingen: Niemeyer.

Reiner E. (1968). La place de l’adjectif épithète en français. Vienna & Stuttgart: Wilhelm Braumüller.

Ribeiro I. (1995). “Evidence for a Verb-second Phase in Old Portuguese”, in A. Battye & I. Roberts (eds) Clause Structure & Language Change. Oxford: Oxford University Press, 110-139.

Richard L. (1988). “On the Double Object Construction”, Linguistic Inquiry 19: 335-391.

Rizzi L. (1982). Issues in Italian Syntax. Dordrecht: Foris.

Rizzi L. (1986) “Null Objects in Italian & the Theory of pro”, Linguistic Inquiry 17: 501-557.

Rizzi L. (ed.) (2004). The Structure of CP and IP. The Cartography of Syntactic Structures. Volume 2. Oxford: Oxford University of Press.

Roberts I. (1985). “Agreement Parameters and the Development of English Modal Auxiliaries”, Natural Language and Linguistic Theory 3: 21-58.

Roberts I. (1993). Verbs & Diachronic Syntax. A Comparative History of English and French. Dordrecht: Kluwer.

Corpus, 12 | 2013 219

Rohlfs G. (1969). Grammatica storica della lingua italiana e dei suoi dialetti. Sintassi e formazione delle parole. Turin: Einaudi.

Rohlfs G. (1970). Le gascon: Etude de philologie pyrénéenne. Tübingen: Niemeyer.

Rohrbacher B. (1997). Morphology-Driven Syntax. Amsterdam/ Philadelphia: Benjamins.

Salvi G. (2004). La formazione della struttura di frase romanza. Ordine delle parole e clitici dal latino alle lingue romanze antiche. Tübingen: Niemeyer.

Sandfeld K. & Olsen H. (1960). Syntaxe roumaine. II. Les groupes de mots. Copenhagen: Munksgaard.

Sauzet P. (1989). “Topicalisation et prolepse en occitan”, Revue des langues romanes 93: 235-273.

Schifano N. (2011). Verb-movement in Italian, French & Spanish: A Survey from Written Sources. Universities of Cambridge/ Venice: unpublished thesis.

Schifano N. (in prep.) Romance Verb Movement. A Comparative Analysis. University of Cambridge: unpublished doctoral thesis.

Scorretti N. (1994). Complementizer Deletion. University of Amsterdam: Unpublished doctoral thesis.

Skårup P. (1975). Les premières zones de la proposition en ancien français. Copenhagen: Akademisk Forlag.

Sornicola R. (1996). “Alcune strutture con pronome espletivo nei dialetti italiani meridionali”, in P. Benincà, G. Cinque, T. De Mauro & N. Vincent (eds) Italiano e dialetto nel tempo: Saggi di grammatica per Giulio C. Lepschy. Roma: Bulzoni, 323-340.

Sornicola R. (1997). “Campania”, in M. Maiden & M. Parry (eds) The Dialects of Italy. London: Routledge, 330-337.

Tabachovitz A. (1932). Etude sur la langue de la version française des Serments de Strasbourg. Uppsala: Almqvist & Wisksells Boktryckeri-A.-B.

Thiella A. (2008). “Il sintagma nominale negli antichi volgari di area veneta e lombarda”, Laboratorio sulle varietà romanze antiche 2: 1-163.

Terzi A. (1994). “Clitic Climbing from Finite Clauses and Long Head Movement”, Catalan Working Papers in Linguistics 3: 97-122.

Terzi A. (1996). “Clitic Climbing from Finite Clauses and Tense Raising”, Probus 8: 273-295.

Vance B. (1997). Syntactic Change in Medieval French. Verb-second and Null Subjects. Dordrecht: Kluwer.

Vanelli L. (1980). “A Suppletive Form of the Italian Article and its Phonosyntax”, Journal of Linguistic Research 1: 69-90.

Vanelli L. (1986). “Strutture tematiche in italiano antico”, in H. Stammerjohann (ed.) Tema-Rema in Italian. Tübingen: Narr, 248-273.

Vanelli L. (1999). “Ordine delle parole e articolazione pragmatica nell’italiano antico: La ‹ prominenza › pragmatica della prima posizione nella frase”, Medioevo romanzo 23: 229-246.

Vanelli L., Renzi L. & Benincà P. (1985). “Typologie des pronoms sujets dans les langues romanes”, in Actes du XVIIe congrès international de linguistique et philologie romanes. Volume 3: Linguistique descriptive, phonétique, morphologie et lexique. Aix-en-Provence: Université de Provence, 163-176.

Vikner S. (1997). “V-to-I Movement and Inflection for Person in all Tenses”, in L. Haegeman (ed.) The New Comparative Syntax. London: Longman, 189-213.

Corpus, 12 | 2013 220

Villa-García J. (2010). Recomplementation and Locality of Movement in Spanish. University of Connecticut: unpublished second general examination paper.

Vincent N. (1986). “La posizione dell’aggettivo in italiano”, in H. Stammerjohann (ed.) Tema-rema in italiano – Theme-Rheme in Italia-Thema-Rhema in Italienischen. Tübingen: Narr, 181-195.

Vincent N. (1996). “L’infinito flesso in un testo napoletano del Trecento”, in P. Benincà, G. Cinque, T. De Mauro & N. Vincent (eds) Italiano e dialetto nel tempo: Saggi di grammatica per Giulio C. Lepschy. Roma: Bulzoni, 389-409.

Vincent N. (1998). “On the Grammar of Inflected Non-finite Forms (with Special Reference to Old Neapolitan)”, in I. Korzen & M. Herslund (eds) Clause Combining and Text Structure. Copenhagen Studies in Language 22: 135-158.

Vincent N. (2006). “Il problema del doppio complementatore nei primi volgari d’Italia”, in A. Andreose & N. Penello (eds) Laboratorio sulle varietà romanze antiche: Giornata di lavoro sulle varietà romanze antiche. Padua: University of Padua, 27-42.

Vincent N. (2007). “Learned vs Popular Syntax: Adjective Placement in Early Italian Vernaculars”, in A.L. Lepschy & A. Tosi (eds) Histories and Dictionaries of the Languages of Italy. Ravenna: Longo, 55-75.

Wanner D. (1981). “Surface Complementizer Deletion: Italian che ~ Ø”, Journal of Italian Linguistics 6: 47-82.

Wanner D. (1998). “Les subordonnées à double complémentateur en roman médiéval”, in G. Ruffino (ed.) Atti del XXI congresso internazionale di linguistica e filologia romanza. Centro di studi filologici e linguistici siciliani, Università di Palermo 18-24 settembre 1995. Volume I, sezione 1, Grammatica storica delle lingue romanze. Tübingen: Niemeyer, 421-433.

Wheeler M. (1988). “Occitan”, in M. Harris & N. Vincent (eds) The Romance Languages. London: Routledge, 246-278

NOTES

1. The abbreviations for languages and localities cited in the following discussion are: Abr. (Abruzzese), Arl. (Ariellese, eastern Abruzzo), Bal. Cat. (), Cal. (Calabrian), Cat. (Catalan), Cic. (Cicagnino, Liguria), Cos. (Cosentino, northern Calabria), Crs. (Corsican), Ctz. (Catanzarese, central Calabria), Dmc. Sp. (Dominican Spanish), Eng. (English), Erv. (Ervedosa do Douro, north-eastern Portugal), Fr. (French), Ger. (German), Glc. (Galician), Gsc. (Gascon), It. (Italian), Leo. (Leonese), Lgd. (Lengadocien), Lul. (Lulese, Nuoro, Sardinia), Mes. (Messinese, north-eastern Sicily), Nap. (Neapolitan), Occ. (Occitan), Pal. (Palermitano), Pgl. (Pugliese), Pv. de At. (Póvoa de Atalaia, central-eastern Portugal), Rip. (Ripano, south-eastern Marches), Ro. (Romanian), Sal. (Salentino, southern Puglia), Sic. (Sicilian), Sp. (Spanish), Srd. (Sardinian), Tsc. (Tuscan), Umb. (Umbrian), Wal. (Walloon, southern Belgium). 2. See, among others, Maurer (1968), Carballo Calero (1981), Loporcaro (1986), Jones (1993: 78-82), Longa (1994), Vincent (1996; 1998), Ledgeway (1998: 41-46; 2000: 109-114; 2009a: 585-590), Mensching (2000), Lobo (2001). 3. See Parrino (1967), Lüdtke (1974; 1976), Mancini (1993), Harder (1998), Ledgeway (2004b; 2012a: §6.3.4), D’Alessandro (2011). 4. On the status and distribution of expletive subject clitics, see Oliviéri (2009) and Kaiser, Oliviéri and Palasis (in press).

Corpus, 12 | 2013 221

5. Lois (1989), Cinque (1999: 152), Ledgeway and Lombardi (2005: 86-89, 102 n. 12), Monachesi (2005: 178), D’Alessandro (2010: 35f.), Ledgeway (2012a: §4.3.2). 6. Lois (1989: 34, 40), Cinque (1999: 45-49, 146-148), Abeillé and Godard (2003), Monachesi (2005: 134-136). 7. Roberts (1985), Lightfoot and Hornstein (1994), DeGraff (1997), Rohrbacher (1997), Vikner (1997). 8. In these and following examples we indicate topicalized constituents by underlining, contrastively focalized constituents by small caps, and informationally focalized constituents with bold. 9. For Romanian see, among others, Dobrovie-Sorin (1994: 93-111), Motapanyane (2000: §4.2), and for southern Italy Calabrese (1993), Lombardi (1997; 1998), Ledgeway (1998; 2004a; 2005; 2006; 2007c), Manzini & Savoia (2005, I: 455-501, 650-676). 10. Rohlfs (1970: 205-207), Wheeler (1988: 272-274), Sauzet (1989), Joseph (1992), Bec (1967: 47f.). 11. See Skårup (1975), Vanelli, Renzi and Benincà (1985), Vanelli (1986; 1999), Adams (1987), Dupuis (1989), Fontana (1993; 1997), Roberts (1993), Benincà (1995; 2006), Lemieux and Dupuis (1995), Ribeiro (1995), Vance (1997), Lombardi and Middleton (2004), Salvi (2004), Ledgeway (2007b; 2008). 12. See Tabachovitz (1932), Ewert (1935), Castellani (1969; 1978), López (1994), Ayres-Bennett (1996: 16-30). 13. Cf. Wanner (1981), Giorgi and Pianesi (1997; 2004), Poletto (2001), Scorretti (1994), Giorgi (2009: 1840-1845; 2010: 43-47). 14. See further Arnholdt (1916), Sandfeld and Olsen (1960: 98-114), Alisova (1967), Reiner (1968), Lapesa (1975), Vincent (1986; 2007: 57-61), Bernstein (1993), Giorgi and Longobardi (1991), Bosque (1996), Berruto (1998), Pountain (1998), Demonte (1999), Abeillé and Godard (1999), Radatz (2001), Cinque (2010), Gonzaga (2004), Ledgeway (2007a). 15. Ledgeway (2007a; 2009a: 241f.), Vincent (2007), Thiella (2008: ch. 4), Giusti (2010a: 599-609). 16. Cf. the postnominal position of the adjectives in (57a-c) with the corresponding prenominal position in their French (le vieux pont d’Avignon ) and Italian (una piccola patata; una nuova macchina) translations.

ABSTRACTS

Through a number of illuminating cases studies which draw in large part on the largely under- utilized data of Romance dialectal varieties, the present article sets out to highlight the importance that Romance data, especially those of non-standard varietites, can play in testing and enriching currents theories of syntax. In particular, we shall show that dialectal varieties, although frequently overlooked in the past, offer an immensely fertile and still relatively unexplored experimental territory in which to profitably investigate new ideas about language structure, change and variation. At the same time, we champion the mutual benefits for theoretical linguists and Romanists of adopting a more integrated and reciprocally-informed approach in their respective treatments of linguistic evidence, highlighting how a familiarity with the key tools and ideas established in both fields has the potential to enrich linguistic and empirical analyses considerably.

Théorie linguistique et variation. Le cas des langues romanes

Corpus, 12 | 2013 222

Grâce à l’examen d’une série d’études de cas éclairantes puisées en grande partie dans les données de variétés dialectales romanes trop souvent mises à l’écart, cet article a pour objectif de mettre en relief l’importance du rôle des données romanes, et surtout de celles tirées des variétés non-standard, dans l’évaluation et dans l’enrichissement des théories syntaxiques actuelles. En particulier, on met en évidence comment les variétés dialectales, bien qu’à peine exploitées dans le passé, offrent un terrain expérimental extrêmement fertile et encore peu exploré aujourd’hui, qui permet d’explorer de nouvelles pistes à propos de la structure, du changement et de la variation linguistiques. En même temps, on exposera les avantages mutuels pour les linguistes théoriques et les spécialistes en linguistique romane à adopter une approche à la fois plus intégrée et réciproquement informée dans leurs traitements respectifs des faits linguistiques. On montrera ainsi comment une connaissance des outils et des principes établis dans les deux champs peut apporter des enrichissements considérables aux analyses linguistiques et empiriques.

INDEX

Mots-clés: (micro)variation syntaxique, dialectologie romane, théorie syntaxique Keywords: syntactic (micro)variation, romance dialectology, syntactic theory

AUTHOR

ADAM LEDGEWAY University of Cambridge

Corpus, 12 | 2013 223

Compte rendu

Corpus, 12 | 2013 224

Alain CHEVRIER — Le Décasyllabe à césure médiane. Histoire du taratantara. Paris : Classiques Garnier, coll. « Etudes romantiques et dix-neuviémistes » 18, 2011, 405 pages, 49 €.

Gérald Purnelle

1 L’ouvrage d’Alain Chevrier relève de ce qu’il nomme lui-même la « morphologie poétique », c’est-à-dire l’étude des formes poétiques, qui contribue à l’histoire littéraire. Il y trace l’histoire détaillée d’un vers particulier, le décasyllabe à césure médiane (en 5-5). Ce vers est traditionnellement baptisé taratantara, en une onomatopée qui calque la longueur syllabique de ses hémistiches.

2 L’intérêt de l’ouvrage réside à la fois dans sa structure linéaire (il s’agit d’une « histoire » de ce vers) et dans ses approches multiples.

3 Notons d’emblée que, pour chaque époque, les poètes ayant pratiqué ce vers sont évoqués l’un après l’autre, et que leur usage du vers est illustré par au moins un poème, souvent cité en entier. L’ouvrage est donc aussi, et très plaisamment, une anthologie historique du décasyllabe à césure médiane, qui permet au lecteur curieux de (re)découvrir des noms et des textes peu connus, voire inconnus. Ce seul aspect rend donc déjà l’ouvrage fort utile et agréable.

4 Mais histoire et analyse structurent l’ouvrage dans sa dimension scientifique. Fondé sur « de nombreux documents peu connus, méconnus ou inconnus », l’ouvrage commence par l’exploration de la préhistoire du vers et par une esquisse sommaire des « Débuts du décasyllabe », qui paraît plonger ses racines dans des modèles latins médiévaux.

5 L’auteur relève les différentes structures attestées pour les vers de dix syllabes (4-6 et 5-5, mais aussi 6-4), mais, sur un plan analytique et méthodologique, on regrettera qu’à

Corpus, 12 | 2013 225

ce stade soit posé sans discussion l’objet « décasyllabe », supposé subsumer ces trois schémas ou « vers » morphologiquement différents, sans autre forme de questionnement. Deux schémas aussi différents que 4-6 et 5-5 forment-ils, métriquement parlant, un même vers ? La réponse affleure plusieurs fois dans le corps de l’ouvrage, dans les cas où (chez tel poète, dans tel poème), ils se mêlent (quand des 5-5 apparaissent en contexte de 6-6), mais elle n’est guère examinée pour elle-même.

6 Plus longue et intéressante est l’étude de l’origine et du sens du terme étrange qui sert à nommer le 5-5 (décasyllabe à césure médiane), taratantara, de sa première apparition dans un vers du poète latin Ennius, où il désigne le son de la trompette, jusqu’à sa mention dans les traités de versification des XIXe et XXe siècles, en passant surtout par ses premières utilisations, pour désigner le vers, par Bonaventure des Périers (XVIe s.) et Régnier-Desmarais (XVIIe s.).

7 Le parcours historique commence par un court chapitre consacré au Moyen Age, où domine l’étude de La Cantilène de sainte Eulalie et des chansons médiévales où le vers apparaît. La suite distingue deux moments particuliers et plus importants de l’histoire : la Renaissance et l’âge baroque, d’une part, le XIXe siècle d’autre part.

8 Pour le premier de ces deux chapitres, un traitement particulier est consacré à un poème de 1367 vers, inséré dans un ouvrage peu connu, paru dans la première moitié du XVIe siècle : Le Jardin amoureux de Christophe de Barrouso. La longueur des vers n’y est pas fixe et syllabique, mais variable. Le poème contient néanmoins de nombreux décasyllabes, dont des 5-5. En une longue analyse de trente pages, Alain Chevrier conclut, pour expliquer cette versification complexe, à une adaptation française de l’ arte mayor espagnol.

9 L’étude de la place du taratantara dans la métrique des vers mesurés de Baïf, issus, notamment, de l’adaptation en français de la strophe saphique, et où apparaissent des 5-5 parmi des 4-6, est également éclairante, tout comme celle de la résurgence ou réinvention du décasyllabe en 5-5 au XIXe siècle, attribuable à Marceline Desbordes- Valmore, avant que le Parnasse en fasse un nouvel usage.

10 Après un chapitre consacré au XXe siècle, une brève « récapitulation » esquisse une rapide histoire du décasyllabe (tous schémas confondus) puis balise les quelques moments et observations d’une histoire riche, parsemée de creux et de temps forts, de discontinuité et de reprises.

11 On doit reformuler le regret exprimé au début de ce compte rendu, pour ce qui touche les conclusions qu’il eût été possible de tirer de cette histoire. La question de la concurrence des différents schémas, 4-6, 6-4 et 5-5, n’est guère abordée, et nullement de façon systématique et synthétique. Or on observe qu’à la Renaissance, des poèmes mêlent ces schémas, notamment les poèmes transposant en français la strophe saphique à base d’hendécasyllabes. A nouveau, sans qu’il y ait de lien, le phénomène réapparaît chez certains poètes à la fin du XIXe siècle (Rimbaud). Entre ces deux moments de l’histoire a pesé un interdit à la fois théorique et pratique, excluant, pour le poète, le droit de mêler des schémas pairs (4-6, 6-4) avec un schéma à base impaire (5-5). Cet interdit n’est guère étudié dans l’ouvrage.

12 Il y a, théoriquement, plusieurs situations possibles :

13 a) des poèmes à schéma unique, obéissant à l’interdit du mélange, ou produits à un moment où ce mélange est tout bonnement impensable ; soit des poèmes entièrement en 4-6 et d’autres entièrement en 5-5 ;

Corpus, 12 | 2013 226

14 b) des poèmes où le mélange est jugé possible et pratiqué ; par exemple (sans doute le plus fréquent), un poème où dominent les 4-6, mais où le schéma 5-5 apparaît minoritairement (parfois une seule occurrence) ;

15 c) des poèmes où les schémas à base paire et impaire sont mêlés sans qu’une dominante soit perceptible.

16 Il eût été utile et éclairant de dresser une chronologie de ces trois types théoriques, d’évaluer diachroniquement leur présence ou leur absence à chaque époque, et de distinguer clairement, récapitulativement et pour chaque période, les poètes « réguliers » (dont les poèmes sont en 5-5) et ceux qui consentent à mêler schémas pairs et impairs. Le tout en mobilisant des notions telles que norme, interdit et transgression. Répétons-le, l’enjeu est théorique : il porte sur la question de savoir si, pour une époque ou pour un poète, le 4-6 et le 5-5 sont deux vers différents ou une même mètre ; si le nombre (10) prime sur la structure ; s’il existe un décasyllabe ou plusieurs.

Corpus, 12 | 2013