ISBN 90-9010846-7 Trefw.: fonetiek, prosodie, sprekerherkenning, sprekerspecificiteit. This Ph.D. thesis is also available on the world wide web. It can be obtained from http://lands.let.kun.nl. © Hans Kraayeveld Idiosyncrasy in Prosody Speaker and speaker group identification in Dutch using melodic and temporal information Een wetenschappelijke proeve op het gebied van de Letteren PROEFSCHRIFT ter verkrijging van de graad van doctor aan de Katholieke Universiteit Nijmegen volgens besluit van het College van Decanen in het openbaar te verdedigen op vrijdag 5 september 1997 des namiddags om 1.30 uur precies door Johannes Kraayeveld Geboren op 8 juli 1962 te Dordrecht FACULTEIT DER LETTEREN promotor: prof. dr. W.H. Vieregge co-promotores: dr. A.C.M. Rietveld dr. V.J. van Heuven (R.U. Leiden) manuscriptcommissie: prof. dr. W.J. Barry dr. R.A.M.G. van Bezooijen prof. dr. L. В oves prof. dr. R. Collier dr. J.M.B. Terken IWO This research was supported by the Linguistic Research Foundation, which is funded by the Netherlands Organization for Scientific Research, NWO. Marco Polo descrive un ponte, pietra per pietra. "Ma qual è la pietra che sostiene il ponte?", chiede Kublai Kan. "Il ponte non è sostenuto da questa о quella pietra", risponde Marco, "ma dalla linea dell'arco che esse formano." Kublai Kan rimane silenzioso, riflettendo. Poi soggiunge: "Perché mi parli delle pietre? È solo dell'arco che m'importa." Polo risponde: "Senza pietre non c'è arco." Marco Polo describes a bridge, stone by stone. "But which is the stone that sustains the bridge?", asks Kubilay Khan. "The bridge is not sustained by this stone or that", replies Marco, "but by the line of the arch that is formed. " Kubilay Khan remains silent, thinking. Next he adds: "Why talk to me about stones? It's only the arch that interests me." Polo answers: "Without stones there is no arch. " from: Italo Calvino, Le città invisibili, cap. 5, p. 89 Voorwoord Het onderzoek waarover in dit boek verslag wordt gedaan werd gesteund door de Stichting Taalwetenschap (projector. 300-173-006), die op haar beurt wordt gesub­ sidieerd door de Nederlandse organisatie voor Wetenschappelijk Onderzoek (N.W.O.). Geld alleen maakt nog geen proefschrift mogelijk. Familie en vrienden waren, hoewel zij weinig ophadden met fonetiek en niet veel begrepen van mijn interesse voor toonhoogtebewegingen, perturbaties, enzovoort, een belangrijke steun tijdens de periode van mijn onderzoek. Vooral mijn moeder bedank ik voor de vele jaren steun op afstand en voor de aanmoedigingen om verder te leren. Het besproken onderzoek was een samenwerkingsproject van de universiteiten van Nijmegen en Leiden, uitgevoerd in Nijmegen. Zonder mijn begeleiders uit de genoemde steden, Toni Rietveld en Vincent van Heuven, was dit proefschrift er niet geweest. Toni Rietveld, mijn Nijmeegse begeleider, zag en sprak ik uiteraard het meest. Hartelijk bedankt, Toni, voor je inspanningen om mij wegwijs te maken in fonetiek in het algemeen, prosodie in het bijzonder, statistiek, schrijfstijl, BMDP, CMS, en nog veel meer. Ook mijn Leidse begeleider, Vincent van Heuven, wil ik bedanken voor de steun die ik steeds kreeg. De wereld wordt steeds kleiner en dat geldt gelukkig ook voor de afstand Nijmegen-Leiden. Vincent, bedankt voor de vele aandacht en inspiratie! Mijn promotor, Felix Vieregge, placht mij er altijd op te wijzen dat bedankjes voor geleverde kritiek niet nodig zijn omdat hij slechts zijn werk deed. Laat ik daarom alleen benadrukken dat zijn kritisch leeswerk de uiteindelijke tekst zeer ten goede is gekomen. Mijn collega's van de vakgroep Taal en Spraak van de Katholieke Universiteit Nijmegen bedank ik voor de steun die ik gedurende mijn verblijf in Nijmegen van hen kreeg. Zij wijdden mij in in allerlei aspecten van spraak en spraaktechnologie, en wij deelden veel plezierige momenten tijdens koffie- en lunchpauzes. Bedankt voor de gezelligheid. Marina Koopmans was gedurende de meeste jaren mijn kamergenoot. We bespra­ ken velerlei onderwerpen, zowel ons onderzoek als ook de alledaagse problemen waar je als assistent in opleiding mee te maken krijgt. Bedankt voor je bemoedigingen en je opgewektheid, Marina! Alle in dit proefschrift te vinden fouten en onvolkomenheden komen geheel voor rekening van de schrijver. Waarschijnlijk zouden er echter meer gebreken te vinden zijn geweest zonder mijn collega's Dick van Bergem, Henk van den Heuvel, Heimer Strik en Catia Cucchiarini, die (delen van) de tekst doorlazen en van kritisch commentaar voorzagen. Catia dank ik bovendien voor het op een hoger plan tillen van mijn Engels. Onderzoek doen kan een eenzame bezigheid zijn zonder een enthousiaste groep toehoorders die graag op de hoogte gehouden wordt over de meest recente resul­ taten. Ik vond een heel inspirerend publiek in de 'prosodieclub', en wil haar leden daarom hartelijk bedanken; zonder jullie zou dit project wellicht tot een 'down- stepping contour' verworden zijn. Ik werd van een flink deel van het praktische werk, zoals A/D-conversie en segmentatie, verlost door de hulp van mijn enthousiaste studentassistent Geert Wiegeraad. Bedankt! Na mijn verhuizing naar Helmond kon ik iedere week een paar lange dagen in Nijmegen maken dankzij André de Vries en Carol van Hulten, en later Leo Bosland. Bedankt voor jullie gastvrijheid. Een deel van mijn tijd besteedde ik aan het helpen van studenten met allerlei praktische problemen. Zij hebben er geen idee van hoeveel ik heb gehad aan die sessies. Bedankt allemaal, vooral Angélique Hoogs trate. Tenslotte zou dit werk niet mogelijk zijn geweest zonder de medewerking van mijn sprekers, de heren Van Bakel, Barkema, Beekelaar, Van den Bereken, Van Berkel, Bongaerts, Boonstra, Van de Borgt, De Bot, Broeders, De Bruin, Colard, Ester, Hoogakker, Koreman, Van Leeuwen, Van Meurs, Poiesz, Slis, Strik, Veenman, Verhoeven, Voeten, Wermers en Wesselingh, en de dames Bange, Bekkering, Berends, Bernards, Claassen, Commissaris, Faaber, Foppen, Gaalman, Gerritsen, Heebing, Van der Heijden, Hofhuis, Van Houtum, Jacobs, Janssen, De Jong, Konst, Kostelijk, Kruize, Laheij, Lindenbergh, De Mönnink en De Vries. Voor veel van deze 49 mensen geldt, dat ik hun stemmen beter ken dan henzelf. Bedankt voor het mij lenen van jullie stemmen. De vijftigste stem is die van Nicole van Dam. Zij leende mij niet alleen haar stem, maar ook haar oor. Bedankt voor je geduld. Het is goed het relatieve van je werk in te zien, maar een fixatie hierop vormt niet bepaald een vruchtbare bodem voor een proefschrift. Bedankt datje me leerde dat niet alles relatief is! CONTENTS 1. Introduction 1 1.1 Object of this study 1 1.2 Speaker recognition 3 1.3 Review of the literature 6 1.3.1 Speaker identification using non-prosodic measures 6 1.3.2 Speaker identification and prosody 8 1.3.3 Extralinguistic influences 11 1.4 Scope of this study 14 1.5 Outline of the book 15 2. Method 17 2.1 Introduction 17 Part I: Definition of acoustic prosodie parameters 18 2.2 F0-related and amplitude related TI parameters 18 2.2.1 Fundamental frequency 18 2.2.2 F0 algorithms used in this study 19 2.2.3 Scalings of F0 20 2.2.4 Acoustic correlates of loudness: intensity, sound pressure, amplitude 21 2.2.5 Measures of central tendency 23 2.2.6 Distributional measures 24 2.2.7 Short-term voice instability 25 2.2.8 F0 perturbation measurement 27 2.2.9 Peak amplitude perturbation measures 31 2.3 Temporal TI parameters 32 2.3.1 Pause time 32 2.3.2 Articulation rate 33 2.3.3 Measures of voicedness 33 2.4 Contour-bound parameters 34 2.4.1 GDI as descriptive model for pitch movements 34 2.4.2 Measures taken at specific pitch movements 37 2.4.3 Synchronization: alignment of pivot points with segmental structure 38 2.4.4 Declination measures 39 Part II: Speech material 41 2.5 Speakers 41 2.6 Material 43 2.6.1 Introduction 43 2.6.2 Speech fragments 44 2.6.3 Sentences 44 2.7 Recordings 46 2.8 Summary 48 Time-integrated parameters 49 3.1 Introduction 49 3.2 Preliminary considerations: the interrelatedness of the variables 50 3.3 Analyses of variance 52 3.3.1 Introduction 52 3.3.2 Results 55 3.4 Speaker identification by LDA 66 3.5 Identification of speech style by LDA 73 3.6 Identification of speaker characteristics: sex and age 74 3.6.1 Sex identification by LDA 75 3.6.2 Age group identification by LDA 76 3.7 Identification of task characteristics: paragraph and session 77 3.7.1 Paragraph identification by LDA 78 3.7.2 Session identification by LDA 79 3.8 Longer stretches of speech 80 3.9 Summary of results 82 Contour-bound parameters 85 4.1 Introduction 85 4.2 Interrelatedness of the variables 89 4.3 Analyses of variance 90 4.4 Speaker identification by LDA 100 4.5 Identification
