Keywords in Heavy Metal Lyrics a Data-Driven Corpus Study Into the Lyrics of Five Heavy Metal Subgenres
Total Page:16
File Type:pdf, Size:1020Kb
UNIVERSITY OF HELSINKI Keywords in heavy metal lyrics A Data-Driven Corpus Study into the Lyrics of Five Heavy Metal Subgenres Jesse Taina Pro gradu English Philology Department of Modern Languages University of Helsinki April 2014 1 Tiedekunta/Osasto Fakultet/Sektion – Faculty Laitos/Institution– Department Humanistinen tiedekunta Nykykielten laitos Tekijä/Författare – Author Jesse Taina Työn nimi / Arbetets titel – Title Keywords in Heavy Metal Lyrics: A Data-Driven Corpus Study into the Lyrics of Five Heavy Metal Subgenres Oppiaine /Läroämne – Subject Englantilainen filologia Työn laji/Arbetets art – Level Aika/Datum – Month and year Sivumäärä/ Sidoantal – Number of pages Pro Gradu - tutkielma 04 / 2014 89 s. + 2 liitettä Tiivistelmä/Referat – Abstract Heavy metal -musiikkia on akateemisessa maailmassa tutkittu vain vähän. Tutkimuksen kohteena on yleensä ollut heavy metal genrenä tai kulttuurisena ilmiönä. Ne harvat tutkimukset, jotka ovat keskittyneet heavy metal -kappaleiden sanoituksiin, ovat useimmiten ottaneet lähtökohdakseen kvalitatiivisen metodin. Tämä tutkimus hyödyntää kvantitatiivisia menetelmiä. Tutkimuksen lähtökohtana on tutkia heavy metal -kappaleiden sanoituksia tilastollisesti korpuslingvistisiä metodeita hyödyntäen. Menetelmistä tärkein on avainsanametodi, jonka avulla teksteistä voi tunnistaa tilastollisesti usein esiintyviä sanoja. Tutkimusta varten koottiin pienikokoinen korpus (METAL corpus), joka kostuu 200 tekstistä. Korpus on jaettu viiteen 40 tekstistä koostuvaan osakorpukseen, joista kukin edustaa yhtä tutkittavaa alagenreä: black metal, death metal, power metal, thrash metal ja traditional heavy metal. Kunkin genren avainsanat saatiin vertaamalla tutkittavana olevaa kohdekorpusta neljän muun osakorpuksen kaikkiin teksteihin, joita käytettiin referenssikorpuksena. Tällä tavoin esiin nousivat ne sanat, jotka esiintyivät kussakin tiettyä alagenreä edustavassa osakorpuksessa tilastollisesti useammin kuin muissa osakorpuksissa. Tutkimuksen tavoitteena on löytää vastaukset seuraaviin kysymyksiin: mitä avainsana-analyysi kertoo alagenrejen kappaleiden sanoitusten välisistä eroista? Kuinka hyvin avainsana-analyysiä voi hyödyntää kappaleiden sanojen tutkimisessa? Kuinka hyvin automatisoitu sanaluokkien annotointi (POS-tagging) toteutuu, kun aineistona ovat sanoitukset? Avainsana-analyysin tulokset kertovat kunkin alagenren sanoitusten tyylistä sekä antavat hieman osviittaa tyypillisistä teemoista. Avainsanoiksi nousseiden kieliopillisten sanojen perusteella alagenret black ja death metal suosivat kirjallisempaa ilmaisua, kun taas power, thrash ja traditional heavy metal suosivat puhekielisempää ilmaisua. Tulosten perusteella black ja death metal - kappaleiden sanoituksissa käytetään of-preposition sisältäviä nominilausekkeita tilastollisesti enemmän kuin muissa alagenreissä. Preposition of lisäksi kirjalliselle ilmaisulle tyypilliset sanat as, before, nor ja the nousivat myös avainsanoiksi black metalissa sekä beyond, upon, thee, thou ja thy death metalissa. Sitä vastoin puhekielelle ominaiset lyhennetyt muodot nousivat avainsanoiksi power metalissa ja traditional heavy metalissa. Thrash metal -sanoitukset muista alagenreistä erottavaksi tekijäksi havaittiin kirosanat, jotka nousivat kyseisen alagenren avainsanoiksi. Sanoitusten sisällöstä kielivien avainsanojen analyysin tulokset tukevat aikaisempaa heavy metal sanoituksista tehtyä tutkimusta. Sosiologi Kahn-Harrisin extreme metal -genrejen (tässä tutkimuksessa black, death ja thrash metal) sanoituksista tehdyt havainnot täsmäsivät tässä tutkimuksessa tehtyihin havaintoihin. Näiden genrejen edustamien kappaleiden sanoitusten sisältö ja teemat liittyvät usein vakaviin ja synkkiin aiheisiin. Myös näiden alagenrejen diskurssille Kahn-Harrisin mukaan tyypillinen provokatiivisuus ja normien rikkominen näkyvät tämän tutkimuksen tuloksissa. Power metal -sanoitusten sisällön yhteydet fantasiakirjallisuuden elementteihin kuten soturikulttuuriin ja sankaruuteen olivat nähtävissä alagenren avainsanoissa. Traditional heavy metal - sanoitukset poikkesivat muiden alagenrejen sanoituksista siinä, että niiden ilmaisu on puhekielisintä ja näistä alagenreistä lähimpänä rock- ja muuta populaarimusiikkia. Sanaluokkien annotointi toteutui odotettua paremmin, sillä onnistumisprosentti (oikein annotoitujen sanojen osuus) oli korkea (94,7%) ja verrattavissa korkeimpiin annotoinnissa saatuihin tuloksiin (95-98%). Annotoitua korpusta hyödyntämällä oli mahdollista tutkia kieliopillisia ilmiöitä, kuten genitiivisten nominilausekkeiden suhteellista määrää eri alakorpuksissa. Tutkimuksessa käytetty korpus on varsin pieni, mikä vähentää tilastollisten laskelmien merkitsevyyttä. Saatuja tuloksia voidaankin pitää kohdistimina, jotka osoittavat mihin suuntaan heavy metal -sanoitusten tutkimusta voi jatkaa. Avainsanat – Nyckelord – Keywords heavy metal, lyrics, keyword analysis, corpus linguistics, black metal, death metal, power metal, thrash metal, POS-tagging Säilytyspaikka – Förvaringställe – Where deposited Muita tietoja – Övriga uppgifter – Additional information 2 Table of Contents 1 Introduction ................................................................................................................................. 4 2 Heavy Metal ................................................................................................................................. 5 2.1 Genre .................................................................................................................................... 6 2.2 A Short History of Heavy Metal............................................................................................ 10 2.3 The Heavy Metal Subgenres in this Study ............................................................................ 10 2.4 Lyrics in Heavy Metal ........................................................................................................... 13 3 Corpus Linguistic Theory ............................................................................................................ 21 3.1 Corpus Linguistic Approaches .............................................................................................. 21 3.2 Earlier Corpus Linguistic Studies on Song Lyrics ................................................................... 22 3.3 The Keyword Approach ....................................................................................................... 25 3.3.1 Earlier Studies Utilizing the Keyword Approach ............................................................ 31 4 Data & Methods ......................................................................................................................... 32 4.1 Data Collection .................................................................................................................... 32 4.2 Data Pre-processing............................................................................................................. 36 4.3 The METAL Corpus .............................................................................................................. 37 4.4 Methods of Analysis ............................................................................................................ 40 5 Analysis ...................................................................................................................................... 43 5.1 Keywords of the Subcorpora ............................................................................................... 47 5.2 Keykeywords of the Subcorpora .......................................................................................... 62 5.3 Keywords of Individual Song Texts ....................................................................................... 72 5.4 Utilizing the POS-Tagger and the Tagged METAL Corpus...................................................... 75 5.4.1 Of ................................................................................................................................. 78 5.4.2 -ing ............................................................................................................................... 80 6 Discussion .................................................................................................................................. 80 7 Conclusions ................................................................................................................................ 85 3 Works Cited .................................................................................................................................. 88 Appendix 1 ........................................................................................................................................ Appendix 2 ........................................................................................................................................ 4 1 Introduction Heavy metal music has been researched to some extent as a genre and cultural phenomenon from a sociological point of view (e.g. Weinstein 1991, Kahn-Harris 2007) but there are only few studies that focus on the linguistic aspects of heavy metal. This study takes a data-driven corpus linguistic approach to heavy metal lyrics, attempting to look into some linguistic factors that make heavy metal subgenres lyrically distinct from each other. Previous studies on rock and heavy metal lyrics are scarce and the ones that I have encountered have usually taken a qualitative approach (e.g. Saarinen 2013 and Träff 2011). The few studies