<<

Een Sociaal Netwerk Onder Muziekartiesten:

Een analyse van het sociaal netwerk van muzikanten en daaraan verbonden muzikale kenmerken

Gegevens student B.J.G.M. Kuppens Corporate Communication & Digital Media Universiteit van Tilburg [email protected]

Begeleiding dr. J. J. Paijmans Faculteit Geesteswetenschappen dpt. Comm.‐ Infor.wetensch [email protected]

1

Abstract

Dit onderzoek verdiept zich in de structuur van het sociaal netwerk van muziekartiesten. Wat onderzocht wordt, is of er binnen dit sociaal netwerk een zogenaamde power law verdeling te ontdekken valt. Dit is interessant vanwege de maatschappelijke relevantie van power law structuren in de samenleving. Om dit vast te stellen is er gekeken naar wie de meest invloedrijke artiesten zijn en van wie er de meeste nummers gecoverd zijn. De verwachting is dat er relatief weinig artiesten zijn met relatief veel invloed op medeartiesten, en overeenkomstig staan veel artiesten die weinig invloed hebben op hun medeartiesten. Hetzelfde fenomeen wordt verwacht bevestigd te worden voor gecoverde nummers.

Nadat is gebleken dat de structuur van het sociaal netwerk onder muziekartiesten daadwerkelijk de kenmerken vertoont van een power law verdeling, is er vervolgens nog gekeken naar een viertal muzikale kenmerken van de meest invloedrijke artiesten gevonden tijdens dit onderzoek. Het betreft het genre, de muziekstijl, stemming van de muziek en de instrumentatie die een bepaalde artiest uitoefende. Ook van deze variabelen is er een frequentieverdeling gemaakt en is er gekeken of er op een power law gelijkende verdeling is. Dit bleek alleen bij de variabelen genre en instrumentatie het geval te zijn. Muziekstijl in mindere mate en wat stemming betreft zijn er geen dominante items gevonden.

2

Inhoudsopgave

Blz.

1. Inleiding 4

1.1 Introductie 4 1.1.1 Netwerkstructuur 4 1.1.2 Schaal‐vrije netwerken 5 1.2 Context 6 1.2.1 De power‐law 6 1.2.2 Doelstelling 7

2. Data acquisitie 9

2.1 Methoden 9 2.1.1 Variabelen 9 2.1.2 Dataverzameling 11 2.1.3 Verzamelen van data 12 2.1.4 Samenstellen lijst onderzocht muzikanten 14 2.2 Kwaliteit van de data 17 2.2.1 Procedureel 17 2.2.2 Genre (genre) 17 2.2.3 Muziekstijl (style) 18 2.2.4 Muzikale stemming (moods) 18 2.2.5 Instrumentatie (instruments) 18 2.2.6 Beïnvloed door (Influenced by) 19 2.2.7 Heeft beïnvloed (followers) 19 2.2.8 Covers (performed songs by) 19 2.2.9 Jaartallen 19

3. Resultaten 21 3.1 Sociaal Netwerk onder muziekartiesten 21 3.2 Muzikale kenmerken van de topartiesten 23

4. Discussie 26

5. Conclusie 30

6. Literatuur 32

Bijlage 1: Screenshots allmusic.com 34 Bijlage 2: Rangschikkingen variabelen 36

3

1. Inleiding

Dit hoofdstuk bestaat uit een sectie met een op literatuur gebaseerde ‘Introductie’ en een sectie ‘Context’, waarin de achtergrond van dit onderzoek wordt uitgelegd. De sectie ‘Introductie’ informeert over de literatuur over sociale netwerken. De belangrijkste begrippen binnen dit vakgebied worden uitgelegd, zodat de lezer voldoende kennis voor handen heeft om dit artikel volledig te kunnen begrijpen. In de sectie ‘Context’ wordt een beeld gecreëerd van de achtergrond van sociale netwerken en de muziekartiesten. Besproken wordt, hoe en waarom dit onderzoek maatschappelijk relevant is, waarna de focus zich vervolgens zal richten op de doelstelling van het onderzoek.

1.1 Introductie

1.1.1 Netwerkstructuur

Het begrip ‘sociaal netwerk’ is in de digitale eeuw een veel voorkomende term. De gedachten bij dit begrip gaan al gauw naar websites als facebook.com of naar het aantal contacten dat een individu heeft. Maar hoeveel contacten heeft iemand gemiddeld? Heeft de één meer contacten dan de ander? Hoe ziet de structuur van een sociaal netwerk eruit? Van complexe netwerken, zoals bijvoorbeeld het sociaal netwerk, zijn small‐world netwerken misschien wel het meest bekend. Het small‐ world fenomeen is al jarenlang een onderwerp van onderzoek.

Het meest bekende voorbeeld ervan is het ontmoeten van iemand die op het eerste oog een complete onbekende lijkt, waarmee men niets gemeen heeft. Vervolgens blijkt na een kort gesprek al, dat deze twee onbekenden, toch ergens een gemeenschappelijke kennis hebben. Dit is precies wat het small‐world concept inhoudt (Watts, 1999). Onderzoek naar small‐worlds begon al in 1967 door Milgram (Milgram, 1967), die beweerde dat ieder individu in deze wereld binnen zes contacten, ook wel de six‐degrees‐of‐separation genoemd, in connectie kan worden gebracht met ieder ander willekeurig individu ter wereld, een grafische weergave staat in afbeelding 1. Het bestaan van small‐world netwerken is al verschillende keren op allerlei gebieden aangetoond. Zo is het small‐word concept toepasbaar op het transportnetwerk van Boston (Latora & Marchioni, 2002), de verdeling van burgers over de steden (Mansury & Guljás, 2007), de onderwater leefwereld (Seuront, Mitchell, 2008) en de verdeling van brandhaarden binnen een stad (Song, et al., 2003).

4

Afbeelding 1 Grafische weergave van de ‘Six­Degrees­of­Separation’

1.1.2 Schaal­vrije netwerken

Over de vorm/structuur van small‐world netwerken schrijven Amaral, Scala en Barthe (2000) dat er drie categorieën netwerken bestaan in de echte wereld, waarbij dit paper zal zich focussen op het zogenaamde schaal­vrije netwerk. Dit zijn netwerken waarvan de verdeling een power law volgt (Barabási & Bonabeau, 2003). De naam ‘schaal­vrije network’ komt van het feit dat in deze netwerken, op wat voor schaal dan ook, de vorm van de verdeling altijd hetzelfde zal blijven.

Dit kan het beste duidelijk worden gemaakt aan de hand van een voorbeeld. Wanneer op een computer de verdeling tussen files van 2Kb en die van 1Kb 1:4 is, deze verhouding hetzelfde zal blijven wanneer er gekeken gaat worden naar de verhouding tussen files van 2Mb en die van 1Mb. De verhouding zal ook dan 1:4 zijn. Deze eigenschap is echter zeker niet toe te kennen aan iedere verdeling; alleen aan verdelingen die de vorm van een power law vertonen (Newman, 2005). Deze hebben twee belangrijke eigenschappen. Allereerst dat deze netwerken onder andere continu blijven groeien, er komen dus alsmaar nieuwe connecties bij. Ten tweede hechten deze nieuwe connecties voor het overgrote deel aan knopen die al de meeste connecties hebben (Barabási & Albert, 1999). Deze twee eigenschappen zorgen ervoor dat de verdeling van connecties over de verschillende knopen geen normaal verdeling krijgt, maar een power law volgt.

Een power law is een wiskundige relatie tussen twee grootheden. Grafisch zien deze verdelingen eruit als een kromme, snel dalende lijn op standaard schaal, op een log‐ log schaal zal de grafische vertoning de vorm van een min of meer rechte lijn krijgen.

Wiskundig gezien heeft een dergelijke functie de volgende vorm:

1

5

De variabele α is de exponent van de power law is en waarin C een constante is. Door van beide leden het logaritme te nemen ontstaat:

log log log 2

Dit zorgt ervoor dat er op dubbellogaritmisch papier een lineair verband wordt getoond (Newman, 2005). Bekende voorbeelden van power law verdelingen zijn onder andere Zipf’s Law, Benford’s law, Bradford’s law, Lotka’s law en het Pareto principe. De power law verdeling is al meerdere malen aangetoond in zeer verscheidene omgevingen. Zo zijn er power law verdelingen te vinden in aardbevingen (Gutenberg & Richter, 1944), kraters op de maan (Neukum & Ivanov, 1994), computer files (Crovella & Bestavros, 1996), de frequentie van woorden die mensen gebruiken (Zipf, 1949) en het over het inkomen (Pareto, 1896). Ook onder sociale netwerken zijn power law verdelingen te vinden. Zo is dit patroon al meerdere malen aangetoond in verscheidene sociale netwerken, onder andere: menselijke seksuele contacten (Bearman, Moody & Stovel, 2004), de verdeling van citaten in wetenschappelijke artikelen (de Solla Price, 1965), forum posts (Bird, et al., 2006), samenwerking tussen wetenschappers (Barabási, et al., 2002; Newman, 2001), verwijzingen naar Youtube‐filmpjes (Chenge, Dale & Liu, 2008), de verdeling van projecten onder open‐source software ontwikkelaars (Madey, Freeh & Tynan, 2002), connecties tussen Hollywood acteurs (Watts, 1999) en tot slot de verwijzingen naar online winkels (Stephen & Toubia, 2009).

1.2 Context

1.2.1 De power­law verdeling

Onderzoek naar sociale netwerken is relevant vanuit verschillende invalshoeken. Maar al deze invalshoeken komen erop neer, dat wanneer de netwerkstructuur de vorm van een power law volgt, er enkele knopen zijn met relatief veel connecties en heel veel knopen met relatief weinig connecties. In de volksmond staat dit verschijnsel beter bekend als de 80‐20 regel (Pareto, 1896). Deze wil zeggen dat 20% van de knopen 80% van de connecties bezit. Daartegenover staat dat de overige 80% van de knopen de overgebleven 20% van de connecties mag verdelen. Een voorbeeld hoe een zodanige verdeling er grafisch uitziet, treft u aan in afbeelding twee. Deze regel is eenvoudig, maar heeft grote gevolgen in bijvoorbeeld de medische wereld, de computerindustrie en het bedrijfsleven. Wanneer er bijvoorbeeld een virus terecht komt in een knoop met veel connecties, zal in een mum van tijd het een groot gedeelte van het netwerk geïnfecteerd zijn. Een netwerk met een power law distributie is gevoeliger voor aanvallen van buitenaf. Door kennis over het netwerk is men beter in staat een netwerk te beveiligen, omdat men beter bekend is met de sterkten en zwakten van het netwerk. In het bedrijfsleven is het belang net zo groot. Voor een bedrijf kan het bijzonder nuttige informatie zijn om te weten of bedrijfspartners veel connecties hebben of juist in het segment vallen met weinig connecties.

6

Afbeelding 2 Voorbeeld van een Grafiek die de Structuur van een Power Law weergeeft (Wikipedia, 2010). Het dominante deel (groen) zorgt voor 80% van de inhoud, terwijl de lange staart (geel) voor slechts 20% van de inhoud zorgt. Beter bekend als de 80­20 regel.

Dit onderzoek gaat zich focussen op het netwerk van artiesten binnen de muziekindustrie, een grootschalige industrie, waarin wereldwijd in het jaar 2009 meer dan 17 miljard Amerikaanse dollars in omgingen (IFPI, 2010). Het is een industrie die ervoor zorgt dat er muziek wordt gecreëerd, uitgevoerd, behouden en wordt gepromoot.

Iedere artiest die muziek maakt heeft een bron van inspiratie. Zo worden artiesten geïnspireerd door bijvoorbeeld hun passie voor muziek, levenservaringen, maar vooral ook door hun voorgangers. Het lijkt alsof daarin vaak dezelfde namen genoemd worden, zo laat bijvoorbeeld bijna iedere artiest zich lovend uit over Michael Jackson. De verwachting is dan ook dat er ook binnen het netwerk van artiesten een power law te vinden is in de verdeling van inspirerende artiesten. Om precies te zijn wordt verwacht een Zipf‐curve aan te treffen. De reden dat dit verwacht wordt ligt in Zipf’s principle of least effort. Dit principe houdt in dat men altijd zal proberen op een zodanige manier te handelen dat een doel met de minste inspanning bereikt wordt. (Zipf, 1949). De redenering dat het minder moeite kost om succesvol te zijn in de muziekindustrie wanneer men inspiratie zoekt bij bekende artiesten lijkt aannemelijk. De verwachting is dan ook, dat er een relatief klein groepje van artiesten, waarnaar veel wordt verwezen, van invloed is geweest op een relatief grote groep artiesten.

1.2.2 Doelstelling

Het doel van dit artikel is het blootleggen van de structuur van het sociaal netwerk van artiesten, waarin gekeken wordt naar de verwijzingen van artiesten zelf en naar de artiesten die op hen van invloed zijn geweest.

De vraagstelling luidt: Wat zijn de eigenschappen van het sociaal netwerk tussen muziekartiesten en wat zegt dat over de muzikale kenmerken die daaraan verbonden zijn?

7

Deelvragen die onderzocht worden:

1. In hoeverre sluit het artiestennetwerk aan bij een power law structuur? 2. Welke muziekgenres hebben de meeste invloed op muziekartiesten? 3. Welke muziekstijlen hebben de meeste invloed op muziekartiesten? 4. Welke vormen van instrumentatie hebben de meeste invloed op muziekartiesten? 5. Welke muziekstemming heeft de meeste invloed op muziekartiesten?

Het onderzoek zal deels toetsend, deels explorerend van aard zijn. De verwachting is dat er een power law gevonden wordt in het netwerk van artiesten. Wanneer deze verwachting bevestigd wordt, zal er worden gezocht naar welke conclusies hieraan verbonden kunnen worden. Dit gedeelte van het onderzoek zal bestaan uit het exploreren van de muzikale kenmerken van de meest invloedrijke muzikanten. De belanghebbenden bij dit onderzoek zijn mogelijk de mensen die zich bewegen in de muziekindustrie en verdere onderzoeken naar structuur van sociale netwerken. Voor platenlabels kan het van nut zijn om te weten welke muziek voor veel inspiratie heeft gezorgd, omdat deze hoogstwaarschijnlijk ook meer kans heeft om te slagen bij het grote publiek. Voor artiesten heeft deze informatie hetzelfde belang. Zij kunnen kijken welke muziek vaak als bron van inspiratie is gebleken en proberen binnen dit segment succes te boeken. Of zij kunnen er juist voor kiezen van het gebruikelijk pad af te slaan en op een vernieuwende manier succes proberen te boeken.

Samenvattend: Allereerst is het small‐world concept geïntroduceerd, waarna vervolgens is aangegeven, dat dit artikel zich zal focussen op de zogenaamde schaal‐ vrije networks. Een belangrijk kenmerk van deze soort netwerken is dat nieuwe knopen zich over het algemeen hechten aan knopen die al veel connecties bezitten. Dit zorgt ervoor dat de verdeling binnen een zodanig netwerk de vorm van een power‐law krijgt, een voorbeeld van een power law is onder andere de 80‐20 regel. Dit onderzoek probeert te ontdekken of deze verdeling ook bestaat binnen het netwerk van muziekartiesten. De doelstelling van dit onderzoek is dan ook het blootleggen van de structuur van het netwerk van muziekartiesten, waarin gekeken wordt naar verwijzingen van artiesten zelf, naar artiesten die op hen van invloed zijn geweest. Als laatste, zal er aan de hand van de gevonden structuur gekeken worden welke muzikale kenmerken er te verbinden zijn met de artiesten die het meest van invloed waren/zijn.

8

2. Data acquisitie

Het hoofdstuk Data acquisitie bestaat uit een gedeelte ‘Methoden’, waarin de methoden van onderzoek worden beschreven en uit een sectie ‘Kwaliteit van de data’, waarin een beschrijving van de kwaliteit van de onderzochte eenheden wordt gegeven. In de het hoofdstuk ‘Methoden’ zullen eerst de onderzochte eenheden worden geïntroduceerd, waarna vervolgens stap voor stap zal worden beschreven hoe deze eenheden zijn verwerkt. Ditzelfde hoofdstuk schenkt ook aandacht aan de discussie over het hoe en waarom er gekozen is voor de desbetreffende bronnen voor dit onderzoek. Vervolgens in het tweede deel van de dit hoofdstuk, de ‘Kwaliteit van de data’, zullen alle eenheden één voor één de revue passeren met een korte bespreking wat betreft kwaliteit, waarbij ook de kwaliteit van de analyses kort besproken zal worden.

2.1 Methoden

2.1.1 Variabelen

Concreet is dit onderzoek op de volgende manier opgezet. Nadat het uitgangspunt, het onderzoeken van een sociaal netwerk onder muzikanten, de eenheden en de variabelen waren vastgesteld, is de informatiebron bepaald. De informatiebron is de website www.allmusic.com. Op deze website kunnen alle benodigde variabelen worden gevonden. De tweede stap was het bepalen wie de onderzochte eenheden (artiesten) gingen worden. Uiteindelijk is ervoor gekozen de artiesten, gevonden op de website aclaimedmusic.net, te gebruiken. Van de gegevens die zijn verzameld is vervolgens voor iedere variabele een frequentieverdeling gemaakt in het programma Microsoft Excel. Het uiteindelijke doel is bepalen in hoeverre deze frequentieverdelingen de vorm van een power law verdeling laten zien.

Om het onderzoek af te bakenen, is er voor gekozen de eenheden te beperken tot internationale muziekartiesten na 1945. Op deze manier blijft het mogelijk de data overzichtelijk en toegankelijk te houden. Door te kiezen voor internationale artiesten wordt ervoor gezorgd dat de artiesten zo bekend zijn dat er voldoende informatie over te vinden valt.

Zoals eerder vermeld zal er allereerst gekeken worden naar de structuur van het netwerk onder muziekartiesten. Laten we voorop stellen dat muziekartiesten in twee categorieën vallen. Dit zijn artiesten, in de zin van soloartiesten, en groepen, in de zin van bands. Echter, beiden categorieën vallen in dit onderzoek onder de dezelfde benaming ‘muziekartiest’. Wat betreft inhoudelijke informatie zijn beiden hetzelfde, en daarom wordt er aan het onderscheid tussen bands/groepen en soloartiesten geen aandacht besteed en worden zij behandeld als eenzelfde eenheid. Om de structuur van het netwerk van muziekartiesten te onderzoeken worden er drie verschillende variabelen onder de loep genomen. Variabele één is, wie is van invloed geweest op een bepaalde artiest (influenced by), de tweede variabele is, wie er wordt beïnvloed door een bepaalde artiest (followers) en als derde zal er gekeken worden naar van wie de meeste nummers gecoverd zijn (performed songs by). Deze

9

drie variabelen zullen moeten aantonen in hoeverre het artiestennetwerk daadwerkelijk de verdeling van een power‐law volgt.

Om het verschil tussen de eerste twee variabelen te verduidelijken zijn deze grafisch weergegeven in afbeelding 3. Stel dat in beide afbeeldingen de ronde stip staat voor , dan worden in het gedeelte onder Influenced by de vierkante stippen gevormd door artiesten waardoor Bob Dylan beïnvloed is. Terwijl binnen de variabele followers de vierkante stippen worden ingevuld door namen van artiesten die juist door Bob Dylan zijn beïnvloed. De pijlen voor beide variabelen staan voor ‘heeft invloed gehad op’. Echter, de richting geeft aan dat onder Influenced by het gaat om invloed op Bob Dylan, terwijl de variabele Followers aangeeft de invloed van Bob Dylan. In een latere fase van onderzoek is gebleken dat de variabele followers geen informatie verschaft over de structuur van het netwerk, ondanks dat deze variabele op het eerste gezicht wel relevant zou kunnen zijn. Meer hierover in een later stadium in het hoofdstuk ‘Discussie’.

Afbeelding 3 Grafische Weergave van de Variabelen Influenced by en Followers

Wanneer er bekend is wie de meest invloedrijke artiesten binnen het netwerk zijn, zullen in het volgende stadium van dit onderzoek vier verschillende variabelen onderzocht, die ieder staan voor diverse muzikale kenmerken (zie bijlagen). Aan bod zal komen binnen welk genre de artiesten thuis horen (genre), welke muziekstijlen er bij deze artiesten passen (style), welke stemming hun muziek weergeeft (moods) en wat voor instrumentatie er gebruikt is voor hun muziek (Instruments). Een overzicht van alle variabelen in dit onderzoek staat in tabel 1.

10

Tabel 1 Overzicht Onderzoeksvariabelen

Variabele Items bestaan uit Influenced by Artiestennamen Followers Artiestennamen Performed songs by Artiestennamen Genre Genres Style Muziekstijlen Moods Stemmingen/gemoedstoestanden Instruments Instrumenten

2.1.2 Dataverzameling

Benodigde data bestanden

De methode van dataverzameling zal bestaan uit het samenstellen van een databestand met daarin de hierboven beschreven informatie over X muziekartiesten. X zal minimaal om en nabij de duizend artiesten moeten zijn om voldoende externe validiteit te kunnen garanderen, wat staat voor in hoeverre de onderzoeksresultaten generaliseerbaar zijn. Gekoppeld aan iedere muziekartiest zit er informatie wat betreft welke artiesten hem/haar/hun heeft beïnvloed (Influenced by), op wie hij/zij/hun van invloed zijn geweest (followers), van wie hij/zij/hun nummers gecoverd hebben (performed songs by). Wat nu gecreëerd is, zijn drie databestanden waarvan de eerste artiestennamen bevat die van invloed zijn geweest (Influenced by), de tweede bevat namen van artiesten die hun invloed gevonden hebben bij het X aantal muziekartiesten (followers) en het derde databestand bevat namen van artiesten waarvan er nummers zijn gecoverd (performed songs by).

Vervolgens wordt er in elk van de drie databestanden afzonderlijk gekeken hoe vaak een bepaalde artiest genoemd is in dat bestand. Anders gezegd zal er een rangschikking worden gemaakt van de frequentieverdeling van namen in één ieder van de drie databestanden. Aan de hand van deze bestanden proberen we vast te stellen in hoeverre er sprake is van een eventuele power law verdeling.

Wanneer de power law verdeling bevestigd wordt, zullen uit de rangschikking van de variabele ‘beïnvloed door’ (Influenced by) de hoogst genoteerde artiesten worden geselecteerd en zullen hun muzikale kenmerken worden bestudeerd. Dit gaat op dezelfde manier als bij de variabelen influenced by, followers en performed songs by. Aan iedere artiest uit het selecte groepje zit informatie gekoppeld over het muziekgenre waar hij/zij/hun binnenvallen (genre), de verschillende muziekstijlen die hij/zij/hun spelen (style), welke stemmingen hun muziek weerspiegeld (moods) en als laatste van welke vormen van instrumentatie zij gebruik maken (instruments). Er zijn nu vier nieuwe databestanden gecreëerd waarvan de eerste genres bevat (genre), de tweede soorten muziekstijlen bevat (style), de derde soorten stemmingen bevat (moods) en de laatste bezit benamingen voor vormen van instrumentatie (instruments). Wederom zal in iedere database afzonderlijk worden

11

gekeken naar de frequentieverdelingen van benamingen binnen het desbetreffende databestand. Zodoende zullen er rangschikkingen worden gemaakt van de vier verschillende muzikale kenmerken. Een simpele weergave van de data staat weergegeven in afbeelding 4.

Afbeelding 4 Grafische weergave Dataverwerking

2.1.3 Verzamelen van data

De informatiebron: Allmusic.com

Om aan de dataverzameling te komen zal er informatie worden gehaald van de website allmusic.com. Allmusic, oorspronkelijk in 1991 gestart als All Music Guide, biedt de service van muziekgids. De inhoud van Allmusic wordt gecreëerd door professionals op het gebied van informatieverwerking, uitgevers en schrijvers. Het netwerk van schrijvers bevat onder andere al meer dan 9000 schrijvers, die allen actief zijn op het gebied van album en single reviews en het schrijven van autobiografieën van muzikanten. De website van Allmusic beschikt informatie over de meest elementaire feiten, aangaande namen, copyright informatie en credits, over beschrijvende data, aangaande muziekstijlen, thema’s en nationaliteiten, over relationele informatie als gelijkende artiesten, albuminformatie en invloeden, en als laatste nog informatie over bewerkte data zoals biografieën, rangschikkingen en reviews (Rovi Corporation, 2010). De exacte inhoud van wat Allmusic aan data bezit staat weergegeven in bijlage twee (Rovi Corporation, 2010). Tevens treft u in bijlage één enkele afbeeldingen van de website aan.

12

Verzoek aan ROVI Corporation

Nu bekend is op welke plaats de benodigde informatie te vinden is, waren er verschillende mogelijkheden om deze data ook daadwerkelijk tot beschikking te krijgen. Allereerst, was er de optie dat de gegevens te verkrijgen waren via de website allmusic.com. Allmediaguide.com, het bedrijf dat de website onderhoudt en het moederbedrijf ROVI corporation zijn beiden schriftelijk en per email benaderd met het verzoek om het gewenste databestand op te sturen. Het enorme voordeel aan deze manier van data verzamelen zou zijn dat de mogelijkheid ontstaat om met een databestand van enkele duizenden artiesten te kunnen realiseren. Dit zou de kracht om later te mogen generaliseren enorm vergroten. Ondanks dat dit de gemakkelijkste optie zou zijn, was dit ook de optie met de geringste kans van slagen. ROVI corporation is een commercieel bedrijf waardoor de kans klein is dat zij medewerking zullen verlenen aan dit onderzoek, wat uiteindelijk ook niet gebeurd is.

Handmatig gegevens inwinnen

De laatste en meest waarschijnlijke optie is om handmatig informatie over de om en nabij duizend artiesten te knippen en te plakken van de website allmusic.com. Op deze manier zijn er ongeveer honderd artiesten per uur haalbaar, waardoor de werklast binnen de perken blijft. Een voorbeeld van hoe dit in zijn werk gaat volgt hieronder. De volgende instructie werd meegegeven aan een ieder die meehielp met het verzamelen van data. Met nadruk werd er gevraagd deze instructie zorgvuldig en geconcentreerd uit te voeren.

Eén voor één knipt de uitvoerder een artiestennaam uit een lijst van duizend artiesten. Vervolgens voert hij deze artiestennaam in op de zoekbalk op de website allmusic.com en voert vervolgens de desbetreffende zoekopdracht uit. Voor dat men de zoekopdracht uitvoert, checkt men even of in de ‘advanced search’ balk de categorie ‘artist/group’ is geselecteerd. Wanneer de zoekterm gerelateerd is aan slechts één artiest, zal er direct een scherm tevoorschijn komen waarop informatie over de desbetreffende artiest staat. Wanneer echter de ingevoerde zoeknaam aan meerdere artiesten wordt gelinkt, zal er een scherm tevoorschijn komen met een lijst van zoekresultaten. Bij ieder zoekresultaat staat ook een mate van relevantie, dus in hoeverre de zoekterm overeenkomt met het voorliggende zoekresultaat. In negen van de tien gevallen zal het bovenste zoekresultaat de link naar de juiste artiest zijn. Bij twijfel echter, gaat men terug naar de oorspronkelijke website waar de zoekterm vandaan komt. Klik daar op de naam van de artiest en er zal in het kort wat informatie over de desbetreffende artiest in beeld verschijnen. Vervolgens kan deze informatie worden vergeleken met de informatie die op de website allmusic.com staat. Om er zodoende honderd procent zeker van te zijn dat er de juiste informatie van de website allmusic.com gehaald wordt. Wanneer men de juiste webpagina op allmusic.com met de

13

juiste artiestinformatie voor zich heeft (een voorbeeld daarvan treft u aan in de bijlage) drukt men op ctrl+S om de webpagina op te slaan. Wanneer de webpagina wordt opgeslagen, voert men bij ‘File name’ de naam in van de desbetreffende artiest en moet men er attent op zijn dat er bij ‘save as type’ de optie ‘tekstbestand’ geselecteerd is. Vanzelfsprekend is dat alle opgeslagen webpagina’s netjes in één map worden geplaatst die de naam ‘BA­scriptie database 1’ draagt.

2.1.4 Samenstellen lijst onderzochte muzikanten

De grote vraag blijft hoe een random lijst van duizend artiesten komt gecreëerd kan worden. Daarvoor zijn de volgende mogelijkheden de revue gepasseerd:

Muziekscholen Muziekscholen benaderen; De grootste complicatie is waarschijnlijk dat het mogelijk lang duurt voor de juiste persoon binnen een instelling bereikt wordt. Dan nog is het maar de vraag of ze met een waardevolle lijst kunnen komen. Je wordt in dit geval erg afhankelijk van de lijst met artiesten die je aangereikt krijgt en je weet van tevoren niet of deze geschikt zal zijn voor het onderzoek. De kans dat niet‐ commerciële instellingen bereid zijn te helpen is echter wel groter, wat het grote voordeel is van het benaderen van muziekscholen of muziekgerelateerde universiteiten/hbo‐instellingen.

Radiostations Radiostations benaderen met de vraag of ze een lijst met willekeurig duizend artiesten willen opsturen is een volgende optie. Er moet echter worden gevraagd naar een lijst met niet‐Nederlandse muziek. Dit vanwege het feit dat Nederlandse radiostations waarschijnlijk een lijst zullen sturen die te Nederlands gekleurd is. Dit zal en de validiteit van de gegevens schaden én het zal via de internationale website allmusic.com te weinig waardevolle informatie opleveren. Een tweede minpunt aan het benaderen van radiostations is, dat ook de buitenlandse muziek die gedraaid wordt afgestemd is op de Nederlandse luisteraar. Dit wil zeggen dat ook de muziek niet afkomstig uit Nederland, niet garant kan staan voor een random selectie van wereldwijde muziekartiesten. Verder hoeven de lijsten die de radiostations bezitten niet random te zijn. Ieder station heeft toch zijn eigen kleur of muziekstijl. Je zou al gegevens van meerdere radiostations moeten gebruiken om de lijst met artiesten random te houden.

Music.aol.com/mtv.com Via de website Music.aol.com is het op twee manieren mogelijk om een lijst met duizend artiesten samen te stellen. De eerste mogelijkheid is, naar de link met ‘all artists’ te gaan en daaruit vervolgens random duizend artiesten selecteren. Op deze manier verkrijg je een zeer random lijst, maar waarschijnlijk een lijst, met relatief veel onbekende artiesten. Hierdoor zal de informatie die beschikbaar is voor het vervolg van dit onderzoek te minimaal zijn. Deze optie is echter ook mogelijk via de website .com. Ook hier staat een database met artiestennamen. Aangezien deze

14

een stuk kleiner is, staan er artiesten met relatief meer bekendheid in, wat meer informatie oplevert voor het vervolg van dit onderzoek. Een groot nadeel van de mtv‐website is, dat de artiesten te eigentijds zijn. De artiesten die op deze website te vinden zijn, dekken niet de gehele tijdlijn van 1945 tot en met het heden.

De tweede keus op de website music.aol.com gaat via link met ‘top artists’. Onder deze link bevindt zich een lijst met ruim duizend artiesten, wat exact aansluit bij het minimaal benodigde aantal voor dit onderzoek. Gebruik van deze lijst zal waarschijnlijk de meeste informatie opleveren voor het verloop van onderzoek. Relatief bekende artiesten staan meer in de spotlight dan relatief minder bekende artiesten. De vraag naar informatie over relatief meer bekende artiesten is over het algemeen groter. Doordat er over het algemeen aan deze vraag wordt voldaan, zal er over relatief meer bekende artiesten een grotere hoeveelheid aan waardevolle informatie beschikbaar zijn. Het grootste nadeel van een zogenaamde ‘top lijst’ is dat de lijst niet meer willekeurig is samengesteld. De vraag is in hoeverre het is toegestaan om een lijst te gebruiken met ‘meeste populaire artiesten’ op dit moment. Het gebruik maken van de toplijst op de website Music.aol.com is echter van de hand gewezen. Er is niet bekend waar deze toplijst op is gebaseerd en deze was wederom te eigentijds voor dit onderzoek.

Acclaimedmusic.net Deze website, opgezet door de Zweedse wetenschapper Henrik Franzon, bevat een lijst met de 1000 beste artiesten van de jaren 1948 tot en met het heden. Via statische analyses en verschillende methodes om grote aantallen data te analyseren probeert hij al enkele jaren lang de lijst zo up‐to‐date mogelijk te houden. In eerste instantie werd de optie om een toplijst te gebruiken meteen van tafel geveegd, aangezien een zodanige lijst niet random is. Maar na enkele heroverwegingen is dit geeneens een slechte optie. Allereerst is het een zeer betrouwbare lijst, ontworpen met wetenschappelijk erkende methoden. Ten tweede is het misschien niet eens zo verkeerd om een lijst met ‘de beste’ artiesten te gebruiken. In principe wordt er nu gevonden waar de beste muziekanten ter wereld hun muzikale inspiratie vandaan hebben. In feite krijg je dus ‘het beste van het beste’. Ten derde is het een groot voordeel dat door gebruik te maken van de grootste artiesten, daar ook de meeste informatie over gevonden zal worden. Dit zal de externe validiteit van het onderzoek vergroten.

Deze laatste mogelijkheid is ook de optie die uiteindelijk gekozen is, vanwege de hoge statistische betrouwbaarheid van de top duizend en het feit dat wanneer er gebruik wordt gemaakt van een toplijst dit de hoeveelheid beschikbare informatie voor dit onderzoek relatief veel zal vergroten. Via kort contact met Henrik Franzon is door hemzelf de formule vrijgegeven die hij gebruikte om de top duizend samen te stellen.

S = ∑ ln ln10 + 0.6 ∑ ln ln10

15

In deze formule staat de S voor de score (S=score). Deze score geeft aan waar een desbetreffende artiest uiteindelijk zal eindigen in de top duizend. De A in de formule staat voor ‘albums’ en de S in de formule staat voor ‘songs’. Wat deze formule in feite doet is een bepaalde waarde meegeven aan de zes beste albums van een artiest en aan de zes beste liedjes van een artiest (i = 6). De waarde van A en S wordt bepaald door de plaats die een desbetreffend album of liedje inneemt in de Acclaimed top 3000 Albums en de Acclaimed top 3000 Songs. Wanneer een artiest minder dan zes albums of liedjes geregistreerd had staan, kregen deze ‘niet‐bestaande’ albums of liedjes de waarde 3100. ‘ln(..)’ staat voor natuurlijke logaritme. De reden waarom er gebruik is gemaakt van de natuurlijke logaritme, is om hogere posities in de rankschikking zwaarder mee te laten tellen.

Stel dat er iemand is met een album op plaats 100 en een album op plaats 1500, terwijl een andere artiest juist de plaatsen 200 en 1400 inneemt. Opgeteld krijgen beide artiesten zodoende de waarde 1600, maar het gebruikt van de logaritme zorgt ervoor dat de artiest met een op album op plaats honderd uiteindelijk hoger zal eindigen dan de artiest met een album op plaats tweehonderd. De 0.6 zorgt ervoor dat albums zwaarder meewegen dan liedjes, wat redelijkerwijs denkbaar is, aangezien het aanzienlijk meer werk is om een album te creëren dan een liedje. Gebaseerd op de data weergegeven in tabel 2 staat er een rekenvoorbeeld weergegeven van hoe de score voor een bepaalde artiest, in dit geval Bob Dylan, tot stand komt.

lnln10 7 lnln10 11 lnln10 23 lnln10 70 lnln10 172 lnln10 227 0.6lnln10 1 lnln10 135 lnln10 262 lnln10 279 lnln10 432 lnln10 462

13.970

Deze berekening is voor iedere artiest in de ‘acclaimed top 1000 best artists’ uitgevoerd en op basis van deze scores is er een ranking gemaakt. Wanneer iemand minder dan zes albums of liedjes in de acclaimed album en song top 3000 had staan kreeg deze variabele automatisch de waarde ‘ 3100’ .

16

Tabel 2 Rekengegevens van Acclaimedmusic.net die het rekenvoorbeeld ondersteunen (Henrik Franson, 2008)

Bob Dylan Albums Songs Naam Rang Naam Rang Blonde on Blonde 7 Like a Rolling 1 Stone Highway 61 11 Subterranean 135 Revisited Homesick Blood on the 23 Tangled Up in Blue 262 tracks Bringing it all back 70 Blowin’ in the 279 home Wind

The Freewheelin’ 172 Positively 4th 432 Bob Dylan Street Time Out of Mind 227 The Times They 462 Are A‐Changing

2.2 Kwaliteit van de data

2.2.1 Procedureel

Het is belangrijk gedurende het proces dat er met de data gewerkt wordt, regelmatig te checken hoe het gesteld is met de kwaliteit van de data.

Het eerste stukje kwaliteitscontrole vond al plaats tijdens de fase van het knippen, plakken en opslaan vanuit de website allmusic.com. Na iedere honderd toegevoegde namen werd de map met daarin de artiestennamen geopend, werden alle bestanden geselecteerd, om zodoende te kijken of ook het verwachte aantal namen aanwezig was. Dit bleek gedurende het volledige proces het geval te zijn.

Een tweede test om te kijken of alle duizend namen aanwezig waren is een simpele check op de variabele genre. Deze variabele bevat per artiest maar één item, dus wanneer deze categorie eruit gefilterd wordt, zouden er precies 1000 items in moeten staan. Ook bij deze tweede test bleken alle duizend artiesten opgenomen te zijn in de database.

2.2.2 Genre

Nadat was gebleken dat het aantal artiesten klopte, is de volgende stap het controleren op inhoud. Wanneer bijvoorbeeld de variabele genre gefilterd is, kan ook de inhoud van de desbetreffende variabele worden bekeken. Door middel van een vlugge scan werd er gekeken welke woorden er onder de variabele genre

17

verschijnen. Hier bleken geen opvallende dingen tussen te staan. De verschillende items die we tegenkwamen waren Pop/rock, R&B, , international, Latin, Reggae, Blues, Country, Electronic, Rap, Avant­Garde Music, Comedy/Spoken, , Folk, New Age, Religious en Vocal. Bij twijfel of een bepaald item wel in het lijstje thuishoort, zal de bijbehorende artiest worden achterhaalt en zal vervolgens opnieuw worden opgezocht op de website allmusic.com. Zodoende is het mogelijk te controleren of het betreffende item in bij de juiste variabele staat. Bijvoorbeeld, het item ‘international’ behoord toe aan tien verschillende artiesten. Eén daarvan is Nusrat Fateh Ali Khan. Wanneer deze artiest gecheckt wordt via de website allmusic.com, blijkt dat inderdaad het item ‘international’ thuishoort in de categorie ‘genre’. Op dezelfde manier werden ook de categorieën Influenced by, followers, performed songs by, date of birth, style, instruments, en moods gecontroleerd op inhoud. De variabele genre was klein genoeg om alle items afzonderlijk te controleren. Bij de overige variabelen is er steekproefsgewijs gecontroleerd op onvolkomenheden.

2.2.3 Muziekstijl (style)

Het aantal verschillende muziekstijlen genoemd, zijn er in totaal 513. Opvallende items die nader gecontroleerd zijn, waren in bij deze variabele Alternative singer/songwriter, C­86, Creole, Poetry, Singer/songwriter en TV­music. Van alle items kan gezegd worden dat deze ondanks hun twijfelachtige benaming toch met honderd procent zekerheid vallen binnen de variabele muziekstijl.

2.2.4 Stemming van de Muziek (moods)

Bij de variabele moods, oftewel de stemming van de muziek, vallen 188 verschillende items. Na een controle van deze categorie vielen er twee items op die voor twijfel konden zorgen. Om precies te zijn, waren dit de items movie­entry en Classical Music Entry. Het voorgevoel dat het item movie­entry niet behoorde tot de categorie van muziekstemmingen bleek juist. Dit item valt onder de categorie ‘other entries’ welke vlak onder de categorie ‘moods’ geplaatst staat op de website. Vandaar dat dit item foutief is opgenomen in de database voor dit onderzoek. Het foutieve item zal handmatig verwijderd worden uit het betreffend databestand en zal zodoende de kwaliteit van het onderzoek niet aantasten. Ook het item Classical Music Entry is vanwege dezelfde redenen foutief terecht gekomen in de categorie van muziekstemming. Ook deze zal handmatig uit het bestand worden verwijderd voordat er verdere analyses op de data zullen plaatsvinden.

2.2.5 Instrumentatie (instruments)

De variabele instruments bevat 86 verschillende items. Daaruit zijn de volgende items geselecteerd voor een extra controle omdat deze relatief afwijkende benamingen met zich meedroegen: songwriter, programming, producer, musical director, leader, group en bandleader. Echter, ondanks dat deze items twijfelachtig in de oren klinken, vallen zij allen toch binnen de variabele instruments en zullen niet verwijderd worden uit de database.

18

2.2.6 Beïnvloed door (Influenced by)

De volgende is de variabele Influenced by. Deze variabele bevat alle artiestennamen die ooit van invloed zijn geweest op minimaal één van de artiesten uit de duizend onderzochte artiesten. Deze variabele bevat 2,738 artiesten. Dit databestand bleek honderd procent correct te zijn gecreëerd.

2.2.7 Heeft beïnvloed (followers)

Bij de variabele followers staat er in het databestand een rijtje met verschillende getallen die als benaming voor een artiest gelden. Dit zijn de getallen 23, 108, 112, 213 en 311. Deze getallen zijn alle vijf nagetrokken, omdat er ook geboortedata zijn opgenomen tijdens het samenstellen van de database. De gedachte was dat er eventueel getallen in een foutieve categorie terecht waren gekomen. Maar dat bleek niet het geval te zijn. Alle vijf de getallen bleken een artiestennaam te zijn die voorkwam in de variabele followers. Deze categorie bevat dus verder geen fouten.

2.2.8 Covers (performed songs by)

Binnen de variabele covers was er helaas een fout opgetreden. Wanneer je op de website allmusic.com een pagina bekijkt van een willekeurige artiest, dan zie je rechts beneden de variabele ‘performed songs by’ staan. Kortom, de variabele met daarin artiestennamen van wie de desbetreffende artiest nummers gecoverd heeft. Helaas zijn er aan deze categorie ook de namen van verschillende liedjes toegevoegd die staan onder het kopje ‘music videos’ helemaal onderaan de pagina. Dit is ontdekt door middel van steekproeven en te kijken of de namen in de database onder de categorie ‘performed songs by’ stonden. De aanleiding voor deze steekproef was de enorme hoeveelheid aan namen binnen deze categorie. Dit aantal was te groot en divers om juist te kunnen zijn. Zolang deze fout niet verholpen kan worden, zal deze categorie buiten het onderzoek gelaten worden.

Na het schrijven van een nieuw script zijn de foutieve data er alsnog uitgefilterd waardoor deze categorie alsnog gebruikt kon worden voor analyse.

2.2.9 Jaartallen

Over de geboortedata valt te zeggen dat deze erg incompleet zijn. Er zijn slechts 425 geboortedata gevonden. Dit komt omdat er geen zogenaamde geboortedata van bands/duo’s bestaan. Een /duo wordt niet geboren, maar een band wordt gevormd. Het meest voor de hand liggende zou zijn, om ook de data te verzamelen van wanneer de bands gevormd zijn. Helaas zijn beiden iets heel anders. Wanneer bijvoorbeeld blijkt dat er in de jaren ’50 veel artiesten geboren blijken te zijn, is het niet mogelijk om dit jaartal te relateren aan het tijdstip waarop de desbetreffende muzikant zijn beste muziek maakte. Het is namelijk onbekend op welke leeftijd deze artiesten muziek begonnen te maken. Een geboortedatum staat dus slechts vaag in relatie het tijdstip waarop iemand daadwerkelijk muziek produceerde.

Het beste is om de data over de vorming van bands alsnog te verzamelen, maar deze zorgvuldig gescheiden te houden van de data over de geboortedatums van artiesten. Je kan dan misschien iets zeggen over de tijd wanneer veel invloedrijke muzikanten

19

zijn geboren én iets zeggen rond welke tijd de meest invloedrijke bands ontstonden. Ondanks dit, blijven er veel haken en ogen aanzitten. Want informatie over een band die in de jaren ’60 is opgericht, maar pas in de jaren ’80 de meeste invloed uitoefende, zal dan verkeerd worden geïnterpreteerd in dit onderzoek. Een tweede moeilijkheid was, wanneer door middel van een script de jaartallen van de webpagina werden gehaald, dit script ook geboorteplaatsen en voluit geschreven maanden meenam. Omdat deze van de ene artiest wel en van andere artiesten juist weer niet bekend was, werd het databestand met jaartallen rommelig en onbruikbaar.

Na het schrijven van een nieuw script was het mogelijk om alleen de jaartallen eruit te filteren. Wat ervoor zorgde dat er een bestand was met jaartallen van wanneer artiesten geboren waren en een bestand met jaartallen waarin bands gevormd zijn. Echter, deze data vertoonden nog enkele foutjes wat betreft inhoud. Sommige jaartallen stonden twee keer per kolom vermeld, wat een juiste analyse in de weg stond. Aangezien dit echter maar tientallen jaartallen bleken, zijn deze er handmatig uitgehaald, waardoor de data voldoende bruikbaar waren voor analyse.

Een laatste noodzakelijke opmerking is dat wanneer er in dit onderzoek geschreven wordt dat er geen fouten zitten in een bepaald databestand, dit wil zeggen dat de data juist zijn overgenomen van de website allmusic.com. Dit wil niet zeggen dat de informatie die op Allmusic staat ook foutloos is.

Samenvattend: In de ‘Methoden’ is beschreven hoe dit onderzoek is opgezet. We willen onderzoek of het netwerk onder muziekartiesten de structuur van een power law volgt. Dit wordt onderzocht aan de hand van drie variabelen.

1. Door wie bepaalde artiesten zijn beïnvloed (influenced by)

2. Door welke artiesten een bepaalde artiest heeft beïnvloed (followers)

3. Van welke artiest iemand covers gemaakt heeft (performed songs by)

Bij de eerste twee variabelen worden de knopen in het netwerk gevormd door de artiesten, terwijl de invloed op elkaar wordt gevormd door de relaties tussen deze knopen. Bij de derde variabele zullen ook de knopen worden gevormd door artiesten, terwijl de relatie staat voor het maken van een cover. Wanneer er een power law verdeling gevonden wordt, zal er volgens worden gekeken naar kenmerken van muziek. Dit gebeurd door middel van de variabelen genre, style, moods en instruments.

De informatie is gevonden op de website van Allmusic, in feite een muziekgids. Van deze websites zijn pagina’s worden geknipt en geplakt, op basis van artiestennamen die voorkomen op de website acclaimedmusic.com. Om precies te zijn de namen uit de acclaimed top 1000 artists of all time. Wanneer alle informatie opgeslagen is, wordt er een script geschreven dat de juiste informatie uit de databases filtert. Een analyse van kwaliteit van deze data is beschreven onder ‘kwaliteit van de data’. Hieruit blijkt dat er zorgvuldig met de data is omgesprongen en dat eventuele fouten dan wel computergestuurd, dan wel handmatig eruit zijn gehaald.

20

3. Resultaten

3.1 Sociaal Netwerk onder muziekartiesten

Deze paragraaf bevat de uitwerkingen van tabellen en resulterende grafieken. Iedere variabele heeft twee grafieken. Enerzijds een grafiek van de rangschikking op normale schaal en anderzijds een grafiek van de rangschikking op log‐log schaal. Eerst een beschrijving van data die betrekking hebben op het netwerk van muziekartiesten. De variabelen influenced by, followers en performed songs by. Direct daaropvolgend worden de data over muziekkenmerken beschreven. Ook deze beschrijving zal gevolgd worden door figuren met daarin grafieken over genre, style, moods en instruments.

De data gebruikt voor de resultaten zijn verzameld van de website van Allmusic, www.allmusic.com. Op de website staat per artiest X weergegeven door wie hij is beïnvloed, wie zijn volgers zijn en van wie hij nummers heeft gecoverd. Van deze drie categorieën zijn de gegevens verzameld van precies 1,000 artiesten. Wat het heeft opgeleverd zijn 12,637 namen in de categorie ‘Influenced by’, kortom de artiesten door wie artiest X is beïnvloed. Binnen deze 12,637 namen bleken uiteindelijk 2,726 verschillende namen te staan. In de categorie ‘followers’, anders gezegd de artiesten die beïnvloed zijn door artiest X, zijn 13,839 namen gevonden. Daarvan bleken er 8,649 verschillend te zijn. ‘Covers’, de categorie namen van wie artiest X nummers gespeeld heeft, leverde een totaal van 13,646 verschillende namen op, waaronder 7,625 verschillende namen. Een overzichtelijke weergave, vergezeld van resulterende cijfers staat in tabel 3.

Zoals wordt weergegeven in grafiek 1 t/m 6 en tabel 3 toont de analyse aan, dat het netwerk van artiesten, wat betreft alle variabelen Influenced by, Followers en Performed Songs By past binnen een power‐law verdeling. Dit is bepaald door middel van de Asymptotic Standard Error [ASE], welke de juistheid van de fit beoordeelt. Een lage ASE betekent dat de juistheid van fit sterk is, een hoge ASE betekent dat de juistheid van fit zwak is. De functie van een ASE bestaat uit verschillende datapunten, de afstand van deze punten tot de raaklijn en de algemene vorm van de raaklijn. Op zichzelf zeggen de waarden van de ASE niet zoveel, maar in het algemeen worden deze gebruikt om het 95%‐betrouwbaarheidsinterval mee te interpreteren. De Richtings‐Coëfficiënt [RC] geeft aan in hoeverre de raaklijn aansluit bij een Zipf‐verdeling. Hoe dichter de RC waarde bij ‐1 komt, hoe meer de raaklijn een Zipf‐verdeling weergeeft.

Alle drie de variabelen wijken niet meer dan 0.5% af van de raaklijn door de verdeling. Deze gegevens zijn verkregen door middel van een gnuplot script om de mate van fit te bereken aan een Zipf‐verdeling, geschreven door Dr. J.J. Paijmans.

21

Tabel 3 Cijfermatige Informatie over de Variabelen influenced by, Followers en Performed Songs By

Variabele Totaal aantal Aantal Asymptotic Richtings – items verschillende Standard coëfficient items Error (ASE) (RC)

Influenced by 12,637 2,723 .3% ‐.6 Followers 13,839 8,649 .4% ‐.3 Performed 13,646 7,626 .01% ‐.6 songs by

Grafiek 1+2 Frequentieverdeling van de Variabele Influenced By (beïnvloedt door). In grafiek 1 op Normale Schaalverdeling, in grafiek 2 op Log­Log Schaal

300 250 200 150 100 50 0 1 249 497 745 993 1241 1489 1737 1985 2233 2481

Grafiek 1 Grafiek 2

Grafiek 3+4 Frequentieverdeling van de Variabele Followers (heeft beïnvloed). In grafiek 3 op Normale Schaalverdeling, in grafiek 4 op Log­Log Schaal

10 8 6 4 2 0 1 722 1443 2164 2885 3606 4327 5048 5769 6490 7211 7932

Grafiek 3 Grafiek 4

22

Grafiek 5+6 Frequentieverdeling van de Variabele Covers (heeft gecoverd). In grafiek 5 op Normale Schaalverdeling, in grafiek 6 op Log­Log Schaal

200

150

100

50

0 1 695 1389 2083 2777 3471 4165 4859 5553 6247 6941

Grafiek 5 Grafiek 6

3.2 Muzikale kenmerken van de topartiesten

De volgende data zijn wederom verzameld van de website van Allmusic, www.allmusic.com. Op de website staat per artiest X weergegeven binnen welk muziekgenre zijn muziek valt (genre), welke muziekstijlen overeenkomen met de muziek van artiest X (style), welke stemming er past de muziek van artiest X (moods) en welke door welke vormen van instrumentatie de muziek van artiest X gekenmerkt wordt (instruments).

Voor deze vier variabelen zijn de gegevens verzameld van precies 485 artiesten. Dit zijn de hoogst genoteerde artiesten uit de frequentieverdeling van de variabele influenced by. Om precies te zijn bevat deze database de artiesten waarvan de frequentie in de influenced by rangschikking, groter of gelijk aan 16 is. Wat het heeft opgeleverd zijn 485 items in de variabele genre. Binnen deze 485 genres bleken uiteindelijk 23 verschillende genres te bestaan. Wat betreft de variabele style, zijn er 2792 muziekstijlen gevonden. Daarvan bleken er 390 verschillend te zijn. Moods, de variabele met daarin de verschillende stemmingen die de muziek kan weerspiegelen, leverde een totaal van 8,718 soorten stemmingen op, waaronder 183 verschillende stemmingen. De laatste variabele, instruments, bevatte 770 genoemde vormen van instrumentatie. Daaronder vielen 61 verschillende vormen van instrumentatie.

Zoals weergegeven in grafiek 7 t/m 14 toont de analyse aan, dat de verdelingen van alle variabelen betreffend muzikale significant niet voldoen aan een power law verdeling. Ook voor deze variabelen is de Asymptotic Standard Error [ASE] en de Richtings‐Coëfficiënt [RC] bepaald, welke staan weergegeven in tabel 4.

Alle vier de variabelen wijken meer dan 0.5% af van de raaklijn door de verdeling. Deze gegevens zijn verkregen door middel van een gnuplot script om de mate van fit te bereken aan een Zipf‐verdeling, geschreven door Dr. J.J. Paijmans.

23

Tabel 4 Cijfermatige Informatie over de Variabelen Genre, Style, Moods en Instruments

Variabele Totaal aantal Aantal Asymptotic Richtings‐ items verschillende Standard Coëfficient items Error (RC)

Genre 485 23 2.8% ‐1.5 Style 2,792 390 1.4% ‐.6 Moods 8,718 183 3.6% ‐.4 Instruments 770 61 1.7% ‐1.1

Grafiek 7+8 Frequentieverdeling van de Variabele Genre (genre). In grafiek 7 op Normale Schaalverdeling, in grafiek 8 op Log­Log Schaal

250

200

150

100

50

0 1 3 5 7 9 11 13 15 17 19 21

Grafiek 7 Grafiek 8

Grafiek 9+10 Frequentieverdeling van de Variabele Style (muziekstijl). In grafiek 9 op Normale Schaalverdeling, in grafiek 10 op Log­Log Schaal

100

80

60

40

20

0 1 34 67 100 133 166 199 232 265 298 331 364

Grafiek 9 Grafiek 10

24

Grafiek 11+12 Frequentieverdeling van de Variabele Moods (muziekstemming). In grafiek 11 op Normale Schaalverdeling, in grafiek 12 op Log­Log Schaal

200

150

100

50

0 1 18 35 52 69 86 103 120 137 154 171

Grafiek 11 Grafiek 12

Grafiek 13+14 Frequentieverdeling van de Variabele Instruments (instrumentatie). In grafiek 13 op Normale Schaalverdeling, in grafiek 14 op Log­Log Schaal

250

200

150

100

50

0 1 6 11 16 21 26 31 36 41 46 51 56

Grafiek 13 Grafiek 14

25

4. Discussie

Variabelen

De resultaten ondersteunen de verwachting dat de verdeling van artiesten die van invloed zijn geweest op andere muzikanten niet random is, maar dat een relatief kleine groep artiesten relatief veel invloed heeft op andere muzikanten en dat een relatief grote groep muzikanten relatief weinig invloed heeft op de rest. Maar is dit niet gewoon het heel erg logische het ‘rijkere worden alleen maar rijker’ effect? Het lijkt voor zichzelf te spreken dat muzikanten die succes hebben ook veel van invloed zijn. Zolang artiesten vrij zijn te kiezen waar ze inspiratie vandaan halen en dus zelf kunnen kiezen welke invloed van welke artiest ze kiezen, is het voor de hand liggend dat succesvolle artiesten, die al veel van invloed waren, alleen nog maar meer aanhangers zullen krijgen. Echter dit is ook juist één van de kenmerken van netwerken die een power law verdeling laten zien. Sterke knopen in een netwerk worden geprefereerd om aan te hechten wanneer iemand toetreedt in een netwerk. Dat ditzelfde patroon nu gevonden is onder het netwerk van muzikanten versterkt de waarheid van deze stelling alleen maar.

Het gedeelte onderzoek naar muzikale kenmerken sluit in mindere mate aan bij deze stelling. De vier variabelen aangaande de muzikale kenmerken sluiten significant onvoldoende aan bij een power law verdeling, al kwamen enkele variabelen dicht in de buurt. Daarvoor zijn twee belangrijke redenen de mogelijke oorzaak zijn. Allereerst zijn de gegevens over kwantiteit ondermaats. Dit brengt de externe validiteit in het gering, wat staat voor in hoeverre de conclusies generaliseerbaar zijn. De tweede reden is dat de resultaten wat betreft muzikale kenmerken indirect verkregen. Allereerst is er een rangschikking gemaakt van artiesten die veel van invloed zijn geweest en vervolgens is er naar de muzikale kenmerken uit de top van deze rangschikking gekeken. Beter zou zijn geweest wanneer er direct gevraagd zou zijn naar muzikale kenmerken die mogelijk van invloed zijn.

Een eventueel derde argument dat er geen power law in de frequentieverdelingen van muzikale kenmerken gevonden hoeft te worden, is dat de muziekindustrie steeds breder wordt. Ieder heeft zijn eigen smaak en door globalisering komt men ook sneller in contact met nieuwe stijlen. Dit zal de meer onbekende stijlen ten goede komen, aangezien zij gemakkelijker onder de aandacht komen. Dit is mogelijk de reden waarom er voor de variabelen muziekstijlen en stemmingen meer variatie gevonden is. Voor deze variabelen zijn er geen dominante stijlen of stemmingen, maar relatief veel invloeden van relatief veel soorten. Om hier valide uitspraken over te doen, is er meer en gedetailleerder onderzoek nodig.

Variabele ‘followers’

Waarom zou de variabele followers, de categorie met artiesten die een bepaalde artiest volgen, in twijfel moeten worden getrokken als indicator voor de structuur van een sociaal netwerk, terwijl deze er intuïtief er terdege in thuishoort? Een concrete blik op de data en waar deze voor staan zal proberen duidelijk te maken wat er nu daadwerkelijk gemeten wordt. Voor de variabele influenced by is het

26

duidelijk, er zijn lijstjes verzameld van artiesten die hebben aangegeven door welke andere artiesten hun zijn beïnvloed. Deze lijstjes zijn naast elkaar gelegd en dan wordt er gekeken of er namen meerdere malen voorkomen. Zodoende is er een rankschikking gemaakt van namen die van invloed zijn geweest op andere muzikanten. Wat verwacht werd in de structuur van de rankschikking is, dat er een kleine groep artiesten zal zijn waarnaar relatief veel verwezen werd en een grote groep met namen waarnaar minder vaak verwezen werd. Wanneer deze structuur bevestigd zou worden, is dit een argument voor het bestaan van een power‐law verdeling in het netwerk van muziek artiesten.

De variabele followers werd op exact dezelfde manier samengesteld. Er zijn lijsten verzameld van artiesten waarvan bekend is dat ze ‘follower’ zijn van een bepaalde artiest. Vervolgens is er ook hier gekeken welke namen meerdere malen voorkomen binnen de variabele followers en ook daarvan is een rangschikking gemaakt. Deze variabelen zijn echter niet op dezelfde manier tot stand gekomen. Het verschil zit hem in het feit dat er wordt geredeneerd vanuit één artiest (bijvoorbeeld Bob Dylan). Wanneer Bob Dylan in de categorie Influenced by aangeeft door wie hij beïnvloed is, dan heeft hij alle vrijheid om te kiezen door wie hij is beïnvloed. Op de pagina van Bob Dylan staat een ook een categorie Followers, maar deze zegt iets heel anders. De namen die in deze categorie verschijnen zijn allemaal artiesten die al gekozen hebben voor Bob Dylan als persoon die op hen van invloed is geweest. In de variabele followers is er niet de mogelijkheid om te kiezen uit een grote groep, want er is al gekozen voor een bepaalde artiest. Dit is ook de reden dat voor de variabele followers wel een relatief grote hoeveelheid data gevonden werd maar met relatief lage frequenties. Het klopt dat variabele influenced by en followers in feite wederkerig zijn. Maar doordat er bij de variabele influenced by wordt geredeneerd vanuit degene die de keuze heeft terwijl er bij followers wordt geredeneerd vanuit diegene waarop de keuze is gevallen levert dit geen juiste informatie op om de structuur van een netwerk vast te mogen stellen en is de variabele followers buiten beschouwing gelaten.

Verder zou je zeggen dat de variabelen followers en influenced by wederkerig horen te zijn wanneer er in beide gevallen vanuit de juiste persoon geredeneerd wordt. Dit wil zeggen dat wanneer Bob Dylan in zijn lijst van mensen door wie hij beïnvloed, de naam Elvis Presley heeft staan, Bob Dylan vervolgens ook in het lijstje van followers van Elvis Presley genoemd zou moeten worden. Dit blijkt echter niet het geval te zijn. Waar dit door komt blijft een vraagteken. Mogelijk is dit te wijten aan het feit dat deze lijsten door mensen zijn toegekend, die daar inconsistente criteria op hebben nagehouden. Aan een verzoek aan Allmusic, om duidelijk te verschaffen rondom criteria van followers en influenced by, is geen gehoor gegeven.

Toekomstig onderzoek

Het feit dat er nu een power law verdeling gevonden is in het netwerk van muzikanten leidt automatisch ook tot interessante onderzoeksvragen. Wat is het mechanisme/kracht die ervoor zorgt dat de invloed van invloedrijke artiesten alleen maar groter wordt? Of zitten er juist ook limieten aan de groei van zulke invloed? Wat de kracht is van die de invloed creëert is een interessant nieuw

27

onderzoeksgebied. Wat is het nu, wat een muzikant invloedrijk maakt? Een aantal zaken als instrumentatie, genre, muziekstijl en muzikale stemming zijn al een klein beetje aan bod gekomen tijdens dit onderzoek. Zo komt er naar voren dat er onder de artiesten die relatief veel van invloed zijn geweest naar voren dat deze relatief veel vallen binnen het genre Pop/Rock en dat Stem de meest heersende vorm van instrumentatie is, aangezien deze bovenaan staan in de power law verdeling. Maar in dit onderzoek komt nog niet naar voren dat dit ook daadwerkelijk de eigenschappen zijn die maken dat deze groep van artiesten relatief veel van invloed is. Daarvoor is nieuw en meer en vooral ook gedetailleerder onderzoek nodig. Daar bovenop zijn er nog genoeg variabelen over die deze invloed ook kunnen bepalen zoals bijvoorbeeld aantrekkelijkheid van een muzikant, of het aantal singles/albums die een muzikant heeft verkocht.

Limieten

Een zwakte van dit onderzoek is dat het geen longitudinaal onderzoek is. De verkregen rangschikking is een momentopname, terwijl het goed mogelijk is dat ook tijd een factor is, die van invloed kan zijn. Zo is het goed denkbaar dat wanneer dit onderzoek over honderd jaar opnieuw gedaan wordt de invloed van iemand als Michael Jackson relatief groter is, aangezien een groot aantal van de onderzochte eenheden in dit onderzoek muziek maakte voor Michael Jackson zijn debuut maakte in de muziekindustrie. Daarom ook, treft u in grafiek vijftien en zestien twee grafieken aan ten aanzien van de geboorte data van soloartiesten en ten aanzien van de jaartallen die staan voor het ontstaan van bands/groepen. Omdat geboortedata en data over bands niets zeggen over wanneer een artiest over een band/groep zijn successen beleefde, worden er aan deze data verder geen conclusies verbonden. In de desbetreffende grafieken (grafiek 15 en 16) zitten wel enkele pieken.

Grafiek 15 Jaartallen van de Geboorte van Soloartiesten onderzocht in dit onderzoek

20 15 10 5 0 1901 1904 1908 1911 1915 1918 1921 1924 1927 1930 1933 1936 1939 1942 1945 1948 1951 1954 1957 1960 1963 1966 1969 1972 1975 1978 1981 1985

28

Grafiek 16 Jaartallen van de Vorming van Bands/Groepen onderzocht in dit onderzoek

30 25 20 15 10 5 0 1924 1926 1940 1946 1951 1953 1955 1957 1959 1961 1963 1965 1967 1969 1971 1973 1975 1977 1979 1981 1983 1985 1987 1989 1991 1993 1995 1997 1999 2001 2003 2005

Ondanks dat hieraan geen conclusies worden verbonden, zijn deze toch in het onderzoek omgenomen om aan te geven dat wanneer dit onderzoek op een andere moment gehouden zou worden, deze pieken hoogstwaarschijnlijk zullen verplaatsen. Ze geven aan dat dit onderzoek tijdsgebonden is en dat wanneer dit onderzoek in de toekomst herhaald zal worden, naar verwachting de resultaten wat betreft structuur hetzelfde zullen blijven maar qua inhoud zullen veranderen.

Verder heeft deze poging een power law structuur te vinden in een netwerk van muziekartiesten zich slechts gefocust op data verkregen van één website, wat met zich meebrengt dat de claim van generalisatie slechts speculatief genoemd mag worden. Om dit te versterken is er meer werk nodig gericht op gegevens verkregen uit meer gevarieerde bronnen en ook groter in hoeveelheid. Daarbovenop kan over de data nog gezegd worden, dat selectie van artiesten niet random is geweest. Ondanks dat hier bewust voor is gekozen, verlaagt dit de validiteit om te mogen vaststellen dat er daadwerkelijk een power law structuur gevonden is in het netwerk van muziekartiesten. Om de validiteit te vergroten zal er een betrouwbare methode gevonden moeten worden om een random groep van artiesten samen te stellen, waarover bovendien voldoende gegevens verzameld kunnen worden.

29

5. Conclusies

Netwerkstructuur muzikanten

We hebben drie netwerken onder muzikanten bestudeerd, daaronder vallen een netwerk van door wie artiesten beïnvloed zijn en een netwerk van wie artiesten nummers gecoverd hebben. Voor deze netwerken is gevonden dat er relatief weinig artiesten zijn met heel veel invloed, anders geformuleerd; een relatief kleine groep artiesten heeft veel andere artiesten beïnvloed. Daartegenover staat dat er relatief veel artiesten zijn die slechts minimaal van invloed zijn op medemuzikanten. Ditzelfde patroon werd herkend in de structuur van gecoverde nummers. Ook binnen dit netwerk werd er gevonden dat er relatief weinig artiesten zijn waarvan veel nummers gecoverd zijn en dat er relatief veel artiesten zijn waarvan er maar weinig nummers gecoverd zijn. Bij deze kan de eerste deelvraag bevestigend worden beantwoord. Het sociaal netwerk van de variabelen influenced by en performed songs by sluit aan bij de structuur van een power law verdeling. De variabele followers, die op zich ook de power law verdeling laat zien, is bij het beantwoorden van deze deelvraag buiten beschouwing gelaten.

Nadat was aangetoond dat er daadwerkelijk een power law verdeling bestond onder het netwerk van muzikanten, is er in dit onderzoek aandacht besteed aan de muzikale kenmerken die er verbonden zijn aan muzikanten. Van de meest succesvolle artiesten op basis van de variabele influenced by een selectie gemaakt waarvan er gekeken is naar de muzikale kenmerken, genre, muziekstijl, instrumentatie en stemming van de muziek. Gevonden is er dat al deze vier variabelen niet voldoen aan de eis om binnen 0.5% afwijking van de raaklijn te passen. Echter, ze vallen wel nog binnen een afwijking van 5% waardoor ze wel sterk neigen naar de structuur van power law verdelingen.

Frequentieverdelingen van muzikale kenmerken

Genre: In de variabele genre valt op dat er twee genres duidelijk naar voren komen. De genres Pop/Rock en R&B werden relatief vaak gevonden onder muzikanten die veel van invloed zijn geweest. Op afstand volgen de genres Jazz, Blues en Rap, waarna er vervolgens een groot gat ontstaat naar de rest van de muziekstijlen die relatief weinig werden gevonden. Op de vraag welke muziekgenres het meest van invloed zijn geweest, mag geantwoord worden: Pop/Rock en R&B.

Style: Ook bij de variabele muziekstijlen is er een rankschikking gemaakt van muziekstijlen die gerelateerd zijn aan de muzikanten die het meest van invloed zijn. De twee meest toonaangevende muziekstijlen zijn, alternative/ en contemporary Pop/Rock. De helling van de variabele style (RC = ‐0.3) is echter erg minimaal, waardoor er niet met zekerheid gezegd mag worden dat deze in grotere mate van invloed zijn dan andere muziekstijlen. Hoe meer de richtings‐coëfficient in de buurt van waarde ‐1 komt, hoe beter de verdeling aansluit bij een power law verdeling.

30

Moods: De variabele moods sluit het minst aan bij een power law verdeling. Hij wijkt het meest van alle variabelen af van de raaklijn (3.6%) en de richtings‐coëfficient is erg laag (RC = ‐0.4). De grafiek van muziekstemmingen geeft aan dat er natuurlijk één stemming op nummer één staat, maar dat de frequentie maar geleidelijk daalt naar de andere muziekstemmingen. De drie meest voorkomende muzikale stemmingen zijn achtereenvolgens Confident, Passionate en Rousing. Op de vraag echter, welke muzikale stemmingen van invloed zijn geweest is geen eenduidig antwoord.

Instruments: In de frequentieverdeling van instrumentatie komt wel in de buurt van een power law structuur. Uit de resultaten blijkt dat er een relatief kleine groep vormen van instrumentatie een grote mate invloed uitoefenen en een relatief grote groepen vormen van instrumentatie slechts een geringe invloed hebben gehad. Vocals, steekt met kop en schouders boven alle verschillende vormen uit, gevolgd door Guitar en Piano. Dus antwoord op de vraag welke vormen van instrumentatie het meest van invloed zijn, dient beantwoord te worden met de stem, waarna op gepaste afstand ook de gitaar en de piano nog relatief veel van invloed zijn. De rangschikkingen wat betreft muzikale kenmerken zijn inhoudelijk volledig terug te vinden in de bijlagen.

Samenvattend: Op de vraag in hoeverre het sociaal netwerk van muzikanten aansluit op de power law verdeling mag instemmend geantwoord worden. Onze twee variabelen ‘beïnvloedt door’ (Influenced By) en ‘gecoverd van’ (Performed Songs By) bevestigen deze structuur.

Wat muzikale kenmerken betreft vertonen zij allen geen power law verdeling, al zijn er wel enkele variabelen die dicht in de buurt komen. Het antwoord op de hoofdvraag is dat de belangrijkste eigenschap van het sociaal netwerk van muzikanten is dat het voldoet aan een power law verdeling en dat er onder de muzikanten met relatief veel invloed binnen de variabelen muziekgenre en instrumentatie enkele vormen relatief dominant aanwezig zijn.

31

Literatuur

Amaral, L.A., Scala, A., & Barthe, M. (2000) Classes of small‐world networks. PNAS, 97(21), 11149‐11152

Auerbach, F. (1913) Petermanns Geographische Mitteilungen. Das geset der bevolkerungskonzentration, 59, 74

Barabási, A.L., Jeong, H., Néda, Z., Ravasz, E., Schubert, A., & Vicsek, T. (2002) Evolution of the social network of scientic collaborations. Physica A, 311, 590‐614

Barabási, A.L., & Albert, R. (1999) Emergence of Scaling in Random Networks. Science, 286, 509‐512

Barabási, A., & Bonabeau, E. (2003) Schaal‐vrije Networks. Scientific American, 50‐59

Bearman, P.S., Moody, J., & Stovel, K. (2004) Chains of affection: the structure of adolescent romantic and sexual networks. American Journal of Sociology, 110, 44‐91

Bird, C., Gourley, A., Devanbu, P., & Gertz, M. (2006) Mining Email Social Networks Categories and Subject Descriptors. New Yorker, The, 137‐143

Cheng, X., Dale, C., & Liu J. (2008) Statistics and Social Network of YouTube Videos. Distribution, 229‐238

Crovella, M.E., & Bestavros, A. (1996) in Proceedings of the 1996 ACM SIGMETRICS Conference on Measurement and Modeling of Computer Systems, edited by Gaither, B.E. and Reed, D.A. Association of Computing Machinery, 148‐159. de Solla Price, D.J. (1965) Networks of Scientific Papers. Science, 149(3683), 510‐ 515

Franzon, H. (2008) Welcome to Acclaimed Music The 3000 most recommended albums and songs of all time. Te lezen op www.acclaimedmusic.net, bezocht op 24‐ 04‐2010

IFPI. (2010) IFPI publishes Recording Industry in Numbers 2010. Te lezen op www.ifpi.org, bezocht op 04‐07‐2010

Latora, V., & Marchiori, M. (2002) Is the Boston subway a small‐world network? Physica A, 314, 109‐113

Madey, G., Freeh, V., & Tynan, R. (2002) The Open Source Software Development Phenomenon: An Analysis Based On Social Network Theory. Information Systems, 1806‐1813

Mansury, Y., & Gulyás, L. (2007) The emergence of Zipf ’ s Law in a system of cities: An agent‐based simulation approach. Journal of Economic Dynamics & Control, 31, 2438‐2460

Milgram, S. (1967) The Small‐world Problem. Psychology Today, 1(1), 61‐67

32

Neukum, G., & Ivanov, B.A. (1994) In Hazards Due to Comets and Asteroids, edited by T. Gehrels University of Arizona Press, 359‐416.

Newman, M.E.J. (2001) Scientific collaboration networks. 1. Network construction and fundamental results. Physical Review E, 64, 161311‐1613118

Newman, M.E.J. (2005) Power laws, Pareto distributions and Zipf’s law. Contemporary Physics, 46, 323 ‐ 351.

Pareto, V. (1896) Cours d’Economie Politique. Lausanne: F. Rouge

Rovi Corporation. (2010) About Us. Te lezen op www.allmusic.com, bezocht op 25‐ 05‐2010

Rovi Corporation. (2010) About Us: allmusic.com Coverage Statistics as of ‐ 5/25/2010. Te lezen op www.allmusic.com, bezocht op 25‐05‐2010

Seuront, L., & Mitchell, J.G. (2008) Towards a seascape typology . I . Zipf versus Pareto laws. Journal of Marine Systems, 69, 310 – 327

Stephen, A.T., & Toubia, O. (2009) Explaining the power‐law degree distribution in a social commerce network. Social Networks, 31, 262‐270

Song, W.G., Zhang, H.P., Chen, T., & Fan, W.C. (2003) Power‐law distribution of city fires. Fire Safety Journal, 38, 453‐465

Watts, D.J. (1999) Small Worlds: the dynamics of networks between order and randomness. Princeton: Princeton University Press

Wikipedia. (2010) Power law. Te lezen op en.wikipedia.org/wiki/Power_law, bezocht op 03/06/2010

Zipf, G.K. (1949) Human Behaviour and the Principle of Least Effort. Cambridge Mass, England: Addison‐Wesley

33

Bijlage 1 Een voorbeeld van de artiestinformatie op de website allmusic.com

34

35

Bijlage 2 Rangschikkingen van de variabelen genre, style, moods en instruments

Deze bijlage bevat de inhoudelijke gegevens van de vier variabelen genre, style, moods en instruments. Na een dikgedrukte weergave van de desbetreffende variabele, staan eronder de items die binnen de betreffende variabele vallen met daarachter een getal dat staat voor hoe vaak een bepaald item voorkomt binnen die variabele.

Genre Pop/Rock 219 Stage & Screen 4 R&B 68 Chamber Music 3 Jazz 38 International 3 Blues 33 Keyboard 3 Rap 30 Movie Entry 3 Country 21 Entry 3 Folk 17 Religious 3 Vocal 13 Classical 1 Electronic 8 Comedy/Spoken 1 Reggae 7 Latin 1 Avant‐Garde Music 5 Vocal Music 1

Style Alternative/ Indie Rock 91 3 Contemporary Pop/ Rock 85 Electro 3 Pop/Rock 65 Electronica 3 Album Rock 62 French Pop 3 Alternative Pop/ Rock 54 G‐ 3 AM Pop 54 Harmonica Blues 3 Early R&B 53 Harmony Vocal Group 3 Psychedelic 53 Jazz Blues 3 48 Jazz‐Rap 3 Punk/New Wave 46 Jive 3 Rock & Roll 46 Minimalism 3 Regional Blues 45 Modern 3 R&B 36 Modern Composition 3 Soul 36 New Orleans Jazz 3 Folk‐Rock 35 Obscuro 3 College Rock 29 Old‐Timey 3 Jazz 28 Pop‐Metal 3 Post‐Punk 28 Popular Music Entry 3 Dance‐Rock 27 Rocksteady 3 Blues 26 3 Early Pop/Rock 26 Songster 3 Singer/ Songwriter 26 Torch Songs 3

36

Art Rock 25 Traditional Gospel 3 Electronic 24 West Coast Rap 3 Jazz Instrument 24 Acid House 2 Proto‐Punk 24 Adult Contemporary R&B 2 24 2 Club/Dance 23 Bakersfield Sound 2 Urban 23 Bluegrass 2 Traditional Country 22 Bluegrass‐Gospel 2 Classical 21 Blues Gospel 2 New Wave 21 2 Adult Contemporary 20 Boogie‐Woogie 2 20 Contemporary Gospel 2 East Coast Rap 19 Contemporary Reggae 2 Funk 18 East Coast Blues 2 Heavy Metal 18 Electric Delta Blues 2 Golden Age 17 Electric Memphis Blues 2 17 Electric 2 Avant‐Garde 15 Experimental Big Band 2 Blues‐Rock 15 Finger‐Picked Guitar 2 Pop‐Soul 15 2 Punk 15 IDM 2 Smooth Soul 15 Pop 2 15 Jazz‐Funk 2 American Underground 14 L.A. Punk 2 Bop 14 2 14 Merseybeat 2 British Psychedelia 14 Mixed Media 2 14 New Jack Swing 2 Hardcore Rap 14 Noise‐Rock 2 Indie Rock 14 North American Traditions 2 Prog‐Rock 14 Northern Soul 2 Acoustic Blues 13 Original Score 2 Early Jazz 13 Piedmont Blues 2 Folk 13 Poetry 2 Gospel 13 Post‐Disco 2 13 Post‐Rock 2 Big Band 12 Progressive Country 2 Doo Wop 12 2 12 Rap 2 Piano Jazz 12 Reggae 2 Alternative Dance 11 Reggae‐Pop 2 American Punk 11 2 11 Sophisti‐Pop 2 Blues Revival 11 Sound System 2 Country Blues 11 Southern Gospel 2 Country‐Rock 11 2

37

Honky Tonk 11 Speed Metal 2 11 2 11 Surf 2 Standards 11 Tape Music 2 10 Traditional Bluegrass 2 British Blues 10 Acid Folk 1 Electric Blues 10 Acid Techno 1 Piano Blues 10 Acoustic Memphis Blues 1 Religious 10 African Jazz 1 British Folk 9 African Traditions 1 Dance‐Pop 9 Afro‐Beat 1 Electric Chicago Blues 9 Afro‐Cuban Jazz 1 Experimental 9 Afro‐Pop 1 Fusion 9 Alt‐Country 1 9 Alternative Folk 1 International 9 Ambient Techno 1 Jazz‐Rock 9 Anarchist Punk 1 9 Appalachian 1 9 Beat Poetry 1 Soundtracks 9 Bossa Nova 1 Southern Soul 9 1 Stage & Screen 9 Brazilian Traditions 1 Vocal 9 Cajun 1 Chicago Blues 8 Calypso 1 Country 8 Canterbury Scene 1 Experimental Electronic 8 Caribbean Traditions 1 Folk Revival 8 Celtic 1 8 Celtic Rock 1 8 Children's 1 Post‐Bop 8 Children's Folk 1 Protest Songs 8 Comedy 1 Traditional Folk 8 Computer Music 1 Urban Blues 8 Contemporary Country 1 Pop 7 Contemporary Jazz 1 British Punk 7 1 Deep Soul 7 Country Boogie 1 Delta Blues 7 Cowpunk 1 Dream Pop 7 Cuban Traditions 1 Folk‐Blues 7 Dancehall 1 Girl Groups 7 Detroit Blues 1 New York Punk 7 1 7 Dirty South 1 Old‐School Rap 7 Drill'n'bass 1 Pop 7 Early British Pop/ Rock 1 Pre‐War Country Blues 7 Euro‐Pop 1 Progressive Jazz 7 Experimental Jungle 1

38

Psychedelic Pop 7 Experimental Techno 1 Roots Reggae 7 Folk‐Pop 1 Jazz 7 Frat Rock 1 Slide Guitar Blues 7 1 Synth Pop 7 1 World Fusion 7 French 1 Adult Alternative Pop/ Rock 6 French Rock 1 Alternative Rap 6 1 Alternative Singer/ Songwriter 6 Glitter 1 British Folk‐Rock 6 Guitar Jazz 1 British Metal 6 Guitar Virtuoso 1 Country‐Pop 6 Gypsy 1 6 Heartland Rock 1 House 6 Indian Classical 1 Nashville Sound/ Countrypolitan 6 Indian Subcontinent Traditions 1 Political Folk 6 Indie Electronic 1 Pre‐War Blues 6 Instrumental Country 1 Acoustic Chicago Blues 5 International Fusion 1 Avant‐Garde Jazz 5 Jam Bands 1 Black Gospel 5 Jazz‐Pop 1 Blaxploitation 5 Jug Band 1 Chicago Soul 5 Juke Joint Blues 1 Cool 5 Jungle/ Drum'n'bass 1 Keyboard/ Synthesizer/ New Dub 5 Age 1 Electric Harmonica Blues 5 Latin 1 Field Recordings 5 Latin Folk 1 Lo‐Fi 5 1 Modal Music 5 Louisiana Blues 1 Modern Electric Blues 5 Lovers Rock 1 New Orleans R&B 5 Memphis Blues 1 Political Rap 5 Mento 1 Pop‐Rap 5 Mod 1 Progressive Folk 5 Mod Revival 1 Uptown Soul 5 Modern Creative 1 Vocal Pop 5 Modern Electric Chicago Blues 1 4 Modern Electric Texas Blues 1 Blue‐Eyed Soul 4 MPB 1 4 Musicals 1 Cabaret 4 New Acoustic 1 Classic Female Blues 4 New Age 1 Close Harmony 4 1 New Wave of British Heavy Comedy/Spoken 4 Metal 1 Contemporary Folk 4 New York Blues 1

39

Contemporary Singer/ Songwriter 4 Nigerian 1 Country Gospel 4 No Wave 1 Detroit Rock 4 Noise 1 Film Music 4 Novelty 1 Folk Jazz 4 Opera 1 Folksongs 4 1 4 Political Reggae 1 Gangsta Rap 4 Post‐Hardcore 1 4 Raga 1 Goth Rock 4 Ragga 1 4 1 Industrial 4 Rap‐Rock 1 4 Rumba 1 Kraut Rock 4 1 Memphis Soul 4 Sea Shanties 1 Neo‐Psychedelia 4 Ska Revival 1 4 Skiffle 1 4 1 Pre‐War Gospel Blues 4 1 South/ Eastern European Show Tunes 4 Traditions 1 Soul‐Blues 4 Southern Rap 1 Spoken Word 4 Spirituals 1 Stride 4 Surf Revival 1 Techno 4 Swamp Blues 1 Texas Blues 4 1 Pop 4 Swedish Pop/ Rock 1 Trumpet Jazz 4 Teen Idols 1 West Coast Blues 4 Trance 1 Acoustic Texas Blues 3 Trip‐Hop 1 Alternative Metal 3 Twee Pop 1 Ambient 3 Vaudeville Blues 1 British Trad Rock 3 West African 1 Cast Recordings 3 Western European Traditions 1 3 1 Contemporary R&B 3 Western 1 Country Soul 3 Work Songs 1 Cowboy 3 1 Yodeling 1

Moods Confident 178 Classical Music Entry 32 Passionate 175 Sexy 32 Rousing 174 Bright 31 Playful 168 Manic 31

40

Earnest 164 Somber 30 Exuberant 151 Hostile 28 Freewheeling 146 Urgent 28 Amiable/ Good‐Natured 145 Bitter 27 Energetic 144 Gloomy 26 Earthy 142 Ironic 26 Movie Entry 129 Sad 25 Intimate 124 Snide 25 Poignant 122 Ethereal 24 Reflective 121 Austere 23 Rollicking 121 Calm/Peaceful 23 Bittersweet 117 Clinical 23 Literate 117 Reserved 23 Sophisticated 117 Sexual 23 Stylish 115 Sprawling 23 Boisterous 110 Gutsy 22 Plaintive 110 Harsh 22 Brash 103 Spiritual 22 Melancholy 101 Dreamy 21 Organic 99 Exciting 21 Aggressive 95 Nihilistic 21 Wistful 95 Eccentric 20 Elegant 94 Enigmatic 20 Intense 94 Gleeful 20 Fun 90 Lush 20 Party/ Celebratory 89 Uncompromising 20 Cheerful 88 Greasy 19 Carefree 87 Relaxed 19 Theatrical 87 Rustic 19 Laid‐Back/ Mellow 85 Wintry 19 Fiery 84 Delicate 18 Sentimental 82 Epic 18 Refined/ Mannered 80 Distraught 17 Cathartic 79 Malevolent 17 Visceral 79 Reverent 17 Gentle 77 Thuggish 17 Joyous 77 Campy 16 Brooding 70 Outrageous 16 Cerebral 70 Fierce 15 Dramatic 70 Paranoid 15 Romantic 70 Elaborate 14 Autumnal 68 Springlike 14 Quirky 68 Silly 13 Soothing 68 Brittle 12 Rebellious 66 Cold 12 Volatile 64 Crunchy 12

41

Witty 64 Light 12 Confrontational 62 Messy 12 Raucous 62 Pastoral 12 Sensual 62 Ramshackle 12 Tense/Anxious 61 Sleazy 12 Rambunctious 59 Slick 12 Rowdy 59 Fractured 11 Eerie 58 Insular 11 Hypnotic 57 Meandering 11 Wry 57 Stately 11 Yearning 57 Sardonic 10 Detached 56 Spacey 10 Sweet 56 Sparse 10 Complex 54 Hedonistic 9 Gritty 54 Hungry 9 Provocative 54 Sparkling 9 Street‐Smart 54 Spicy 9 Swaggering 54 Spooky 9 Trippy 53 Circular 8 Nocturnal 52 Indulgent 8 Whimsical 52 Knotty 8 Bravado 50 Precious 8 Happy 48 Unsettling 8 Searching 48 Difficult 7 Summery 48 Lazy 7 Warm 48 Naive 7 Cynical/ Sarcastic 46 Self‐Conscious 7 Irreverent 43 Effervescent 6 Lively 43 Weary 6 Angst‐Ridden 42 Brassy 5 Innocent 41 Nostalgic 5 Atmospheric 39 Soft 5 Ominous 39 Trashy 5 Restrained 39 Giddy 4 Acerbic 38 Suffocating 4 Druggy 38 Sugary 3 Humorous 38 Uplifting 3 Menacing 36 Outraged 2 Bleak 35 Thoughtful 1 Reckless 35 Smooth 34 Angry 33 Ambitious 32

42

Instruments Vocals 206 Harpsichord 2 Guitar 112 Piano (Electric) 2 Piano 67 Sax (Soprano) 2 Leader 49 Ukulele 2 Producer 40 Cello 1 Songwriter 37 Electronics 1 Keyboards 36 Engineer 1 Composer 27 Fender Rhodes 1 Harmonica 19 Flugelhorn 1 Guitar (Electric) 18 Flute 1 Arranger 17 Group 1 Organ 11 Horn 1 Bass 10 Kazoo 1 Guitar (Acoustic) 9 Liner Notes 1 Synthesizer 9 Lyricist 1 Drums 8 Mastering 1 Saxophone 7 Melodica 1 Sax (Tenor) 6 Organ (Hammond) 1 Slide Guitar 6 Percussion 1 Trumpet 6 Poetry 1 Banjo 5 Rap 1 Sax (Alto) 5 Sitar 1 Fiddle 4 Strings 1 Mandolin 4 Synclavier 1 Accordion 3 Tambourine 1 Clarinet 3 Viola 1 Conductor 3 Vocal Harmony 1 Violin 3 Whistle (Human) 1 Cornet 2 DJ 2 Executive Producer 2 Harmonium 2

43