1 1

50 NAW 5/9 nr. 1 maart 2008 Het Nederlands elftal als complex netwerk Rob Kooij, Almerima Jamakovic en anderen

Rob Kooij Frank van Kesteren, Tim de Koning Almerima Jamakovic Ildiko Theisler, Pim Veldhoven Faculteit EWI TNO Informatie- en Communicatietechnologie Technische Universiteit Delft Brassersplein 2 Postbus 5031 Postbus 5050 2600 GA Delft 2600 GB Delft r.e.kooij,[email protected]

Onderzoek Het Nederlands elftal als complex netwerk

In de zomer van 2008, tijdens het Europees Kampioenschap voetbal in Zwitserland en Oos- hun geschiedenis en architectuur, hun cultuur tenrijk, zullen weer miljoenen mensen de verrichtingen van het Nederlands elftal op de voet en politiek, en de invloed van deze zaken op volgen. Ondanks het feit dat voetbal razend populair is, bestaat er vanuit de wetenschappelijke het Nederlandse voetbal. wereld relatief weinig interesse voor voetbal. In dit artikel bestuderen we het Nederlands elf- In dit artikel bekijken we het Nederlands tal vanuit het perspectief van complexe netwerken. In het Nederlands-elftalnetwerk, bestaat elftal vanuit het perspectief van complexe elk knooppunt uit een speler die ooit een officiële interland speelde. Twee knopen zijn met netwerken. Onze studie is geïnspireerd door elkaar verbonden als de spelers in dezelfde interland hebben gespeeld. Het doel van dit artikel een artikel van Onody en De Castro [5], die is het onderzoeken van topologische eigenschappen van het aldus verkregen Nederlands- een netwerk hebben bestudeerd dat bestaat elftalnetwerk. Almerima Jamakovic en Rob Kooij zijn werkzaam als onderzoeker bij de faculteit uit voetbalspelers uit de Braziliaanse voetbal- van Elektrotechniek, Wiskunde en Informatica van de Technische Universiteit Delft; Rob Kooij competitie. werkt eveneens bij TNO Informatie- en Communicatietechnologie evenals de andere vier au- De theorie van complexe netwerken vormt teurs. een vrij recent onderzoeksdomein, dat ont- staan is uit de grafentheorie, en minder ge- Voetbal is in vele landen een ontzettend po- gress on Science & Football [2], wordt slechts richt is op de studie van kleine grafen en pulaire sport. Volgens Arrigo Sacchi, coach om de vier jaar gehouden. Het meest recente de eigenschappen van individuele knopen en van het succesvolle AC Milan in de jaren 90 congres, dat plaats vond in 2007, had slechts de verbindingen tussen knopen in deze gra- van de vorige eeuw, is voetbal het belang- 477 deelnemers, hetgeen een laag aantal is fen, en meer op de statistische eigenschap- rijkste van alle onbelangrijke zaken in het le- voor een belangwekkende wetenschappelijke pen van grootschalige netwerken. In de afge- ven. , de legendarische voormali- conferentie. Desalniettemin zijn er wel enke- lopen jaren is deze theorie uitgegroeid tot een ge manager van Liverpool, ging nog een stap- le interessante publicaties te noemen waarin volwaardig onderzoeksgebied. De reden hier- je verder: volgens sommigen is voetbal een voetbal wetenschappelijk wordt benaderd. voor is tweeledig: het bestaan van interessan- kwestie van leven en dood. Maar het is veel Een mooi overzicht van wetenschappe- te toepassingen binnen biologische, sociale belangrijker dan dat! lijke aspecten van voetbal is te vinden in en technologische netwerken, en de beschik- De populariteit van voetbal zien we ook te- How to score, geschreven door Ken Bray [3]. baarheid van grote aantallen data afkomstig rug in een aantal cijfers gerelateerd aan de Zijn boek behandelt onder andere de volgen- van netwerken uit de echte wereld [6,7,8]. eindronde van het WK Voetbal dat in 2006 de onderwerpen: natuurkunde van de bal, Sociale netwerken worden gevormd door in Duitsland plaatsvond. Wereldwijd waren trainingschemas, doelpuntstatistieken, me- mensen, of groepen van mensen, die met er, cumulatief, 27 miljard TV kijkers. In totaal dische en fysiologische aspecten, het nemen elkaar interacteren volgens een bepaald pa- werd er, op TV, meer dan 73000 uur verslag van strafschoppen en de rol van electronische troon of contact, bijvoorbeeld vriendschap, gedaan van het WK [1]. hulpmiddelen. zaken of een sexuele relatie. Ondanks het feit dat voetbal zo popu- Een ander interessant boek, met een com- In dit artikel bestuderen we het Neder- lair is, wordt er vanuit de wetenschappelijke pleet andere invalshoek, is geschreven door lands elftal (NE) als een sociaal netwerk. In gemeenschap, relatief weinig aandacht aan David Winner. In Brilliant Orange [4], onder- het Nederlands-elftalnetwerk correspondeert voetbal besteed. Ter illustratie, het World Con- zoekt hij de relatie tussen de Nederlanders, elk knooppunt met een speler die een officiële

1 1 2 2

Rob Kooij, Almerima Jamakovic en anderen Het Nederlands elftal als complex netwerk NAW 5/9 nr. 1 maart 2008 51 Fotograaf: Ben van Meerendonk / AHF, collectie IISG, Amsterdam met zijn vrouw Hiltje Lenstra-Wisman (23 februari 1950)

interland heeft gespeeld voor het Nederlands erg geïnteresseerd in allerlei feiten en sta- mogelijk spelers al onderling hebben samen elftal. Een knoop is verbonden met een an- tistieken van het Nederlands elftal. Dit blijkt gespeeld. dere knoop indien de corresponderende spe- onder andere uit de populariteit van boe- lers in dezelfde interland hebben gespeeld. ken als [9], de aanwezigheid van quizjes Achtergrond Het doel van dit artikel is het bestuderen op de sites van bijvoorbeeld de KNVB (Ko- Grafentheorie is een tak van wiskunde die van de topologische eigenschappen van het ninklijke Nederlandse Voetbal Bond) en Voet- de eigenschappen van grafen bestudeert. Een Nederlands-elftalnetwerk. De studie naar de bal International en het succes van de site graaf bestaat uit een verzameling punten, topologie van echte-wereldnetwerken is om www.voetbalstats.nl. Deze site, waarop infor- knopen genoemd, waarvan sommige verbon- twee redenen van belang. Ten eerste kunnen matie wordt bijgehouden van alle officiële den zijn door lijnen, ook wel links genoemd. we hiervan leren welke netwerkstructuren we wedstrijden van het Nederlands elftal en de Structuren die als grafen weergegeven kun- tegen komen in het wild en ten tweede kan Europese wedstrijden van Nederlandse club- nen worden zijn alomtegenwoordig, en veel het ons helpen te voorspellen hoe processen teams, heeft gemiddeld ongeveer 550 page- praktische problemen kunnen als een pro- die plaats vinden op netwerken zullen verlo- views per dag. Middels onze studie verzame- bleem op een graaf gemodelleerd worden. Re- pen. Voorbeelden van het laatste punt zijn de len we allerlei nieuwe statistieken van het search naar complexe netwerken is een vrij effectiviteit van zoekmachines op Internet en Nederlands elftal. Een voorbeeld hiervan is: recente stroming binnen het onderzoek rond de snelheid waarmee een virus zich verspreid welke international heeft met de meeste me- grafen dat minder focust op de studie van in een computernetwerk. despelers gespeeld? kleine grafen en de eigenschappen van indi- Voor het specifiek bestuderen van het Ten tweede zouden de resultaten van onze viduele knopen en links in deze grafen, maar Nederlands-elftalnetwerk zijn meerdere rede- studie ook gebruikt kunnen worden door de meer op de statistische eigenschappen van nen te noemen. Als eerste reden noemen bondscoach, bijvoorbeeld bij het bepalen van grootschalige netwerken. Deze stroming is we de populariteit die het Nederlands elf- een opstelling, waarbij bepaalde eigenschap- ontstaan doordat huidige computers de mo- tal geniet onder de Nederlandse bevolking. pen van het elftal optimaal zijn. Zo kan een gelijkheid bieden om data te analyseren op In het bijzonder is het Nederlandse publiek elftal worden samen gesteld waarvan zoveel een veel grotere schaal dan dat vroeger ooit

2 2 3 3

52 NAW 5/9 nr. 1 maart 2008 Het Nederlands elftal als complex netwerk Rob Kooij, Almerima Jamakovic en anderen

lengte van het kortste pad tussen i en j. De deze metriek betreft de connectiviteit van de gemiddelde afstand van een graaf is het ge- graaf: hoe groter de algebraïsche connectivi- middelde van de afstand over alle paren kno- teit, hoe moeilijker het is om de graaf uiteen te pen in de graaf. doen vallen in onafhankelijke componenten. In de jaren zestig deed de psycholoog Stanley Milgram een experiment waarbij brie- Het Nederlands-elftalnetwerk ven werden verstuurd tussen twee willekeu- De data die nodig is om het Nederlands- rige personen in Noord-Amerika via sociale elftalnetwerk te construeren is beschikbaar contacten [12]. Uit dit experiment bleek dat er op de site www.voetbalstats.nl. Op de site maar een klein aantal stappen (ongeveer zes) zijn alle opstellingen te vinden van alle offi- nodig is om een brief van persoon a naar per- ciële interlands van het Nederlands elftal. We soon b te sturen. In dit geval komt het gemid- hebben alle interlands beschouwd tot en met Figuur 1 Opstelling van interland nr. 331 deld aantal stappen overeen met de gemid- Wit Rusland–Nederland (21 november 2007), delde afstand in het sociale netwerk. Het be- hetgeen de 661e interland was. De eerste in- mogelijk was. Vroeger deed men studies met staan van een kort pad tussen twee willekeu- terland van Oranje was België–Nederland (30 grafen van enkele tientallen of soms enkele rige knopen in een complex netwerk wordt in april 1905). Als een voorbeeld tonen we de honderden knopen, terwijl nu netwerken on- de literatuur het small-world effect genoemd. opstelling van interland nr. 331, Nederland– derzocht worden met miljoenen of zelfs mil- We zullen later aantonen dat het Nederlands- België (18 november 1973), zie figuur 1. jarden knopen. elftalnetwerk eveneens het small-world effect Uiteraard corresponderen alle spelers die We bespreken enkele toplogische eigen- vertoont. voorkomen in figuur 1 met knopen in het schappen van complexe netwerken (zie ook Nederlands-elftalnetwerk, en bovendien be- [10]). Een complex netwerk kan worden gere- Diameter staan er tussen alle spelers in figuur 1 onder- presenteerd als een ongerichte graaf G(V ; E) De diameter van een graaf is de grootste af- linge links. Dus, ter illustratie, Aad Mansveld die bestaat uit een verzameling knopen V en stand die voorkomt tussen alle paren knopen. is verbonden met . een verzameling links E, met N = |V | het aan- tal knopen en L = |E| het aantal links. Eccentriciteit De eccentriciteit van een knoop is de langste Linkdichtheid afstand naar een andere knoop in de graaf. De De linkdichtheid S van een graaf is het quo- eccentriciteit van de graaf is de eccentriciteit tient van het aantal links en het totaal aantal gemiddeld over alle knopen. Figuur 2 Twee verbonden spelers in het NE netwerk mogelijke links. Het is eenvoudig in te zien dat S = 2L/N(N − 1). Clusteringcoëfficient Nadat we de data van alle 661 wedstrijden De clusteringcoëfficient Ci van knoop i is de in een database hebben ingevoerd, waren we Graad verhouding van het aantal links tussen de bu- in staat om met behulp van een eenvoudi- De graad di van een knoop i is het aantal bu- ren van knoop i en het maximale aantal links ge query de lijst van alle verbindingen in het ren van een knoop, dat wil zeggen het aantal dat kan bestaan tussen de buren van knoop Nederlands-elftalnetwerk te bepalen. Het is knopen waarmee knoop i direct verbonden is. i. De clusteringcoëfficient C van de graaf is gebleken dat in de 661 interlands in totaal De gemiddelde graad hangt af van het totaal de clusteringcoëfficient gemiddeld over alle 691 internationals hebben gespeeld. Elke in- aantal knopen en links: E[d ] = 2L . i N knopen. dividuele speler hebben we voorzien van een Assortativiteitcoëfficient unieke ID, variërend van 1 tot en met 691. De Nabijheid Een metriek die de correlatie kwantificeert ordening van de ID’s was gebaseerd op het De nabijheid van een knoop is de gemiddel- tussen paren knopen is de assortativiteit- aantal speelminuten in het Nederlands elftal. de afstand naar alle andere knopen. De na- coëfficient r (−1 < r < 1). Networken met De verbindingslijst is een representatie van bijheid van een knoop geeft de mate van cen- r < 0 zijn disassortatief, hetgeen betekent alle links in het netwerk. Bijvoorbeeld, omdat traliteit van een knoop aan, dat wil zeggen dat knopen de neiging hebben te grenzen aan Aad Mansveld ID 294 heeft terwijl Rob Ren- het geeft aan in hoeverre een knoop centraal knopen met een andere graad. In netwerken senbrink ID 41 bezit, bevat de verbindings- staat in het netwerk. De knoop met de laag- met r > 0 (assortatieve netwerken) is het lijst het element 41 – 294. We hebben ge- ste nabijheid noemen we de meest centrale waarschijnlijker dat knopen grenzen aan kno- constateerd dat het totaal aantal links in het knoop. pen met dezelfde graad [11]. Nederlands-elftalnetwerk 10450 bedraagt. De assortativiteit coëfficient r is als volgt ge- Algebraïsche connectiveit We hebben het Nederlands-elftalnetwerk definieerd: De Laplace matrix van een graaf G met N kno- gevisualiseerd door de verbindingslijst in te  2 voeren in het Pajek programma [14] (figuur −1 P −1 P 1 pen is een N × N matrix Q = ∆ − A, waarbij L i jiki − L i 2 (ji + ki) r = , = diag(d ), d is de graad van knoop i, en 5). Knopen aan de linkerzijde van de graaf  2 ∆ i i −1 P 1 2 2 −1 P 1 L i 2 (ji + ki ) − L i 2 (ji + ki) A is de verbindingsmatrix van G. De op één na corresponderen met spelers uit het begin van kleinste eigenwaarde van de Laplace matrix de vorige eeuw. De nog steeds actieve spelers waar j en k de graden representeren van de i i wordt aangeduid met de term algebraïsche zijn te vinden aan de rechterzijde van de graaf. knopen aan de uiteinden van link i, waarbij connectiviteit. De algebraïsche connectiviteit i = 1,...,L. speelt een belangrijke rol in verscheidene Resultaten Afstand problemen uit de grafentheorie (zie bijvoor- In deze sectie geven we waarden van en- De afstand tussen twee knopen i en j is de beeld [13]). De belangrijkste toepassing van kele topologische eigenschappen die eer-

3 3 4 4

Rob Kooij, Almerima Jamakovic en anderen Het Nederlands elftal als complex netwerk NAW 5/9 nr. 1 maart 2008 53

Topologische eigenschappen Waarde Nederlands-elftalnetwerk gelijk aan 11. In ta- Speler NE carrière # knopen 691 bel 3 tonen we het kortste pad tussen Rafael 1 2001–heden # links 10450 van der Vaart en Jan van Beek, dat inderdaad 2 1995–heden linkdichtheid 0.044 3 Aron Winter 1987–2000 lengte 11 heeft. gemiddelde graad 30.25 4 Arnold Mühren 1978–1988 assortativiteitcoëfficient -0.063 Merk op dat het Nederlands-elftalnetwerk 5 1962–1978 gemiddelde afstand 4.49 nog veel meer kortste paden van lengte 11 be- 6 Roel Wiersma 1954–1962 diameter 11 vat. Bijvoorbeeld, elke speler die met Edwin 7 Bertus de Harder 1938–1955 eccentriciteit 8.60 8 1925–1938 clusteringcoëfficient 0.75 van der Sar samenspeelde na 2000, heeft ook 9 Harry Dénis 1919–1930 algebraïsche connectiviteit 0.16 een kortste pad van lengte 11 naar Jan van 10 Just Göbel 1911–1919 Beek. Met behulp van Pajek hebben we uitge- 11 John Heijning 1907–1912 Tabel 1 Topologische eigenschappen rekend dat er in het Nederlands elftal netwerk 12 Jan van Beek 1907 in totaal 324 kortste paden zijn van lengte 11. der zijn geïntroduceerd voor het Nederlands- Tabel 3 Een kortste pad in NE netwerk van lengte 11 Door de nabijheid van alle spelers te be- elftalnetwerk. We hebben ze berekend met rekenen, zijn we ook in staat te bepalen wie behulp van Pajek en enkele speciaal daar- Speler NE carrière Nabijheid de meest centrale speler is in het Nederlands- toe ontwikkelde Matlab functies. De resulta- 1 Roel Wiersma 1954–1962 3.119 elftalnetwerk. Met ‘meest centraal’ wordt hier ten zijn te vinden in tabel 1. 2 1946–1961 3.213 bedoeld de speler die gemiddeld de kortste 3 Bertus de Harder 1938–1955 3.217 Ten eerste kunnen we concluderen dat het afstand heeft tot alle overige spelers. Tabel 4 1946–1960 3.222 Nederlands-elftalnetwerk geconnecteerd is. 4 toont de Top 5 van spelers met de laagste 5 1948–1965 3.230 Dat wil zeggen dat er tussen elke twee inter- nabijheid. De meest centrale speler in het Ne- Tabel 4 Top 5 meest centrale spelers nationals een pad bestaat. Als voorbeeld be- derlands elftal netwerk is Roel Wiersma, die schouwen we Johan Cruijff en Marco van Bas- actief was in 1954–1962, en 53 interlands op heeft het Nederlands-elftalnetwerk de hoog- ten. Deze twee internationals hebben nooit in zijn naam heeft staan. Merk op dat het niet ste gemiddelde afstand tussen de knopen. De dezelfde interland gespeeld, maar ze hebben verrassend is dat de meest centrale spelers clusteringcoëfficienten van het Nederlands- wel allebei met gespeeld. ongeveer vijftig jaar geleden actief waren, om- elftalnetwerk en het Braziliaanse netwerk zijn De afstand tussen Cruijff en van Basten is dus dat het Nederlands Elftal ongeveer honderd vergelijkbaar, en veel hoger dan van de ove- 2. jaar bestaat. Van de nog actieve spelers is rige beschouwde netwerken. Het Nederlands Omdat de gemiddelde afstand tussen spe- het meest centraal, met een ge- elftal netwerk heeft de grootste algebraïsche lers klein is (4.46) vertoont het Nederlands- middelde afstand tot alle overige spelers van connectiviteit, dus van de beschouwde net- elftalnetwerk, net als veel andere sociale net- 4.73. werken valt dit netwerk het minst snel uiteen werken, het small-world effect. Verder zien we We zullen nu de topologische kenmerken in onafhankelijke componenten. dat een speler gemiddeld met ongeveer dertig van het Nederlands elftal netwerk vergelij- internationals heeft samengespeeld. ken met die van enkele andere netwerken Overige resultaten Uiteraard is de informatie die we hebben uit de echte wereld. In tabel 5 vergelijken we Tenslotte bespreken we een aantal resultaten verkregen veel gedetailleerder dan getoond. het Nederlands-elftalnetwerk met de volgen- over het Nederlands elftal die niet gerelateerd Zo zijn we bijvoorbeeld nu in staat de vraag de netwerken: zijn aan het Nederlands-elftalnetwerk. Figuur welke international met de meeste medespe- • Braziliaanse-Voetballersnetwerk (BV) [5] 4 toont het aantal interlands gespeeld door lers gespeeld heeft, te beantwoorden. We • electriciteitsnet van westelijke staten in de het Nederlands elftal per jaar. hebben ontdekt dat de speler met de hoog- V.S. (Pow) [15] Een visuele inspectie van figuur 4 laat on- ste graad Harry Dénis is. Zoals blijkt uit tabel • het Internet op het niveau van Autonome der andere het volgende zien: het plaats vin- 2 speelde hij in wedstrijden waarin 117 andere Systemen (Int) [16] den van twee wereldoorlogen, het optreden internationals hebben gespeeld: • netwerk dat proteïne interactie represen- van lokale maxima bij het behalen van de fi- teert voor de gistsoort Saccharomyces ce- nale van twee WK eindronden (1974 en 1978), Speler Wedst. Graad NE carrière Clust. revisae (Pro) [17] een lokaal minimum als gevolg van de uit- Van der Sar 122 97 1995-heden 0.39 In tabel 5, die gedeeltelijk is overgenomen Dénis 56 117 1919-1930 0.17 schakeling voor de WK eindronde in 2002 en uit [17], ontbreken enkele kenmerken in de BV de tendens van een toenemend aantal wed- Tabel 2 Karakteristieken voor Van der Sar en Dénis kolom, omdat deze niet zijn beschreven in [5]. strijden per jaar. Op basis van tabel 5 kunnen we onder an- Omdat doelpunten de essentie vormen Omdat er in de tijd dat Dénis actief was niet dere de volgende conclusies trekken. Net als van voetbal, zullen we ons nu richten op en- werd gewisseld weten we dus dat hij precies het Nederlands-elftalnetwerk, vertonen ook kele statistieken rond doelpunten. In figuur 3 117 medespelers heeft gehad. Het is opmer- het Braziliaanse-Voetballersnetwerk, het In- laten we de kans P(g) zien dat een speler in kelijk dat Edwin van der Sar, recordinterna- ternet op Autonoom Systeem niveau en het totaal g doelpunten heeft gescoord voor het tional met 122 interlands, slechts een graad proteïnenetwerk het small-world effect. Ge- Nederlands elftal. heeft van 97. Het is interessant op te merken middeld heeft een speler uit de Braziliaanse We kunnen concluderen uit figuur 3 dat dat Dénis ook de laagste clusteringcoëfficient competie 50% meer medespelers gehad dan de kans dat een international nooit heeft ge- heeft van alle spelers, dat wil zeggen hij is de een speler van het Nederlands elftal. In te- scoord voor het Nederlands elftal gelijk is aan speler waarvan de medespelers onderling het genstelling tot het Nederlands-elftalnetwerk, 62%. De 10 spelers die het meest hebben ge- minst verbonden zijn. is het Braziliaanse netwerk assortatief. Met scoord voor het Nederlands Elftal zijn te vin- Volgens tabel 1 is de diameter van het uitzondering van het electriciteitsnet (Pow) den in tabel 6.

4 4 5 5

54 NAW 5/9 nr. 1 maart 2008 Het Nederlands elftal als complex netwerk Rob Kooij, Almerima Jamakovic en anderen

Metriek NE BV Pow Int Pro Speler Wedstrijden Goals # knopen 691 13411 4940 20906 4713 1 79 40 # links 10450 315566 6594 42994 19528 2 79 37 linkdichtheid 0.044 0.0035 0.00054 0.0002 0.0018 3 Faas Wilkes 38 35 gem. graad 30.25 47.10 2.67 4.11 8.29 4 Abe Lenstra 47 33 assort. coëff. -0.063 0.12 0.0036 -0.20 -0.13 5 Johan Cruijff 48 33 gem. afstand 4.49 3.29 18.54 3.89 3.16 6 59 30 diameter 11 - 46 11 4 7 23 28 eccentriciteit 8.60 - 34.06 8.03 3.99 8 29 26 clust. coëff. 0.75 0.79 0.080 0.21 0.11 9 58 24 algebr. connectiviteit 0.16 - 0.0009 0.015 0.12 10 21 19

Tabel 5 Topologische kenmerken voor verschillende netwerken uit de echte wereld Tabel 6 Topscorers Nederlands elftal

Het is duidelijk dat Patrick Kluivert de top- 691 spelers met 10450 onderlinge verbin- genereren van quizvragen rond het Neder- scorer is van het Nederlands Elftal. Echter, we dingen. lands elftal. (Zie [19] voor een voorbeeld van zien ook uit tabel 6 dat Kluivert meer dan twee • Het Nederlands-elftalnetwerk is geconnec- hoe zo’n quiz er uit zou kunnen zien.) keer zoveel wedstrijden nodig had als Faas teerd, dat wil zeggen tussen elke twee in- De resultaten van onze studie zouden Wilkes, om slechts vijf doelpunten meer te ternationals bestaat een pad. ook gebruikt kunnen worden door de bonds- scoren. Om de trefzekerheid van spelers op • Het Nederlands-elftalnetwerk vertoont het coach. We geven hier twee voorbeelden van. een eerlijkere manier met elkaar te vergelij- small-world effect, omdat de gemiddelde In het eerste voorbeeld veronderstellen we ken, hebben we daarom ook gekeken naar het afstand tussen spelers klein is (4.46). dat de bondscoach voor de linksbackposi- doelpuntenquotiënt (DQ) van spelers, dat wil • De speler die de meeste medespelers tie twijfelt tussen Tim de Cler en Urby Ema- zeggen het aantal doelpunten dat ze gemid- heeft gehad in het Nederlands elftal is Har- nuelson. Beide spelers hebben 10 interlands deld hebben gescoord per 90 minuten speel- ry Dénis. Hij speelde met 117 internationals gespeeld maar de graad van de Cler is 37 tijd. Hierbij beschouwen we alleen spelers die samen. terwijl die van Emanuelson 29 is. Op basis minimaal 20 interlands hebben gespeeld. Het • Van alle internationals heeft Harry Dénis hiervan kan de bondcoach besluiten de Cler resultaat is te zien in tabel 7. de laagste clusteringcoëfficient, dat wil op te stellen, omdat een hogere graad in Het blijkt uit tabel 7 dat van alle spelers die zeggen hij is de speler waarvan de me- het Nederlands-elftalnetwerk op meer erva- twintig of meer interlands hebben gespeeld, despelers onderling het minst verbonden ring kan duiden. Als tweede voorbeeld noe- Beb Bakhuys het meest trefzeker was. Met zijn. men we de mogelijkheid voor de bondscoach een doelpuntenquotiënt van 0.62 neemt Pa- • De diameter van het Nederlands-elftalnetwerk om een elftal dusdanig samen te stellen dat trick Kluivert op deze ranglijst slechts plek 14 bedraagt 11, dat wil zeggen het langste bepaalde eigenschappen van het elftal opti- in. kortste pad dat voorkomt heeft lengte 11. maal zijn. Zo kan een elftal worden samen ge- We merken nog op dat Piet de Boer een • De meest centrale speler in het Nederlands- steld waarvan zoveel mogelijk spelers al on- doelpuntenquotiënt van 3 heeft. Hij heeft elftalnetwerk is Roel Wiersma. derling hebben samen gespeeld of een elftal slechts één keer gespeeld voor het Neder- Vervolgens hebben we de topologische ei- waarvan het aantal medespelers van de op- lands elftal (wedstrijd nr. 148 in 1937) en daar- genschappen van het Nederlands elftal net- gestelde spelers maximaal is. in scoorde hij dus 3 keer. Volgens [9] werd hij werk vergeleken met die van enkele net- Voor vervolgonderzoek richten we ons op na deze wedstrijd niet meer geselecteerd om- werken uit de echte wereld, te weten het drie aspecten. Ten eerste willen we de topo- dat de keuzeheren hem te klein vonden. Braziliaanse-Voetballersnetwerk, een electri- logische eigenschappen van het Nederlands citeitsnet in de V.S., het Internet op het ni- elftal vergelijken met die van nationale voet- De bondscoach veau van Autonome Systemen (Int) en een balteams van andere landen. Bij voorkeur In dit artikel hebben we enkele topolo- proteïne-interactienetwerk. Tot slot hebben voeren we een dergelijk onderzoek uit in sa- gische eigenschappen bestudeerd van het we enkele resultaten besproken die niet ge- menwerking met de UEFA, de Europese voet- Nederlands-elftalnetwerk. Indien alle inter- relateerd zijn aan de topologische aspecten balbond. Ten tweede gaan we ons toeleg- lands die tot en met 2007 zijn gespeeld wor- van het Nederlands Elftal netwerk: gen op de visualisatie van het Nederlands- den meegenomen, dan zijn de belangrijkste • Het grootste aantal interlands per jaar ooit elftalnetwerk. We hebben de ontwikkeling conclusies als volgt bedraagt 17. Dit vond plaats in 2004. van een interactieve tool voor ogen, waarme • Het Nederlands-elftalnetwerk bestaat uit • De kans dat een international nooit heeft de gebruiker zelf door het netwerk kan bewe- gescoord voor het Nederlands Elftal is ge- lijk aan 62%. • Van alle spelers die twintig of meer inter- lands hebben gespeeld, scoorde Beb Bak- huys per negentig minuten speeltijd ge- middeld het meeste doelpunten. Zoals uit de bovenstaande resultaten blijkt, kunnen we door het bestuderen van het Nederlands-elftalnetwerk, allerlei nieuwe, in- teressante statistieken omtrent het Neder-

Figuur 3 De kans dat een speler g doelpunten heeft ge- lands elftal achterhalen. Een mogelijke toe- maakt passing van onze studie is het automatische Figuur 4 Aantal interlands van Nederlands elftal per jaar

5 5 6 6

Rob Kooij, Almerima Jamakovic en anderen Het Nederlands elftal als complex netwerk NAW 5/9 nr. 1 maart 2008 55

gen. Een dergelijke tool kan interessant zijn Speler Wedstr. Min. Goals DQ voor de KNVB, www.voetbalstats.nl en zelfs 1 Beb Bakhuys 23 2070 28 1.22 het Oranje Voetbal Museum te Amsterdam. 2 Pierre van Hooydonk 46 1295 14 0.97 Ten derde willen we de correlatie onderzoe- 3 Leen Vente 21 1870 19 0.91 4 Faas Wilkes 38 3450 35 0.91 ken tussen de topologische eigenschappen 5 Kick Smit 29 2587 26 0.90 van de subgraaf gevormd door spelers die in 6 John Bosman 30 1968 17 0.78 één specifieke wedstrijd speelden en de uit- 7 Mannes Francken 22 2010 17 0.76 slag van die wedstrijd. k 8 20 1310 11 0.76 9 Tonny van de Linden 24 2138 17 0.72 10 Abe Lenstra 47 4260 33 0.70 Dankwoord Dit onderzoek is mede mogelijk gemaakt met behulp van financiële steun van de Nederland- se Organisatie voor Wetenschappelijk Onderzoek (NWO), middels projectnummer 643.000.503, en door het Next Generation Infrastructures program- ma (www.nginfra.nl). De auteurs bedanken Jos We- ber (TU Delft en Excelsior’20) voor zijn waardevolle suggesties en commentaar. Tabel 7 Doelpuntenquotiënt (spelers met minimaal 20 interlands)

Referenties 1 www.fifa.com/mm/document/fifafacts /˜ffpro- 8 D.J. Watts, Six Degrees: The Science of a Con- 15 D.J. Watts and S. H. Strogatz, ‘Collective dynam- jects/ip-401 06e tv 2658.pdf nected Age, W.W. Norton and Company, 2003 ics of small-world networks’, Nature 393, 440- 442, 1998 2 www.wcsf2007.org 9 Martin van Neck, De Oranje Rapporten, Uitgev- erij 521, Amsterdam, 2004 16 CAIDA, ‘Macroscopic Topology AS-Adjacencies 3 Ken Bray, How to score: Science and the Beauti- Data set’, www.caida.org/tools/measure ment ful Game, Granta Books, 2006 10 M.E.J. Newman, ‘The structure and function of /skitter/as adjacencies.xml complex networks’, SIAM Review 45, 167-256, 4 David Winner, Brilliant Orange: The Neurotic 2002 17 H. Jeong, S. Mason, A.L. Barabasi and Z.N. Genius of Dutch Football, Bloomsbury Publish- Oltvai, ‘Centrality and lethality of protein net- ing PLC, 2001 11 M.E.J. Newman, ‘Assortative mixing in net- works’, Nature 411, 41, 2001 works’, Phys. Rev. Lett. 89, 208701, 2002 5 R.N. Onody and P.A. de Castro, ‘Complex net- 18 A. Jamakovic, S. Uhlig and I. Theisler, On the re- work study of Brazilian soccer players’, Physical 12 J. Travers and S. Milgram, ‘An experimental lationships between topological metrics in real- Review E, 70(3), 037103, 2004 study of the small world problem’, Sociometry world networks , Proc. of the 4th European Con- 32(4), pp. 425-443, 1969 6 S.N. Dorogovtsev and J.F.F. Mendes, Evolution ference on Complex Systems (ECCS07), Dres- of Networks: From Biological Nets to the Inter- 13 F.R.K. Chung, Spectral graph theory, Conference den, Germany, October, 2007 net and WWW, Oxford University Press, Oxford, Board of the Mathematical Sciences No.92, 19 www.magicbob.nl/oranjequiz.html 2003 AMS, Providence, RI, 1997 7 A.L. Barabasi, Linked: The new science of net- 14 Pajek, ‘Program for large network analysis’, works , Perseus, Cambridge, MA, 2002 vlado.fmf.uni-lj.si/pub/networks/pajek

Figuur 5 Visualisatie van het Nederlands-elftalnetwerk

6 6