Disponible Mais Peu Servi Une Analyse Statistique Des Notes Du
Total Page:16
File Type:pdf, Size:1020Kb
Disponible mais peu servi Une analyse statistique des notes du journal L'Équipe Guillaume Simon Résumé : Nous 1 souhaitons proposer dans ce papier la première analyse statistique poussée des notes des rencontres de football proposées par le journal L'Équipe. Outre le fait de mieux comprendre le mécanisme de notation utilisé par le journal, nous souhaitons savoir des biais d'attribution de ces notes s'y retranscrivent statistiquement. Nous proposerons des pistes pour tenter de rendre l'étude plus précise. L'objectif et la portée de ce papier est aussi de rendre hommage, en tant que lecteurs du journal, à une tradition forte du patrimoine du Football français. Mots-clés : L'Équipe - Football - Notes - Modèle de régression 1 Introduction 1.1 Le principe des notes L'économie du football s'est considérablement développée au cours des dernières décen- nies. L'analyse statistique des rencontres et des performances des joueurs s'étoe en conséquence et vient aider au quotidien clubs et consultants. Si des fournisseurs pro- fessionnels de données sportives objectives tels qu'Opta 2 orent aux clubs, télévisions, radios, des statistiques et des services d'aide pour une analyse anée, beaucoup de sites anglo-saxons en accès libre tels que, par exemple, Squawka 3 ou Whoscored 4, donnent à la fois des statistiques et des critères d'évaluation systématique des joueurs après les matchs. Depuis des années cependant 5, le journal L'Équipe fournit dans sa version papier après chaque match de championnat de France, une note pour chaque joueur ayant participé 1. Ce papier doit beaucoup aux échanges sur la modélisation menés avec Mathieu Rosenbaum, mora- lement co-auteur de cet étude. Qu'il en soit vivement remercié. Bien évidemment, ce papier n'aurait pas existé sans l'apport et l'aide de Thibault Simon, Philippe Bernat, Nicolas Gouëzel et Julien Quilichini. Un grand merci à tous... 2. http://www.optasports.com/ 3. http://www.squawka.com/news/ 4. https://fr.whoscored.com/ 5. Depuis la saison 1987-1988. 1 au match au moins 45 minutes. Typiquement, à l'issue d'un match, 22 notes sont donc données. Ce chire peut être aecté par le temps passé sur la pelouse par les joueurs, et donc par les expulsions, remplacements, blessures, et choix de l'entraîneur. Des notes sont aussi données après les rencontres de l'équipe de France, les matchs des clubs français en coupe d'Europe, ou les matchs exceptionnels comme les nales de coupe de France ou de la Ligue. Dans le présent papier, seuls les matchs de championnat de France (où une note est systématiquement donnée) nous intéressent. Avec 10 matchs par journée et 38 journées par saison, nous disposons d'environ 38 × 10 × 22 = 8360 notes par saison. 1.2 Disponible mais peu servi Peu d'informations sont disponibles sur la manière dont les notes sont données, outre le fait que ces notes sont des notes subjectives données par le ou les correspondants du journal qui assistent au match. La présente section énonce donc des conjectures, mais qui nous paraissent relativement vraisemblables. Pour les matchs ordinaires, il semble que le correspondant local soit seul à noter les joueurs. Pour les matchs plus importants, les notes semblent être des moyennes entre diérentes notes données par les observateurs : Ce sont donc les envoyés spéciaux de notre journal qui évaluent les joueurs, même si les notes sont parfois modiées au siège 6. Chaque note s'accompagne en général d'un commentaire. Comme le célèbre et souvent utilisé Disponible mais peu servi, descriptif d'un attaquant volontaire, mais sevré de ballons par le jeu de son équipe, et s'époumonant à courir dans le vide. Évidemment, la bibliographie sur le sujet est quasi inexistante. Quasi, car une référence humoristique existe, celle des [Cahiers du Football (2005)] : si le but de cet article était principalement de faire rire, il n'est pas non plus infondé car il retranscrit bien le sentiment qui peut être celui du lecteur, toute évaluation subjective pouvant donner lieu à débat. À l'époque de l'article précité, les notes étaient encore fournies avec des demi points. Ce qui permettait aux auteurs d'écrire avec humour : Le journaliste n'a pas du tout fait attention à la prestation du joueur : 5,5. Désormais, et ce depuis la saison 2008-2009, les notes sont des entiers naturels entre 0 et 10. Le barème est simple et doit donner lieu (assez logiquement) selon le journal L'Équipe lui-même, aux interprétations suivantes : 10 : match parfait ; 9 : match exceptionnel ; 8 : très bon match ; 7 : bon match ; 6 : match satisfaisant ; 5 : match moyen ; 6. https://www.lequipe.fr/Football/Actualites/Ca-se-passe-comment-a-l-etranger/ 526202. 2 4 : match insusant ; 3 : mauvais match ; 2 : très mauvais match ; 1 : match éxécrable ; 0 : match ponctué d'un comportement inadmissible. Les occurrences de notes extrêmes sont très rares, à la fois pour la note parfaite 7 de 10 comme pour la note la plus basse 8 de 1 (en excluant la note de 0, attribuée quasi- exclusivement pour des raisons disciplinaires). Statistiquement, ces données sont intéressantes à plus d'un titre. Tout d'abord leur sup- port est très peu large. Les notes sont certes comprises entre 0 et 10 mais comme nous allons le voir plus bas, outre le fait qu'elles sont à support discret, les journaliste utilisent rarement toute la palette des notes pour quantier les performances des joueurs. Les notes sont en pratique comprises entre 4 et 6. 1.3 Les biais de notation possibles Il est naturel de penser que la note ne reète pas uniquement la seule performance d'un joueur. La performance technique isolée globale de son équipe, le niveau de son équipe de- puis le début de la saison, les circonstances du match, les attentes placées dans le joueur, l'équipe, le contexte et les enjeux du match, etc. Nous pouvons donner quelques exemples précis. Un match a priori déséquilibré qui se solde nalement par un match très serré entre une équipe héroïque qui subit face à un favori occasionnera probablement des notes très dif- férentes selon le score nal. Si cette résistance se traduit par un score peu probable a priori (match nul ou victoire de l'équipe la plus faible malgré le scénario du match) les notes des joueurs, en particulier du gardien pourraient être très hautes. Un match avec un contenu équivalent, mais avec un score nal en ligne avec la logique (victoire étriquée du favori) donnera des notes plus communes pour les mêmes joueurs de la plus petite équipe. Bien entendu, pour tester cette hypothèse, outre les notes des joueurs et des éléments très généraux (nombre de buts, cartons, score, etc) il faut évidemment analyser avec des données beaucoup plus granulaires (données par joueurs, ballons touchés, passes réussies, tirs cadrés, etc). Un autre exemple est l'attente placée dans un joueur. Un attaquant star d'une équipe de premier plan a pour rôle de marquer fréquemment. Le rôle d'un joueur comme Zlatan Ibrahimovic (au cours de ses années parisiennes) était de marquer à chaque match, si possible plusieurs fois. Si un tel joueur peut produire un match au contenu excellent, avec une participation au jeu conséquente et une activité importante pour le collectif, il est possible que sa note nale soit inférieure à un match plus anecdotique mais avec des statistiques personnelles (buts et passes décisives) plus ronantes. Là encore, un tel eet 7. http://www.ohmygoal.co/omg-fr/note-dix-joueurs-lequipe.html 8. https://www.lequipe.fr/Football/Actualites/Ils-ont-eu-1-dans-l-equipe/542320 3 contrefactuel ne peut être testé en l'absence de données objectives plus nes. Autre exemple : selon le contexte général du match, certains postes peuvent être plus exposés que d'autres. Dans un match que son équipe domine, un milieu de terrain peut sembler ne pas briller alors qu'il est l'auteur de quelques courses sobres mais ecaces qui permettent à son équipe de tenir le ballon. Parallèlement, une erreur en tant que gardien ou défenseur, est souvent plus visible ou délétère pour le score nal que celle d'un attaquant ratant des occasions. Le lien entre poste et note est donc particulièrement intéressant à envisager. Deux petits eets peuvent s'ajouter marginalement. Premièrement, nous ne savons pas exactement qui note les matchs ou du moins, quel est leur rôle au sein du journal. Si pour les plus grands matchs, une moyenne entre diérents spécialistes est faite, pour les matchs en province les moins médiatisés, le même correspondant note tous les matchs d'une même équipe à domicile. Une même équipe serait alors notée par une même per- sonne à domicile et par une personne diérente à chaque match à l'extérieur. Nous ne pouvons hélas pas vérier cette supposition car nous n'avons pas l'historique des journa- listes ayant noté les diérents matchs. De plus, un autre fait tacite est que les journalistes ont, de fait, des interactions professionnelles avec les joueurs. Les joueurs sont réputés pour fréquemment s'enquérir de leurs notes après les matchs. On pourrait donc assister à des collusions potentielles (inconscientes ou non) entre les journalistes et les joueurs. Un journaliste pourrait être enclin à noter de manière plus clémente des joueurs qu'ils connaît bien (ou dont il comprend les circonstances atténuantes lors d'une mauvaise per- formance), ou à donner des notes plus mauvaises pour des joueurs avec lesquels ils ne s'entend pas. Ce biais est humain mais ne peut malheureusement pas être testé. Notre objectif est dans un premier temps de décrire ces données et, ensuite, de les utiliser pour tenter d'inrmer ou de conrmer les biais envisagés ci-dessus.