Secuencias Y Subsecuencias De Pases Entre Futbolistas ¿Es Xavi Un Jugador Unico?´
Total Page:16
File Type:pdf, Size:1020Kb
Universidad de Granada MASTER´ EN ESTAD´ISTICA APLICADA TRABAJO FIN DE MASTER´ SECUENCIAS Y SUBSECUENCIAS DE PASES ENTRE FUTBOLISTAS ¿ES XAVI UN JUGADOR UNICO?´ Trabajo realizado por Ra´ulS´anchez Navarro Dirigido por: Dr. Javier L´opez Pe˜nay Dr. Andr´esGonz´alezCarmona ´Indice 1. M´etodos utilizados 7 1.1. An´alisisdescriptivo . 7 1.2. Normalizaci´on. 7 1.3. An´alisisCluster . 8 1.3.1. Affinity Propagation . 8 1.3.2. Mean Shift . 11 1.3.3. K-medias . 12 1.3.4. An´alisisjer´arquico . 13 1.3.5. Amalgamiento simple . 14 1.3.6. M´etodo de Ward . 15 1.4. An´alisisde Componentes Principales . 15 2. An´alisispor equipos 17 2.1. An´alisisdescriptivo . 17 2.2. T´ecnicasaglomerativas . 24 2.2.1. Propagaci´onpor afinidad . 24 2.2.2. K-medias . 27 2.2.3. M´etodo jer´arquicode Ward . 30 2.2.4. An´alisisde componentes principales . 32 3. An´alisispor jugadores 35 3.1. An´alisisdescriptivo . 36 3.2. T´ecnicasaglomerativas . 38 3.2.1. Propagaci´onpor afinidad . 38 3.2.2. Mean Shift . 42 3.2.3. An´alisisde componentes principales . 43 3.2.4. Xavi . 46 3.2.5. Distancias eucl´ıdeas. 52 4. Conclusiones 54 2 ´Indice de figuras 1. BP-ABCA-ESP-2014 . 19 2. BP-ABCA-ENG-2014 . 19 3. BP-ABCA-CHP-2014 . 20 4. BP-ABCA-ESP . 20 5. BP-ABCA-ENG . 21 6. BP-ABCA-nENG-2014 . 22 7. BP-ABCA-nSPA-2014 . 22 8. BP-ABCA-nCHP-2014 . 23 9. kmN-SPA-2-4-5 . 28 10. kmN-ENG-2-4-4 . 29 11. kmN-CHP-2-4-5 . 30 12. Ward - ESP . 31 13. Ward - ENG . 31 14. Ward - CHP . 32 15. PCA - ESP . 33 16. PCA - ENG . 34 17. PCA - CHP . 34 18. PCA . 44 19. PCA jugadores . 45 20. Xavi vs resto . 51 3 ´Indice de cuadros 1. Resumen . 17 2. Medias normalizadas por equipos . 18 3. Coeficiente Silhouette . 24 4. Propagaci´onpor afinidad 0.8 - ESP . 25 5. Propagaci´onpor afinidad 0.8 - ENG . 25 6. Propagaci´onpor afinidad 0.9 - CHP . 26 7. Sucesiones de jugadores . 35 8. Todos los jugadores . 36 9. Coeficiente Silhouette - Jugadores . 38 10. Grupos por jugadores - Silhouette . 38 11. Posiciones: laterales, centrocampistas . 39 12. Posiciones: Centrales y defensas . 40 13. Posiciones: Extremos . 40 14. Posiciones: Laterales . 41 15. Posiciones: Delanteros . 41 16. Grupos de jugadores (Mean shift) . 42 17. Componentes PCA . 43 18. Xavi y total . 46 19. Jugadores FC Barcelona . 47 20. Jugadores Real Madrid . 48 21. Medias normalizadas . 49 22. Valores m´aximos . 50 23. Distancias m´ınimas . 52 24. M´ınimadistancia euc´ıdea(MDE) . 52 25. Distancias hasta Xavi . 53 4 Introducci´on Uno de los grandes retos a los que se enfrentan los ojeadores de los clubes de f´utbol es la tarea de reemplazar un jugador por otro. El primero, bien pudo llegar a una edad en la que decidi´odar paso a jugadores m´asj´ovenes dejando puesto en el equipo, otro club le ofrec´ıauna ficha m´asalta o bien tuvo que retirarse de la competici´ondebido a una lesi´on.En cualquiera de los casos, es tarea del equipo responsable de gestionar la plantilla la labor de encontrar un reemplazo de garant´ıaspara este jugador que debe abandonar el equipo, independientemente de la raz´on. El segundo jugador, llegar´aal club de destino probablemente con la eti- queta de ser el reemplazo del primero, precedido de un coste alto econ´omi- camente hablando y una ficha elevada, por lo que la presi´onsobre el nuevo fichaje del equipo ser´aalta. La cuesti´onque nos planteamos es: ¿Pueden los ojeadores estar seguros al cien por cien de que el jugador que recomendaron contratar es el reemplazo ideal? La labor del ojeador consiste en encontrar jugadores de un perfil deter- minado dependiendo de las necesidades del equipo. Para ello se invierten grandes cantidades de dinero en seguir jugadores y rastrear el mercado en busca de posibles fichajes y nuevas contrataciones para el equipo. Mediante este trabajo van, entre otras cosas, a ayudar a la Secretar´ıaT´ecnicaa decidir si se debe o no firmar un acuerdo con el futbolista. Cuando hablamos del f´utbol base, las categor´ıasinferiores del f´utbol es- pa˜nolcontemplan edades desde los 4 hasta los 18 a˜nos.Los ojeadores se dedican a observar a los j´ovenes futbolistas y establecer si tienen suficiente nivel como para jugar en el equipo. ¿De qu´eforma determina un ojeador si el futbolista tiene o no el nivel requerido por el club? Tal y como se puede ver en [10] se realiza una descripci´onprevia de las cualidades del jugador, entre las que se incluye una serie de valoraciones, del tipo general, t´ecnica, t´actica,f´ısica,psicol´ogicay personal, as´ıcomo otro tipo de evaluaciones. Mediante este trabajo vamos a tratar de demostrar que se puede incluir una nueva forma dentro de la b´usquedade jugadores con un perfil y forma de juego similar, ayudando de este forma a la labor de encontrar el futbo- lista perfecto para reemplazar a otro. Sabiendo los pases que realizan los jugadores de un equipo, extraeremos sus secuencias de pases para estudiar lo involucrado que est´ael jugador con el juego del equipo, as´ıcomo la posici´on favorita del jugador en el campo. Debemos tener en cuenta que es importan- 5 te saber que el juego del equipo puede establecer que un jugador tenga una secuencia de pases determinada y que esta venga influenciada por sus com- pa˜neros,pero es la labor conjunta entre este tipo de an´alisisy la del ojeador la que debe determinar si un jugador est´acapacitado para jugar en el equipo. Gracias a la tecnolog´ıaactual, la recogida de datos referentes a todo lo que ocurre en el terreno de juego es costosa pero asumible por los clubes, siendo una importante herramienta que permite estudiar num´ericamente cualquier situaci´onque se de a lo largo del partido. El uso de la tecnolog´ıaen el deporte es un hecho actual y si los clubes la utilizan en su favor, pueden verse bene- ficiados en multiples aspectos, desde estudiar al rival, encontrar deficiencias en su equipo, buscar nuevos jugadores, etc. La estad´ısticay la recopilaci´onde informaci´onest´ana la orden del d´ıa y por eso, con este proyecto se defiende que es posible establecer un perfil matem´atico-futbol´ısticoque permita a los equipos poseer dentro de sus filas a personas capacitadas para realizar an´alisisde alto nivel estad´ısticoy adem´as, entiendan lo que ocurre dentro del equipo para poder ayudarlo de la mejor manera posible. Por otro lado, en este trabajo nos centraremos en encontrar un reemplazo para Xavi, uno de los jugadores m´aslaureados del f´utbol espa˜noly ganador de al menos una vez, de todos los torneos profesionales que ha disputado tanto con la Selecci´onEspa˜nolade F´utbol (menos la Copa Confederaciones) como con el equipo que capitaneaba, el FC Barcelona, el cual a dejado este verano. Mediante t´ecnicasestad´ısticascomprobaremos si somos capaces de encontrar un reemplazo id´oneopara el futbolista. Para ello comprobaremos las secuencias de pases entre equipos y jugadores, las cuales nos dar´aninfor- maci´onreferente al estilo de juego que desarrolla cada jugador en el terreno de juego. Esta informaci´onnos permitir´aconocer la similaridad entre fut- bolistas y con ello, comprobar los m´ascercanos a la forma de juego del ya exblaugrana. 6 1. M´etodos utilizados En este cap´ıtulose explicar´anlos procesos que llevaremos a cabo para realizar nuestra tarea. 1.1. An´alisis descriptivo Para llevar a cabo este an´alisis,utilizaremos las medidas de tendencia central como la media aritm´eticay la mediana, gr´aficamente, utilizaremos el gr´aficode caja. Diagrama de caja: El diagrama de caja es un gr´aficoen el cual se pueden visualizar un conjunto de datos. Este gr´aficoes muy sencillo de analizar. Est´afor- mado por un rect´anguloque contiene la informaci´onde los individuos que componen entre el 25 y el 75 por ciento de la informaci´on,siendo el 25 % (o el primer cuantil)la l´ıneainferior del rect´anguloy el 75 % (tercer cuartil) el superior. Tambi´ensuele mostrarse la mediana (cuartil dos o 50 % de la observaci´on)dentro del rect´angulo.En las colas superior e inferior del gr´aficoobservamos en sus partes extremas el punto m´ınimo y m´aximodel conjunto de datos analizado. 1.2. Normalizaci´on Para el mejor tratamiento de los datos y evitar problemas derivados de las distancias entre proporciones, en algunas ocasiones ser´aaconsejable nor- malizar los datos. La normalizaci´onpermite transformar un conjunto de valores, en otro con media 0 y desviaci´ont´ıpica1. De esta forma, podemos comparar proporcio- nes que de otra forma no ser´ıaposible. El proceso de normalizaci´ones muy sencillo: X − µ Z = i σ Donde: Z: Es el valor est´andar 7 Xi : representa cada uno de los valores del conjunto de datos µ : Es la media del conjunto de valores σ : Es la desviaci´on t´ıpicadel conjunto de valores 1.3. An´alisis Cluster El an´alisisCluster es una t´ecnicaque permite resolver problemas de cla- sificaci´on.Dependiendo la rama de estudio se le asigna un nombre distinto como puede ser Taxonom´ıaNum´erica en Biolog´ıa, Q-an´alisis en Psicolog´ıao Reconocimiento de patrones en Inteligencia Artificial. La ventaja de utilizar este tipo de an´alisisradica en que no hace falta estar al tanto de la informa- ci´onrecibida, pero es ah´ıdonde una opini´onexperta en el campo de estudio hace que se tenga ventaja sobre el estudio a la hora de establecer una me- jor clasificaci´on.¿Cu´antas posibilidades existen? ¿Cu´antas categor´ıasse han encontrado? El an´alisisCluster enumerar´aestas posibilidades y podremos elegir entre ellas.