Secuencias Y Subsecuencias De Pases Entre Futbolistas ¿Es Xavi Un Jugador Unico?´

Universidad de Granada MASTER´ EN ESTADÍSTICA APLICADA TRABAJO FIN DE MASTER´ SECUENCIAS Y SUBSECUENCIAS DE PASES ENTRE FUTBOLISTAS ¿ES XAVI UN JUGADOR UNICO?´ Trabajo realizado por RaúlSánchez Navarro Dirigido por: Dr. Javier López Peñay Dr. AndrésGonzálezCarmona Índice 1. Métodos utilizados 7 1.1. Análisisdescriptivo . 7 1.2. Normalización. 7 1.3. AnálisisCluster . 8 1.3.1. Affinity Propagation . 8 1.3.2. Mean Shift . 11 1.3.3. K-medias . 12 1.3.4. Análisisjerárquico . 13 1.3.5. Amalgamiento simple . 14 1.3.6. Método de Ward . 15 1.4. Análisisde Componentes Principales . 15 2. Análisispor equipos 17 2.1. Análisisdescriptivo . 17 2.2. Técnicasaglomerativas . 24 2.2.1. Propagaciónpor afinidad . 24 2.2.2. K-medias . 27 2.2.3. Método jerárquicode Ward . 30 2.2.4. Análisisde componentes principales . 32 3. Análisispor jugadores 35 3.1. Análisisdescriptivo . 36 3.2. Técnicasaglomerativas . 38 3.2.1. Propagaciónpor afinidad . 38 3.2.2. Mean Shift . 42 3.2.3. Análisisde componentes principales . 43 3.2.4. Xavi . 46 3.2.5. Distancias eucl´ıdeas. 52 4. Conclusiones 54 2 Índice de figuras 1. BP-ABCA-ESP-2014 . 19 2. BP-ABCA-ENG-2014 . 19 3. BP-ABCA-CHP-2014 . 20 4. BP-ABCA-ESP . 20 5. BP-ABCA-ENG . 21 6. BP-ABCA-nENG-2014 . 22 7. BP-ABCA-nSPA-2014 . 22 8. BP-ABCA-nCHP-2014 . 23 9. kmN-SPA-2-4-5 . 28 10. kmN-ENG-2-4-4 . 29 11. kmN-CHP-2-4-5 . 30 12. Ward - ESP . 31 13. Ward - ENG . 31 14. Ward - CHP . 32 15. PCA - ESP . 33 16. PCA - ENG . 34 17. PCA - CHP . 34 18. PCA . 44 19. PCA jugadores . 45 20. Xavi vs resto . 51 3 Índice de cuadros 1. Resumen . 17 2. Medias normalizadas por equipos . 18 3. Coeficiente Silhouette . 24 4. Propagaciónpor afinidad 0.8 - ESP . 25 5. Propagaciónpor afinidad 0.8 - ENG . 25 6. Propagaciónpor afinidad 0.9 - CHP . 26 7. Sucesiones de jugadores . 35 8. Todos los jugadores . 36 9. Coeficiente Silhouette - Jugadores . 38 10. Grupos por jugadores - Silhouette . 38 11. Posiciones: laterales, centrocampistas . 39 12. Posiciones: Centrales y defensas . 40 13. Posiciones: Extremos . 40 14. Posiciones: Laterales . 41 15. Posiciones: Delanteros . 41 16. Grupos de jugadores (Mean shift) . 42 17. Componentes PCA . 43 18. Xavi y total . 46 19. Jugadores FC Barcelona . 47 20. Jugadores Real Madrid . 48 21. Medias normalizadas . 49 22. Valores máximos . 50 23. Distancias m´ınimas . 52 24. M´ınimadistancia euc´ıdea(MDE) . 52 25. Distancias hasta Xavi . 53 4 Introducción Uno de los grandes retos a los que se enfrentan los ojeadores de los clubes de fútbol es la tarea de reemplazar un jugador por otro. El primero, bien pudo llegar a una edad en la que decidiódar paso a jugadores másjóvenes dejando puesto en el equipo, otro club le ofrec´ıauna ficha másalta o bien tuvo que retirarse de la competicióndebido a una lesión.En cualquiera de los casos, es tarea del equipo responsable de gestionar la plantilla la labor de encontrar un reemplazo de garant´ıaspara este jugador que debe abandonar el equipo, independientemente de la razón. El segundo jugador, llegaráal club de destino probablemente con la eti- queta de ser el reemplazo del primero, precedido de un coste alto económi- camente hablando y una ficha elevada, por lo que la presiónsobre el nuevo fichaje del equipo seráalta. La cuestiónque nos planteamos es: ¿Pueden los ojeadores estar seguros al cien por cien de que el jugador que recomendaron contratar es el reemplazo ideal? La labor del ojeador consiste en encontrar jugadores de un perfil deter- minado dependiendo de las necesidades del equipo. Para ello se invierten grandes cantidades de dinero en seguir jugadores y rastrear el mercado en busca de posibles fichajes y nuevas contrataciones para el equipo. Mediante este trabajo van, entre otras cosas, a ayudar a la Secretar´ıaTécnicaa decidir si se debe o no firmar un acuerdo con el futbolista. Cuando hablamos del fútbol base, las categor´ıasinferiores del fútbol es- pañolcontemplan edades desde los 4 hasta los 18 años.Los ojeadores se dedican a observar a los jóvenes futbolistas y establecer si tienen suficiente nivel como para jugar en el equipo. ¿De quéforma determina un ojeador si el futbolista tiene o no el nivel requerido por el club? Tal y como se puede ver en [10] se realiza una descripciónprevia de las cualidades del jugador, entre las que se incluye una serie de valoraciones, del tipo general, técnica, táctica,f´ısica,psicológicay personal, as´ıcomo otro tipo de evaluaciones. Mediante este trabajo vamos a tratar de demostrar que se puede incluir una nueva forma dentro de la búsquedade jugadores con un perfil y forma de juego similar, ayudando de este forma a la labor de encontrar el futbolista perfecto para reemplazar a otro. Sabiendo los pases que realizan los jugadores de un equipo, extraeremos sus secuencias de pases para estudiar lo involucrado que estáel jugador con el juego del equipo, as´ıcomo la posición favorita del jugador en el campo. Debemos tener en cuenta que es importan- 5 te saber que el juego del equipo puede establecer que un jugador tenga una secuencia de pases determinada y que esta venga influenciada por sus com- pañeros,pero es la labor conjunta entre este tipo de análisisy la del ojeador la que debe determinar si un jugador estácapacitado para jugar en el equipo. Gracias a la tecnolog´ıaactual, la recogida de datos referentes a todo lo que ocurre en el terreno de juego es costosa pero asumible por los clubes, siendo una importante herramienta que permite estudiar numéricamente cualquier situaciónque se de a lo largo del partido. El uso de la tecnolog´ıaen el deporte es un hecho actual y si los clubes la utilizan en su favor, pueden verse bene- ficiados en multiples aspectos, desde estudiar al rival, encontrar deficiencias en su equipo, buscar nuevos jugadores, etc. La estad´ısticay la recopilaciónde informaciónestána la orden del d´ıa y por eso, con este proyecto se defiende que es posible establecer un perfil matemático-futbol´ısticoque permita a los equipos poseer dentro de sus filas a personas capacitadas para realizar análisisde alto nivel estad´ısticoy además, entiendan lo que ocurre dentro del equipo para poder ayudarlo de la mejor manera posible. Por otro lado, en este trabajo nos centraremos en encontrar un reemplazo para Xavi, uno de los jugadores máslaureados del fútbol españoly ganador de al menos una vez, de todos los torneos profesionales que ha disputado tanto con la SelecciónEspañolade Fútbol (menos la Copa Confederaciones) como con el equipo que capitaneaba, el FC Barcelona, el cual a dejado este verano. Mediante técnicasestad´ısticascomprobaremos si somos capaces de encontrar un reemplazo idóneopara el futbolista. Para ello comprobaremos las secuencias de pases entre equipos y jugadores, las cuales nos daráninfor- maciónreferente al estilo de juego que desarrolla cada jugador en el terreno de juego. Esta informaciónnos permitiráconocer la similaridad entre futbolistas y con ello, comprobar los máscercanos a la forma de juego del ya exblaugrana. 6 1. Métodos utilizados En este cap´ıtulose explicaránlos procesos que llevaremos a cabo para realizar nuestra tarea. 1.1. Análisis descriptivo Para llevar a cabo este análisis,utilizaremos las medidas de tendencia central como la media aritméticay la mediana, gráficamente, utilizaremos el gráficode caja. Diagrama de caja: El diagrama de caja es un gráficoen el cual se pueden visualizar un conjunto de datos. Este gráficoes muy sencillo de analizar. Estáfor- mado por un rectánguloque contiene la informaciónde los individuos que componen entre el 25 y el 75 por ciento de la información,siendo el 25 % (o el primer cuantil)la l´ıneainferior del rectánguloy el 75 % (tercer cuartil) el superior. Tambiénsuele mostrarse la mediana (cuartil dos o 50 % de la observación)dentro del rectángulo.En las colas superior e inferior del gráficoobservamos en sus partes extremas el punto m´ınimo y máximodel conjunto de datos analizado. 1.2. Normalización Para el mejor tratamiento de los datos y evitar problemas derivados de las distancias entre proporciones, en algunas ocasiones seráaconsejable nor- malizar los datos. La normalizaciónpermite transformar un conjunto de valores, en otro con media 0 y desviaciónt´ıpica1. De esta forma, podemos comparar proporciones que de otra forma no ser´ıaposible. El proceso de normalizaciónes muy sencillo: X − µ Z = i σ Donde: Z: Es el valor estándar 7 Xi : representa cada uno de los valores del conjunto de datos µ : Es la media del conjunto de valores σ : Es la desviación t´ıpicadel conjunto de valores 1.3. Análisis Cluster El análisisCluster es una técnicaque permite resolver problemas de cla- sificación.Dependiendo la rama de estudio se le asigna un nombre distinto como puede ser Taxonom´ıaNumérica en Biolog´ıa, Q-análisis en Psicolog´ıao Reconocimiento de patrones en Inteligencia Artificial. La ventaja de utilizar este tipo de análisisradica en que no hace falta estar al tanto de la informa- ciónrecibida, pero es ah´ıdonde una opiniónexperta en el campo de estudio hace que se tenga ventaja sobre el estudio a la hora de establecer una mejor clasificación.¿Cuántas posibilidades existen? ¿Cuántas categor´ıasse han encontrado? El análisisCluster enumeraráestas posibilidades y podremos elegir entre ellas.

Load more