Diseño Y Aplicación De Técnicas De Machine Learning Para Optimizar El Scouting En Clubes De Fútbol
Total Page:16
File Type:pdf, Size:1020Kb
Trabajo Fin de Grado Grado en Ingeniería de las Tecnologías Industriales Diseño y aplicación de técnicas de machine learning para optimizar el Scouting en clubes de fútbol Autor: Carlos Soria Polo Tutor: Alicia Robles Velasco Equation Chapter 1 Section 1 Dpto. Organización Industrial y Gestión de Empresas II Escuela Técnica Superior de Ingeniería Universidad de Sevilla Sevilla, 2021 Trabajo Fin de Grado Grado en Ingeniería de las Tecnologías Industriales Diseño y aplicación de técnicas de machine learning para optimizar el Scouting en clubes de fútbol Autor: Carlos Soria Polo Tutor: Alicia Robles Velasco Profesor sustituto interino Dpto. de Organización y Gestión de Empresas II Escuela Técnica Superior de Ingeniería Universidad de Sevilla Sevilla, 2021 iii Trabajo Fin de Grado: Diseño y aplicación de técnicas de machine learning para optimizar el Scouting en clubes de fútbol Autor: Carlos Soria Polo Tutor: Alicia Robles Velasco El tribunal nombrado para juzgar el Proyecto arriba indicado, compuesto por los siguientes miembros: Presidente: Vocales: Secretario: Acuerdan otorgarle la calificación de: El Secretario del Tribunal Fecha: v Agradecimientos Me gustaría dedicar unas palabras a las personas que han sido partícipes tanto de todos los éxitos durante mi vida en general como de estos últimos cuatro años cursando el Grado en Ingeniería de las Tecnologías Industriales. A mis padres, a mi hermana y a mi pareja, por la confianza que han depositado en mí. Su apoyo tanto moral como económico, ha resultado imprescindible para poder conseguir mis metas tanto formativas como personales. También, han sabido construir un entorno en el que poder trabajar sin tener mayores preocupaciones que las puramente académicas. A mis amigos, por servir como desahogo en los momentos de estrés y de apoyo moral para poder seguir adelante. A mis compañeros durante la carrera, a los cuales conocí cursando la intensificación, que han sido de gran ayuda para la resolución de dudas y para servir como apoyo para afrontar todo lo que nos venía. A mis profesores durante la carrera y, en especial, a mi tutora de TFG, Alicia Robles Velasco, que me ha ayudado en todo lo que ha podido y más, de forma muy atenta y entusiasta, permitiéndome realizar un trabajo sobre una temática que, personalmente, me apasiona. Carlos Soria Polo Sevilla, 2021 vii Resumen El objeto del presente trabajo fin de grado es realizar un estudio acerca de los algoritmos de aprendizaje automático, más conocido como ‘Machine Learning’, y cómo estos pueden optimizar la búsqueda de jugadores objeto de adquisición por parte de clubes de fútbol. Esto se consigue gracias a la implementación de algoritmos en el lenguaje de programación Python, que permiten agrupaciones y buscar similitudes entre los futbolistas que forman parte de una base de datos previamente elaborada. Concretamente, se ha hecho uso de dos técnicas de Machine Learning: Análisis de las Componentes Principales (PCA, en adelante, por sus siglas en inglés) y Clustering. El marco teórico de este trabajo se fundamenta en el análisis de un club de fútbol. Para ello, se analiza la organización del departamento que decide la adquisición de futbolistas y, en concreto, las tareas de obtención y procesamiento de datos que sirven de apoyo a dichas decisiones. Haciendo uso de las planificaciones de la presente temporada de dos equipos y gracias a la implementación de las técnicas de ML utilizadas en este trabajo, se han obtenido planificaciones alternativas a las realizadas por los clubes que se han escogido como ejemplo. Estas planificaciones alternativas se han obtenido a partir de una lista de jugadores, que, según las técnicas aplicadas, tienen características parecidas a los jugadores adquiridos por los clubes en la realidad, siempre teniendo en cuenta que el presupuesto invertido en la compra de los jugadores en la planificación alternativa no puede sobrepasar el presupuesto real. ix Abstract The present end of degree project’s object is to conduct a study on automated algorythms, also known as ‘machine learning’, and how these can optimize the search of players to be acquired by football clubs. This can be achieved by algorythm implementation in the programming language Python, which allows to group and look for similarities among the players who are part of the database previously elaborated. Specifically, two Machine Learning techniques have been used: Principal Component Analysis (PCA) and Clustering. This project’s theoterical framework is based on the analysis of one football club. This is done by analyzing the organization of the department which decides the footballers’ acquisition and, more precisely, the data collection and processing tasks, which support these decisions. Using the current season’s adquisition planning and thanks to the implementation of the two techniques used in this project, alternative plannings have been obtained to those carried out by the clubs which have been chosen as an example for the case studies. These alternative plannings have been constituted from a list of players which, according to the applied techniques, have similar characteristics to the ones acquired by the clubs in reality, always taking into account that the amount invested in the purchase of players in the alternative planning cannot excede the real budget. xi Índice Agradecimientos ................................................................................................................................ vii Resumen ............................................................................................................................................. ix Abstract .............................................................................................................................................. xi Índice ................................................................................................................................................ xiii Índice de Figuras .............................................................................................................................. xvii Índice de Tablas ................................................................................................................................ xxi 1 Introducción ................................................................................................................................ 1 2 Objetivos..................................................................................................................................... 3 2.1 Objetivo general ............................................................................................................................... 3 2.2 Justificación ...................................................................................................................................... 3 3 Organización de un club de fútbol .............................................................................................. 5 3.1 Organigrama .................................................................................................................................... 5 3.2 Dirección deportiva .......................................................................................................................... 7 3.3 Scouting ............................................................................................................................................ 8 3.3.1 Factores de importancia ............................................................................................................. 8 3.3.2 Estructuración ............................................................................................................................ 12 3.3.3 Metodología de trabajo ............................................................................................................ 12 3.3.3.1 Seguimiento en bruto ........................................................................................................ 13 3.3.3.2 Seguimiento en neto .......................................................................................................... 14 xiii 3.3.3.3 Definición de perfiles ......................................................................................................... 16 3.3.3.4 Negociación y adquisición del futbolista .......................................................................... 17 4 Machine Learning...................................................................................................................... 19 4.1 Aprendizaje no supervisado .......................................................................................................... 24 4.1.1 Justificación de la aplicación de aprendizaje no supervisado en este estudio de Scouting 24 4.1.2 Clustering ................................................................................................................................... 25 4.1.2.1 El algoritmo k-Means. ........................................................................................................ 27 4.1.2.2 Método del codo ................................................................................................................ 29 4.1.2.3 Análisis de la silueta ........................................................................................................... 30 4.1.3 Principal Component Analysis (PCA) ....................................................................................... 31 4.2 Métricas estadísticas para el análisis de datos ..........................................................................