Máster en Big Data Deportivo Pablo Sanzol. 2020 Big Data International Campus / UCAM TRABAJO FIN DE MÁSTER MÁSTER EN BIG DATA DEPORTIVO …………………………………………………………………… ANÁLISIS DE LA LIGA SANTANDER Pablo Sanzol García DIRECTOR David Fombella Pamplona 27 de marzo de 2020 1 Máster en Big Data Deportivo Pablo Sanzol. 2020 Big Data International Campus / UCAM Agradecimientos A todo el profesorado del Big Data International Campus que compone el Máster en Big Data Deportiva y a todo el personal administrativo y de captación que ha estado, día a día, por y para nosotros. A todos los ponentes de las MásterClass de La Liga, Telefónica, Driblab, Marca, Opta Sports, Catapult Sports, IBM Global Markets, ERIC Sports, Nagi Smartpool and NBN23, Nac Sports, SaS Analyst, Objetivo Analista, Oliver, Analítica Sports, Arsenal y Club América de México, entre otros muchos. A todos mis compañeros por el desarrollo de las actividades colaborativas y las largas lecciones de aprendizaje. A Miguel Ángel del Barrio y David R. Sáez Ávila por haber estado siempre disponible, a Francisco Oviedo por su cercanía y a David Fombella por su atención. 2 Máster en Big Data Deportivo Pablo Sanzol. 2020 Big Data International Campus / UCAM Índice I. Introducción. II. Contexto y marco situacional. III. Análisis de las relaciones entre las variantes de La Liga Santander. 1. Análisis de la finalización entre los equipos. 1.1. Relación existente entre los goles y los goles esperados. 1.2. Relación existente entre los tiros y el porcentaje de tiros a puerta. 1.3. Relación existente entre los goles y las oportunidades. 2. Análisis de la progresión en el juego entre los equipos. 2.1. Relación de las oportunidades y el porcentaje de posesión de balón. 2.2. Relación existente entre pases cortos y pases largos. 2.3. Cantidad de ataques en función de los pasillos. 2.4. Cantidad de entradas en campo rival, último tercio y área rival. 2.5. Estudio de la posición media ofensiva. 3. Análisis de la fase defensiva entre los equipos. 3.1. Estudio de las recuperaciones totales y en campo rival. 3.2. Estudio de la proporción de acciones defensivas frente a pases del rival, atendiendo a la zona. 3.3. Estudio de la distancia media de la línea defensiva. 3.4. Estudio de las pérdidas totales y en campo propio. IV. Conclusiones. V. Abreviaturas. 3 Máster en Big Data Deportivo Pablo Sanzol. 2020 Big Data International Campus / UCAM I. Introducción. No solo hay que hablar del juego y del balón, sino también de personas, que al fin y al cabo, son las que nutren de sentido, diversidad y emoción al fútbol. La vitalidad de La Liga Santander se debe a múltiples factores que no deben ceñirse a un solo desencadenante, como podría ser la cultura. Numerosos ingredientes sociales, económicos, de pertenencia o de otra índole adornan de color el fútbol en España, como lo han hecho a lo largo de la historia, potenciando y mejorando la estructura del marco deportivo nacional. Tal y como pronunció una vez el jugador del Real Zaragoza, en la temporada 1978-1979, Vujadin Boskov, “fútbol es fútbol”. Un buen epitafio para establecer de manera simple, rápida y comprensible qué y de qué trata el mencionado deporte. Nadie va a descubrir nada nuevo y, si nos centramos en la teoría de la lógica interna del fútbol, tampoco parece ser que diste mucho de la oración citada. No obstante, el fútbol es complejo. El fútbol es un sentido continuo de relaciones entre múltiples variantes, algunas tangibles, pero otras intangibles. Ahí está la cuestión, la ingeniería de la imaginación y el sueño de pensar el dónde puede estar ese espacio, ese instante o esa secuencia que haga a un equipo ganador. El estudio de la complejidad consiste, entre otras cosas, en el estudio de sistemas complejos como el fútbol. Perfectamente, se podría definir como un sistema formado por componentes o partes interconectadas o interdependientes, a partir de las cuales emerge un comportamiento colectivo con propiedades distintas a las que tiene cada uno de sus componentes por separado1. En otras palabras, de una serie de interacciones surgirán comportamientos de relación y oposición con respecto a espacios, tiempos, alturas, distancias, amplitudes, profundidades y fases del juego, entre otras. Todo ello, nos proporcionará una información muy valiosa y susceptible de ser analizada. Queda claro que, si existen relaciones con compañeros, adversarios y balón, dentro de cada una de las mismas existe una temática diferente. El fútbol es tan rico en sí mismo porque no tiene fin. Se mire por donde se mire o se estire por donde se estire, el análisis es tan relevante como interminable. La incertidumbre del juego invita a su observación y a la interpretación de los datos que segrega. Dicha razón es la que motiva el presente trabajo, el análisis de relaciones entre diferentes variantes y el anhelo de unión entre 1 FERNÁNDEZ, M. El entrenamiento emergente, 2017 4 Máster en Big Data Deportivo Pablo Sanzol. 2020 Big Data International Campus / UCAM distintos momentos del juego, estableciendo una comparativa interesante entre los diferentes equipos de La Liga Santander. 5 Máster en Big Data Deportivo Pablo Sanzol. 2020 Big Data International Campus / UCAM II. Contexto y marco situacional Antes de comenzar a establecer cualquier relación entre variables y posibles comparativas entre los distintos equipos y jugadores de La Liga Santander, cabe centrarse en el entorno que envuelve a la competición. La Liga Santander está compuesta por veinte equipos, de los cuales, por norma general, los cuatro primeros se clasifican para jugar la UEFA Champions League, el quinto y el sexto consiguen acceder a la UEFA Europa League y los tres últimos descienden a La Liga Smartbank. En el caso de la categoría de plata del fútbol español, los dos primeros ascienden directos, los cuatro siguientes disputan la promoción de ascenso y los cuatro últimos descienden a Segunda División B. A continuación, se refleja la clasificación actual de La Liga Santander -hasta la jornada 27-, así como la puntuación esperada y la diferencia existente (TABLA 1). TABLA 1. CLASIFICACIÓN ACTUAL DE LA LIGA SANTANDER POSICIÓN EQUIPO PUNTUACIÓN PUNTUACIÓN DIFERENCIA ESPERADA 1 F. C. Barcelona 58 48 +10 2 Real Madrid C. F. 56 55 +1 3 Sevilla F. C. 47 44 +3 4 Real Sociedad 46 38 +8 5 Getafe C. F. 46 37 +9 6 Atlético de Madrid 45 45 0 7 Valencia C. F. 42 25 +17 8 Villarreal C. F. 38 35 +3 9 Granada C. F. 38 31 +7 10 Athletic Club 37 31 +6 11 C. A. Osasuna 34 36 -2 12 Real Betis Balompié 33 31 +2 13 Levante U. D. 33 19 +14 14 Deportivo Alavés 32 29 +3 15 Real Valladolid 29 23 +6 16 S. D. Eibar 27 30 -3 17 R. C. Celta de Vigo 26 27 -1 18 R. C. D. Mallorca 25 24 +1 19 C. D. Leganés 23 32 -9 20 R. C. D. Espanyol 20 26 -6 Fuente: elaboración propia 6 Máster en Big Data Deportivo Pablo Sanzol. 2020 Big Data International Campus / UCAM En relación con los datos obtenidos, la gran mayoría de los equipos de La Liga Santander han obtenido una puntuación mayor de la esperada (GRÁFICOS 1 y 2). A simple vista, destacan los casos del Levante U.D., Valencia C. F. y F. C. Barcelona: - Levante U.D.: el equipo de Paco López tiene trece puntos más que los esperados. Han encajado dieciséis goles menos que los esperados y han marcado tres goles menos. La lógica descansa en los goles esperados a favor (x G) y en los goles esperados en contra (x GA). Por ello, la diferencia positiva reside claramente en los goles recibidos. - Valencia C.F.: el equipo de Albert Celades acumula diecisiete puntos más que los esperados, ya que ha encajado nueve goles menos que los esperados y ha marcado tres más. Por lo tanto, los veinticinco puntos esperados residen en que de haber recibido la diferencia de nueve goles y no haber marcado tres goles más, la puntuación esperada sería la señalada. - F. C. Barcelona: el equipo de Quique Setién sigue la misma línea de los razonamientos anteriores (+10), pero desde el punto de vista de los goles marcados. Su diferencia positiva de diez puntos reside en que ha marcado dieciséis goles más que los esperados, ya que ha recibido los mismos goles que se esperaban (31). Ahora bien, hay cinco equipos con puntuaciones inferiores a las esperadas y dos de ellos son el C. D. Leganés (-9) y el R. C. D. Espanyol (-6), ambos en descenso a La Liga Smartbank. Dichos datos se explican de la misma forma que el supuesto del párrafo anterior. - R. C. D. Espanyol de Barcelona: el equipo de Abelardo ha encajado diez goles más que los esperados y ha marcado siete goles menos, datos que justifican su puntuación actual inferior. En este caso, se aprecia una afectación importante tanto desde el punto de vista de los goles marcados como de los encajados. - C. D. Leganés: el equipo de Javier Aguirre tiene nueve puntos menos que los previstos. Ha encajado siete goles más y ha marcado nueve goles menos que los esperados, tendencia muy similar a la del equipo perico. 7 Máster en Big Data Deportivo Pablo Sanzol. 2020 Big Data International Campus / UCAM GRÁFICO 1. RELACIÓN GOLES ENCAJADOS – GOLES ENCAJADOS ESPERADOS Fuente: elaboración propia a partir De Datos De Instat GRÁFICO 2. RELACIÓN GOLES – GOLES ESPERADOS Fuente: elaboración propia a partir De Datos De Instat 8 Máster en Big Data Deportivo Pablo Sanzol. 2020 Big Data International Campus / UCAM III. Análisis de las relaciones entre las variantes de La Liga Santander.
Details
-
File Typepdf
-
Upload Time-
-
Content LanguagesEnglish
-
Upload UserAnonymous/Not logged-in
-
File Pages46 Page
-
File Size-