Predicción y rendimiento: innovación en el scouting del fútbol con machine learning
Predicción y rendimiento: innovación en el scouting del fútbol con machine learning
Enllaç permanent
Descripció
Resum
Este trabajo se enfoca en crear una herramienta que combine el fútbol y la ciencia de datos para predecir, utilizando modelos de Aprendizaje Automático, el rendimiento de los jugadores en diferentes contextos. El desarrollo de herramientas de soporte para ojeadores y directores deportivos se ha convertido en un objetivo primordial para empresas del sector. El objetivo de este proyecto es facilitar la toma de decisiones en el proceso de fichaje de jugadores, además de identificar reemplazos óptimos y flaquezas en comparación con otros equipos. Para lograrlo, se desarrollan algoritmos de comparación para relacionar jugadores entre 5 bases de datos, técnicas de preprocesamiento de datos y modelos de Aprendizaje Automático para la predicción. También se implementan algoritmos de similitud para sugerir jugadores como reemplazo e IA Explicable para transparentar las predicciones. Los resultados de los modelos, el análisis y la explicabilidad se muestran en una interfaz web interactiva en Streamlit. Respecto a los resultados, destacan el cambio de modificar manualmente cada discrepancia en la escritura del nombre del jugador/equipo entre bases de datos a una automatización del 95%, la reducción de la subjetividad en la identificación de valores atípicos y características a usar en el modelo. Adicionalmente, el modelo predictivo y la interfaz desarrollada permite a los usuarios utilizar la herramienta de manera intuitiva e interactiva. En conclusión, este proyecto representa una contribución significativa para mejorar la gestión de equipos mediante el uso de tecnología e IA. Sus implicaciones se extienden a toda la industria deportiva, ofreciendo una herramienta para la toma de decisiones transparentes.
Aquest treball s'enfoca a crear una eina que combini el futbol i la ciència de dades per a predir, utilitzant models d'Aprenentatge Automàtic, el rendiment dels jugadors en diferents contextos. El desenvolupament d'eines de suport per a observadors i directors esportius s'ha convertit en un objectiu primordial per a empreses del sector. L'objectiu d'aquest projecte és facilitar la presa de decisions en el procés de fitxatge de jugadors, a més d'identificar reemplaçaments òptims i flaqueses en comparació amb altres equips. Per a aconseguir-ho, es desenvolupen algorismes de comparació per a relacionar jugadors entre 5 bases de dades, tècniques de preprocessament de dades i models de Aprententatge Automàtic per a la predicció. També s'implementen algoritmes de similitud per a suggerir jugadors com a reemplaçament i IA Explicable per a transparentar les recomanacions. Els resultats dels models, l'anàlisi i la explicabilidad es mostren en una interfície web interactiva en Streamlit. Respecte als resultats, destaquen el canvi de modificar manualment cada discrepància en l'escriptura del nom del jugador/equip entre bases de dades a una automatització del 95%, la reducció de la subjectivitat en la identificació de valors atípics i característiques a usar en el model. Addicionalment, el model predictiu i la interfície desenvolupada permet als usuaris utilitzar l'eina de manera eficient. En conclusió, aquest projecte representa una contribució significativa per a millorar la gestió d'equips mitjançant l'ús de tecnologia i IA. Les seves implicacions s'estenen a tota la indústria esportiva, oferint una eina per a la presa de decisions transparents.
This work focuses on creating a tool that combines football and data science to predict, using Machine Learning models, the performance of players in different contexts. The development of support tools for scouts and sport managers has become a primary objective for companies in the sector. The aim of this project is to facilitate decision making in the process of signing players, as well as to identify optimal replacements and weaknesses in comparison to other teams. To achieve this, comparison algorithms are developed to relate players between 5 databases, data pre-processing techniques and Machine Learning models for prediction. Similarity algorithms are also implemented to suggest players as replacements and Explainable AI to make recommendations transparent. The results of the models, analysis and explainability are displayed in an interactive web interface in Streamlit. Regarding the results, the change from manually modifying every discrepancy in player/team name spelling between databases to 95% automation, the reduction of subjectivity in identifying outliers and features to be used in the model stand out. Additionally, the predictive model and the developed interface allows users to use the tool efficiently. In conclusion, this project represents a significant contribution to improving team management using technology and AI. Its implications extend to the entire sports industry, providing a tool for transparent decision making.Descripció
Tutora: Marina Palma Lorita
Grau en Enginyeria Matemàtica en Ciència de Dades. Treballs de Fi de Grau