Automatic trimming and scene matching in football videos

Mostra el registre complet Registre parcial de l'ítem

  • dc.contributor.author Soler Gonzàlez , Oriol
  • dc.date.accessioned 2025-10-09T18:28:56Z
  • dc.date.available 2025-10-09T18:28:56Z
  • dc.date.issued 2025
  • dc.description Tutor: Artur Díaz Juan
  • dc.description Treball de fi del grau en Grau en Enginyeria en Sistemes Audiovisuals
  • dc.description.abstract Football has established itself as one of the world’s most popular sports, and with today’s media consumption trends, there is increasing demand for accessible and targeted video content. In this thesis we present a first step toward developing an automatic video summarization tool for football matches. We create a tool to facilitate the creation of annotated datasets, essential for training and evaluating summarization models. The annotation process involves two steps: segmenting the summary into a set of shots and mapping each shot to its corresponding segment in the full game footage. To address these challenges, we explores state-of-the-art models for shot segmentation and scene matching. We propose a shot detection stage using TransNetV2, while in the matching stage we propose a backbone comparison using both 2D and 3D feature descriptors. The dataset we work with includes games from three major European leagues —Serie A, La Liga, and Ligue 1 — allowing for evaluation across diverse annotation styles and game formats.ENG
  • dc.description.abstract El futbol s’ha consolidat com un dels esports més populars del món, i amb les tendències actuals en el consum de mitjans, hi ha una demanda creixent de contingut audiovisual accessible i específic. Aquesta tesi és un primer pas per desenvolupar una eina automàtica de resum de vídeos de partit de futbol. Es centra en construir una eina que faciliti la creació de datasets anotats, essencials per entrenar i evaluar models de resum. El procés d’anotació inclou dos passos: segmentar el resum en fragments individuals i assignar cada fragment al segment corresponent en la gravació completa del partit. Per abordar aquests reptes, el treball explora models d’última generació per a la segmentació de fragments i la correspondència d’escenes. La detecció de fragments es fa amb TransNetV2, mentre que la correspondència s’avalua amb descriptors 2 i 3D i diferents arquitectures backbone. El dataset amb que es treballa inclou partits de tres de les principals lligues europees — Serie A, La Liga i Ligue 1 —, fet que permet una avaluació en estils d’anotació i formats de partit diversos.CAT
  • dc.identifier.uri http://hdl.handle.net/10230/71464
  • dc.language.iso eng
  • dc.rights  Llicència CC Reconeixement-CompartirIgual 4.0 Internacional (CC BY-SA 4.0)
  • dc.rights.accessRights info:eu-repo/semantics/openAccess
  • dc.rights.uri https://creativecommons.org/licenses/by-sa/4.0/
  • dc.subject.other Futbol
  • dc.title Automatic trimming and scene matching in football videos
  • dc.type info:eu-repo/semantics/bachelorThesis