Arquitectura de clasificación automática de géneros musicales basada en el modelo SIMCA

Enllaç permanent

Descripció

  • Resum

    En este proyecto, se presenta una nueva arquitectura de datos para la clasificación automática de géneros musicales basada en contenido aplicando el modelo Soft Independent Modelling Of Class Analogies (SIMCA). En concreto, se pretende estructurar la información de entrada para generar clasificadores individuales y especializados en cada género musical. De este modo, son capaces de discernir entre lo que corresponde a su propio género y lo que no, creando una arquitectura de clasificación por descarte. Para ello, se parte de la colección de géneros musicales propuesta por George Tzanetakis para extraer características de audio digital utilizando técnicas de Recuperación de Información Musical (MIR) y aplicar modelos de optimización datos basados en Análisis de Componentes Principales (PCA). Finalmente, se realiza el entrenamiento y testeo aplicando técnicas de clasificación supervisada para comparar el nuevo modelo frente al actual y enfrentarlo a bases de datos externas al proceso de clasificación. Esta nueva arquitectura y la convencional, se han realizado en su totalidad en código Python, mediante herramientas de extracción de características a través de Sonic Annotator y el soporte del programa de aprendizaje automático y minería de datos Weka.
    In this project, a new data architecture for the automatic classification of musical genres based on content applying Soft Independent Modelling Of Class Analogies (SIMCA) model is presented. Specifically, it is intended to structure the input information to generate individual and specialized classifiers in each musical genre. In this way they can discern between what corresponds to their own genre and what does not, creating an architecture of classification by discarding. To do this, it starts from the database classified by George Tzanetakis to extract digital audio features using Music Information Retreival (MIR) techniques and apply data optimization models based on Principal Component Analysis (PCA). Finally, train and test phases are carried out applying supervised classification techniques to compare the new model with the current one and confront it to databases external to the classification process. This new architecture and the conventional one, have been made entirely in Python code, through feature extraction tools using Sonic Anotator and the support of automatic learning and data mining program Weka.
  • Descripció

    Treball de fi de grau en informàtica
    Tutor: Enric Guaus
  • Mostra el registre complet