Structural analysis and segmentation of music signals

Enllaç permanent

Descripció

  • Resum

    Con la reciente explosión cuantitativa de bibliotecas y colecciones de música en formato<br/>digital, la descripción del contenido desempeña un papel fundamental para una gestión y<br/>búsqueda eficientes de archivos de audio. La presente tesis doctoral pretende hacer un<br/>análisis automático de la estructura de piezas musicales a partir del análisis de una<br/>grabación, es decir, extraer una descripción estructural a partir de señales musicales<br/>polifónicas. En la medida en que la repetición y transformación de la estructura de la<br/>música genera una identificación única de una obra musical, extraer automáticamente<br/>esta información puede vincular entre sí descripciones de bajo y alto nivel de una señal<br/>musical y puede proporcionar al usuario una manera más efectiva de interactuar con un<br/>contenido de audio. Para algunas aplicaciones basadas en contenido, encontrar los límites<br/>de determinados segmentos de una grabación resulta indispensable. Así pues, también se<br/>investiga la segmentación temporal de audio a nivel semántico, al igual que la<br/>identificación de extractos representativos de una señal musical que pueda servir como<br/>resumen de la misma. Para ello se emplea una técnica de análisis a un nivel de<br/>abstracción más elevado que permite obtener una mejor división en segmentos. Tanto<br/>desde el punto de vista teórico como práctico, esta investigación no sólo ayuda a<br/>incrementar nuestro conocimiento respecto a la estructura musical, sino que también<br/>proporciona una ayuda al examen y a la valoración musical.
    With the recent explosion in the quantity of digital audio libraries and databases, content<br/>descriptions play an important role in efficiently managing and retrieving audio files.<br/>This doctoral research aims to discover and extract structural description from<br/>polyphonic music signals. As repetition and transformations of music structure creates a<br/>unique identity of music itself, extracting such information can link low-level and higherlevel<br/>descriptions of music signal and provide better quality access plus powerful way of<br/>interacting with audio content. Finding appropriate boundary truncations is indispensable<br/>in certain content-based applications. Thus, temporal audio segmentation at the semantic<br/>level and the identification of representative excerpts from music audio signal are also<br/>investigated. We make use of higher-level analysis technique for better segment<br/>truncation. From both theoretical and practical points of view, this research not only<br/>helps in increasing our knowledge of music structure but also facilitates in time-saving<br/>browsing and assessing of music.
    Programa de doctorat en Tecnologies de la Informació i les Comunicacions
  • Director i departament

    Serra, Xavier, Universitat Pompeu Fabra. Departament de Tecnologia
  • Col·leccions

  • Mostra el registre complet