Data-driven pitch content description of choral singing recordings
Mostra el registre complet Registre parcial de l'ítem
- dc.contributor.author Cuesta, Helena
- dc.contributor.other Gómez Gutiérrez, Emilia
- dc.contributor.other Universitat Pompeu Fabra. Departament de Tecnologies de la Informació i les Comunicacions
- dc.date.accessioned 2024-03-16T02:34:13Z
- dc.date.available 2024-03-16T02:34:13Z
- dc.date.issued 2022-03-28T14:55:30Z
- dc.date.issued 2022-03-28T14:55:30Z
- dc.date.issued 2022-03-21
- dc.date.modified 2024-03-15T10:58:06Z
- dc.description.abstract Ensemble singing is a well-established practice across cultures, found in a great diversity of forms, languages, and levels. However, it has not been widely studied in the field of Music Information Retrieval (MIR), likely due to the lack of appropriate data. In this dissertation, we first address the data scarcity by building new open, multi-track datasets of ensemble singing. Then, we address three main research problems: multiple F0 estimation and streaming, voice assignment, and the characterization of vocal unisons, all in the context of four-part vocal ensembles. Hence, the first contribution of this thesis is the development and release of four multi-track datasets of vocal ensembles: Choral Singing Dataset, Dagstuhl ChoirSet, ESMUC Choir Dataset, and Cantoría Dataset, all of them with audio recordings and accompanying annotations. The second contribution is a set of deep learning models for multiple F0 estimation, streaming, and voice assignment of vocal quartets, mainly based on convolutional neural networks designed leveraging music domain knowledge. Finally, we propose two methods to characterize vocal unison performances in terms of pitch dispersion.
- dc.description.abstract Cantar en un conjunt vocal és una activitat arrelada a moltes cultures i que es desenvolupa en diversos formats, idiomes i nivells. Tanmateix, la falta de les dades adequades ha fet que no s’hagi estudiat extensivament en el camp de la Recuperació de la Informació Musical (MIR). En aquesta tesi, primer abordem l’escassetat de dades creant noves bases de dades obertes amb gravacions multi-pista de conjunts vocals. Tot seguit, ens centrem principalment en tres tasques d'investigació: estimació i seguiment de múltiples valors de F0, assignació de veus i modelat d’unísons, totes en el context de grups vocals a quatre veus. Per tant, la primera aportació d’aquesta tesi és la publicació de quatre bases de dades amb enregistraments de conjunts vocals: Choral Singing Dataset, Dagstuhl ChoirSet, ESMUC Choir Dataset i Cantoría Dataset, totes amb enregistraments d’àudio multi-pista i anotacions. La segona aportació d’aquesta tesi és un conjunt de models d’aprenentatge profund per l’estimació i el seguiment de múltiples valors de F0 i per l’assignació de veus en quartets vocals, principalment basats en xarxes neuronals convolucionals dissenyades per incorporar coneixement musical. Finalment, proposem dos mètodes per modelar i caracteritzar unísons vocals en termes de dispersió d’altura tonal (pitch).
- dc.description.abstract Programa de doctorat en Tecnologies de la Informació i les Comunicacions
- dc.format 275 p.
- dc.format application/pdf
- dc.format application/pdf
- dc.identifier http://hdl.handle.net/10803/673924
- dc.identifier.uri http://hdl.handle.net/10230/52797
- dc.language.iso eng
- dc.publisher Universitat Pompeu Fabra
- dc.rights L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-sa/4.0/
- dc.rights http://creativecommons.org/licenses/by-nc-sa/4.0/
- dc.rights info:eu-repo/semantics/openAccess
- dc.source TDX (Tesis Doctorals en Xarxa)
- dc.subject.keyword Singing
- dc.subject.keyword Choral singing
- dc.subject.keyword Vocal music
- dc.subject.keyword Multi-pitch estimation
- dc.subject.keyword Voice assignment
- dc.subject.keyword Open data
- dc.subject.keyword Unison
- dc.subject.keyword MIR
- dc.subject.keyword Automatic music transcription
- dc.subject.keyword Cant
- dc.subject.keyword Cant coral
- dc.subject.keyword Música vocal
- dc.subject.keyword Estimació de múltiples freqüències
- dc.subject.keyword Assignació de veus
- dc.subject.keyword Dades obertes
- dc.subject.keyword Uníson
- dc.subject.keyword Transcripció automàtica de música
- dc.subject.keyword 62
- dc.title Data-driven pitch content description of choral singing recordings
- dc.type info:eu-repo/semantics/doctoralThesis
- dc.type info:eu-repo/semantics/publishedVersion