Expression control of singing voice synthesis: modeling pitch and dynamics with unit selection and statistical approaches

Umbert Morist, Martí

Expression control of singing voice synthesis: modeling pitch and dynamics with unit selection and statistical approaches

Mostra el registre complet Registre parcial de l'ítem

dc.contributor.author Umbert Morist, Martí
dc.contributor.other Bonada, Jordi
dc.contributor.other Serra, Xavier
dc.contributor.other Universitat Pompeu Fabra. Departament de Tecnologies de la Informació i les Comunicacions
dc.date.accessioned 2024-03-16T02:34:04Z
dc.date.available 2024-03-16T02:34:04Z
dc.date.issued 2016-03-03T10:07:19Z
dc.date.issued 2016-03-03T10:07:19Z
dc.date.issued 2016-01-29
dc.date.modified 2024-03-15T10:58:05Z
dc.description.abstract This thesis focuses on the control of a singing voice synthesizer to achieve natural expression similar to a real singer. There are many features that should be controlled to achieve natural expression related to melody, dynamics, rhythm, and timbre. In this thesis we focus on the control of pitch and dynamics with a unit selection-based system, two statistically-based systems, and a hybrid system. These systems are trained with two possible expression databases that we have designed, recorded, and labeled. We define the basic units from which the databases are built of, which are basically sequences of three notes or rests. Our perceptual evaluation compares the proposed systems with other systems to see how these relate to each other. The objective evaluation focuses on the algorithms efficiency.
dc.description.abstract Aquesta tesi es centra en el control dels sintetitzadors de veu cantada per aconseguir una expressivitat natural semblant a la d'un cantant real. Hi ha moltes característiques que s'haurien de controlar per aconseguir una expressivitat natural relacionades amb la melodia, la dinàmica, el ritme i el timbre. En aquesta tesi ens centrem en el control de la freqüència fonamental i de la dinàmica amb un sistema basat en selecció d'unitats, dos sistemes estadístics, i un sistema híbrid. Aquests sistemes són entrenats amb dues possibles bases de dades expressives que hem dissenyat, enregistrat i etiquetat. Hem definit les unitats bàsiques a partir de les quals les bases de dades s'han construit i que són seqüències de tres notes o silencis. La nostra avaluació perceptual compara els sistemes proposats amb altres sistemes per tal de veure com els podem relacionar. L'avaluació objectiva es centra en l'eficiència dels sistemes.
dc.description.abstract Programa de doctorat en Tecnologies de la Informació i les Comunicacions
dc.format 177 p.
dc.format application/pdf
dc.format application/pdf
dc.identifier http://hdl.handle.net/10803/361103
dc.identifier.uri http://hdl.handle.net/10230/25971
dc.language.iso eng
dc.publisher Universitat Pompeu Fabra
dc.rights L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc/3.0/es/
dc.rights http://creativecommons.org/licenses/by-nc/3.0/es/
dc.rights info:eu-repo/semantics/openAccess
dc.source TDX (Tesis Doctorals en Xarxa)
dc.subject.keyword Musical expression
dc.subject.keyword Synthesis control
dc.subject.keyword Singing voice
dc.subject.keyword Singing voice synthesis
dc.subject.keyword Expression control
dc.subject.keyword Pitch
dc.subject.keyword Dynamics
dc.subject.keyword Unit selection
dc.subject.keyword Statistical system
dc.subject.keyword Hidden Markov models
dc.subject.keyword HMM
dc.subject.keyword Naturalness
dc.subject.keyword Perceptual evaluation
dc.subject.keyword Expression contours
dc.subject.keyword Melody
dc.subject.keyword Rhythm
dc.subject.keyword Performance driven system
dc.subject.keyword Rule-based system
dc.subject.keyword Cost functions
dc.subject.keyword Vibrato
dc.subject.keyword Transition
dc.subject.keyword Sustain
dc.subject.keyword Note
dc.subject.keyword Labeling
dc.subject.keyword Attack
dc.subject.keyword Release
dc.subject.keyword Expressió musical
dc.subject.keyword Control de síntesi
dc.subject.keyword Veu cantada
dc.subject.keyword Síntesi de veu cantada
dc.subject.keyword Control d'expressivitat
dc.subject.keyword Dinàmica
dc.subject.keyword Sistema estadístic
dc.subject.keyword Models ocults de Markov
dc.subject.keyword Naturalitat
dc.subject.keyword Evaluació perceptual
dc.subject.keyword Contorns expressius
dc.subject.keyword Melodia
dc.subject.keyword Ritme
dc.subject.keyword Sistema guiat per la interpretació
dc.subject.keyword Sistema basat en regles
dc.subject.keyword Funcions de cost
dc.subject.keyword Transició
dc.subject.keyword Sosteniment
dc.subject.keyword Nota
dc.subject.keyword Etiquetatge
dc.subject.keyword Atac
dc.subject.keyword Extinció
dc.subject.keyword Selecció d'unitats
dc.subject.keyword 004
dc.subject.keyword 531/534
dc.subject.keyword 78
dc.title Expression control of singing voice synthesis: modeling pitch and dynamics with unit selection and statistical approaches
dc.type info:eu-repo/semantics/doctoralThesis
dc.type info:eu-repo/semantics/publishedVersion

Col·leccions

TDX