Expression control of singing voice synthesis: modeling pitch and dynamics with unit selection and statistical approaches

Mostra el registre complet Registre parcial de l'ítem

  • dc.contributor.author Umbert Morist, Martí
  • dc.contributor.other Bonada, Jordi
  • dc.contributor.other Serra, Xavier
  • dc.contributor.other Universitat Pompeu Fabra. Departament de Tecnologies de la Informació i les Comunicacions
  • dc.date.accessioned 2024-03-16T02:34:04Z
  • dc.date.available 2024-03-16T02:34:04Z
  • dc.date.issued 2016-03-03T10:07:19Z
  • dc.date.issued 2016-03-03T10:07:19Z
  • dc.date.issued 2016-01-29
  • dc.date.modified 2024-03-15T10:58:05Z
  • dc.description.abstract This thesis focuses on the control of a singing voice synthesizer to achieve natural expression similar to a real singer. There are many features that should be controlled to achieve natural expression related to melody, dynamics, rhythm, and timbre. In this thesis we focus on the control of pitch and dynamics with a unit selection-based system, two statistically-based systems, and a hybrid system. These systems are trained with two possible expression databases that we have designed, recorded, and labeled. We define the basic units from which the databases are built of, which are basically sequences of three notes or rests. Our perceptual evaluation compares the proposed systems with other systems to see how these relate to each other. The objective evaluation focuses on the algorithms efficiency.
  • dc.description.abstract Aquesta tesi es centra en el control dels sintetitzadors de veu cantada per aconseguir una expressivitat natural semblant a la d'un cantant real. Hi ha moltes característiques que s'haurien de controlar per aconseguir una expressivitat natural relacionades amb la melodia, la dinàmica, el ritme i el timbre. En aquesta tesi ens centrem en el control de la freqüència fonamental i de la dinàmica amb un sistema basat en selecció d'unitats, dos sistemes estadístics, i un sistema híbrid. Aquests sistemes són entrenats amb dues possibles bases de dades expressives que hem dissenyat, enregistrat i etiquetat. Hem definit les unitats bàsiques a partir de les quals les bases de dades s'han construit i que són seqüències de tres notes o silencis. La nostra avaluació perceptual compara els sistemes proposats amb altres sistemes per tal de veure com els podem relacionar. L'avaluació objectiva es centra en l'eficiència dels sistemes.
  • dc.description.abstract Programa de doctorat en Tecnologies de la Informació i les Comunicacions
  • dc.format 177 p.
  • dc.format application/pdf
  • dc.format application/pdf
  • dc.identifier http://hdl.handle.net/10803/361103
  • dc.identifier.uri http://hdl.handle.net/10230/25971
  • dc.language.iso eng
  • dc.publisher Universitat Pompeu Fabra
  • dc.rights L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc/3.0/es/
  • dc.rights http://creativecommons.org/licenses/by-nc/3.0/es/
  • dc.rights info:eu-repo/semantics/openAccess
  • dc.source TDX (Tesis Doctorals en Xarxa)
  • dc.subject.keyword Musical expression
  • dc.subject.keyword Synthesis control
  • dc.subject.keyword Singing voice
  • dc.subject.keyword Singing voice synthesis
  • dc.subject.keyword Expression control
  • dc.subject.keyword Pitch
  • dc.subject.keyword Dynamics
  • dc.subject.keyword Unit selection
  • dc.subject.keyword Statistical system
  • dc.subject.keyword Hidden Markov models
  • dc.subject.keyword HMM
  • dc.subject.keyword Naturalness
  • dc.subject.keyword Perceptual evaluation
  • dc.subject.keyword Expression contours
  • dc.subject.keyword Melody
  • dc.subject.keyword Rhythm
  • dc.subject.keyword Performance driven system
  • dc.subject.keyword Rule-based system
  • dc.subject.keyword Cost functions
  • dc.subject.keyword Vibrato
  • dc.subject.keyword Transition
  • dc.subject.keyword Sustain
  • dc.subject.keyword Note
  • dc.subject.keyword Labeling
  • dc.subject.keyword Attack
  • dc.subject.keyword Release
  • dc.subject.keyword Expressió musical
  • dc.subject.keyword Control de síntesi
  • dc.subject.keyword Veu cantada
  • dc.subject.keyword Síntesi de veu cantada
  • dc.subject.keyword Control d'expressivitat
  • dc.subject.keyword Dinàmica
  • dc.subject.keyword Sistema estadístic
  • dc.subject.keyword Models ocults de Markov
  • dc.subject.keyword Naturalitat
  • dc.subject.keyword Evaluació perceptual
  • dc.subject.keyword Contorns expressius
  • dc.subject.keyword Melodia
  • dc.subject.keyword Ritme
  • dc.subject.keyword Sistema guiat per la interpretació
  • dc.subject.keyword Sistema basat en regles
  • dc.subject.keyword Funcions de cost
  • dc.subject.keyword Transició
  • dc.subject.keyword Sosteniment
  • dc.subject.keyword Nota
  • dc.subject.keyword Etiquetatge
  • dc.subject.keyword Atac
  • dc.subject.keyword Extinció
  • dc.subject.keyword Selecció d'unitats
  • dc.subject.keyword 004
  • dc.subject.keyword 531/534
  • dc.subject.keyword 78
  • dc.title Expression control of singing voice synthesis: modeling pitch and dynamics with unit selection and statistical approaches
  • dc.type info:eu-repo/semantics/doctoralThesis
  • dc.type info:eu-repo/semantics/publishedVersion

Col·leccions