Welcome to the UPF Digital Repository

The Information structure-prosody interface: on the role of hierarchical thematicity in an empirically-grounded model

Show simple item record

dc.contributor.author Domínguez Bajo, Mónica
dc.contributor.other Wanner, Leo
dc.contributor.other Farrús, Mireia
dc.contributor.other Universitat Pompeu Fabra. Departament de Tecnologies de la Informació i les Comunicacions
dc.date.accessioned 2024-03-16T02:34:56Z
dc.date.available 2024-03-16T02:34:56Z
dc.date.issued 2017-11-24T11:51:16Z
dc.date.issued 2017-11-24T11:51:16Z
dc.date.issued 2017-11-17
dc.identifier http://hdl.handle.net/10803/457143
dc.identifier.uri http://hdl.handle.net/10230/33358
dc.description.abstract This dissertation presents an empirical study on the information structure– prosody interface based on: (i) a formal description of hierarchical thematicity within a systematic language model for natural language generation within the Meaning-Text Theory; and (ii) two approaches to prosodic representation, namely, ToBI labels and acoustic parameters. A corpus of read speech by twelve native speakers of American English is used to test the viability to approach prosody generation in synthesized speech from a communicative perspective. To this end, statistical, classification and implementation experiments are carried out. The main technical contribution consists in two tools: a data-driven module for thematicitybased prosody enrichment in a speech synthesizer and an automatic prosody tagger developed under an extension of Praat for feature annotation. Results prove that thematicity spans have distinct prosodic characteristics, as previously suggested in theoretical studies, and that a tripartite hierarchical thematicity is a more appropriate representation of information structure than traditional binary flat thematicity approaches for its integration in speech technologies.
dc.description.abstract Esta tesis presenta un estudio empírico de la interfaz estructura informativa– prosodia basado en: (i) una descripción formal de la tematicidad jerárquica que se enmarca en un modelo del lenguaje sistemático para la generación automática del lenguaje natural dentro del marco de la Teoría Sentido-Texto; y (ii) dos representaciones prosódicas utilizando etiquetas ToBI y parámetros acústicos. Se emplea un corpus de habla leída por doce hablantes nativos de inglés americano para comprobar la validez de la generación de prosodia en síntesis de voz a partir de características comunicativas. Con este objectivo, se presentan experimentos estadísticos, de clasificación y de implementación. La principal contribución técnica consiste en dos herramientas: un módulo basado en datos para el enriquecimiento prosódico de voz sintética a partir de la tematicidad y un etiquetador automático de prosodia implementado en una extensión de Praat para la anotación de características lingüísticas. Los resultados demuestran que los segmentos de tematicidad están caracterizados por rasgos prosódicos distintivos, como se había sugerido en estudios teóricos previos y que la tematicidad tripartita jerárquica es una representación más adecuada de la estructura informativa que las anteriores propuestas tradicionales de tematicidad binaria plana para su integración en las tecnologías del habla.
dc.description.abstract Programa de doctorat en Tecnologies de la Informació i les Comunicacions
dc.format 193 p.
dc.format application/pdf
dc.format application/pdf
dc.language.iso eng
dc.publisher Universitat Pompeu Fabra
dc.rights L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights info:eu-repo/semantics/openAccess
dc.source TDX (Tesis Doctorals en Xarxa)
dc.title The Information structure-prosody interface: on the role of hierarchical thematicity in an empirically-grounded model
dc.type info:eu-repo/semantics/doctoralThesis
dc.type info:eu-repo/semantics/publishedVersion
dc.date.modified 2024-03-15T10:58:01Z
dc.subject.keyword Information structure
dc.subject.keyword Communicative structure
dc.subject.keyword Thematicity
dc.subject.keyword Theme
dc.subject.keyword Rheme
dc.subject.keyword Prosody
dc.subject.keyword ToBI
dc.subject.keyword Acoustic parameters
dc.subject.keyword Speech synthesis
dc.subject.keyword TTS
dc.subject.keyword Text-to-speech
dc.subject.keyword CTS
dc.subject.keyword Concept-to-speech
dc.subject.keyword Automatic prosody labeling
dc.subject.keyword Estructura informativa
dc.subject.keyword Estructura comunicativa
dc.subject.keyword Tematicidad
dc.subject.keyword Tema
dc.subject.keyword Rema
dc.subject.keyword Prosodia
dc.subject.keyword Parámetros acústicos
dc.subject.keyword Síntesis de voz
dc.subject.keyword Texto a habla
dc.subject.keyword Concepto a habla
dc.subject.keyword Etiquetado automático de prosodia
dc.subject.keyword 62


Files in this item

Files Size Format View

There are no files associated with this item.

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Advanced Search

Browse

My Account

Statistics

In collaboration with Compliant to Partaking