Welcome to the UPF Digital Repository

Humanitzant avatars: Generació automàtica de gestos a partir de la parla

Show simple item record

dc.contributor.author Riera Vuibert, Josep
dc.date.accessioned 2014-03-27T09:41:49Z
dc.date.available 2014-03-27T09:41:49Z
dc.date.issued 2013
dc.identifier.uri http://hdl.handle.net/10230/22188
dc.description Treball de fi de grau en Informàtica
dc.description Tutor: Mireia Farrús
dc.description.abstract Un dels problemes principals a l’hora de crear un avatar és combinar la veu i els gestos per tal d’obtenir expressions naturals i coherents. Aquest treball de fi de grau pretén aconseguir la generació automàtica de gestos a partir de la veu, garantint el màxim de correlació entre ells, per tal que l’avatar sigui el més natural possible./nPer al desenvolupament del projecte hem utilitzat una base de dades de converses etiquetades prosòdicament en format àudio i el programa NINOS que ens permet generar escenes audiovisuals, en el qual hem introduït els àudios assignant manualment gestos als mateixos. Les correlacions entre les característiques prosòdiques i els gestos corporals facials de les persones han servit de base per la generació automàtica de gestos a partir de la prosòdia amb tres mètodes diferents./nFinalment, hem avaluat els resultats mitjançant un test MOS, i hem demostrat que els mètodes d’aprenentatge automàtic proporcionen millors resultats que els mètodes d’assignació aleatoris.
dc.description.abstract One of the main challenges of creating an avatar is to combine voice and gestures in a consistent manner to get natural and coherent expressions. The objective of this final project is to automatically generate gestures based on the voice, maximizing the correlation between them so that the avatar is as natural as possible./nDuring the project development we used a database of prosodically labeled conversations in audio format using NINOS; a program that allows generating visual scenes in which we manually introduced the sounds and then assigned gestures accordingly. The correlations between the individual’s prosodic features and facial gestures provided the basis for the automatic generation of prosody-based gestures with three different methods./nFinally, we evaluated the results using a MOS test, and we demonstrated that machine learning methods provide better results than random allocation methods.
dc.format.mimetype application/pdf
dc.language.iso cat
dc.rights Aquest document està subjecte a una llicència Creative Commons
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/es/
dc.subject.other Tractament del llenguatge natural (Informàtica)
dc.subject.other Aprenentatge automàtic
dc.title Humanitzant avatars: Generació automàtica de gestos a partir de la parla
dc.type info:eu-repo/semantics/bachelorThesis
dc.rights.accessRights info:eu-repo/semantics/openAccess


This item appears in the following Collection(s)

Show simple item record

Search DSpace


Advanced Search

Browse

My Account

Statistics

Compliant to Partaking