Welcome to the UPF Digital Repository

Análisis de la producción de fonemas vocálicos para su aplicación en la animación de avatares

Show simple item record

dc.contributor.author Belda Montes, Ferran
dc.date.accessioned 2015-12-10T11:38:43Z
dc.date.available 2015-12-10T11:38:43Z
dc.date.issued 2015-12-10
dc.identifier.uri http://hdl.handle.net/10230/25364
dc.description Treball de fi de grau en Sistemes Audiovisuals
dc.description Tutor: Xavier Binefa
dc.description.abstract El estudio realizado en este proyecto se basa en el análisis del movimiento de los labios de la cara a la hora de pronunciar fonemas vocálicos con el propósito de estudiar la manera de ofrecer más realismo en la animación de avatares utilizando la técnica "face transfer". Para efectuar dicho análisis se ha empleado Kinect que ha servido para capturar la imagen en color RGB y el mapa de profundidad de la escena. Primero se utilizan las imágenes RGB capturadas durante la pronunciación de los diferentes fonemas y, por medio de un algoritmo del estado del arte para localizar los puntos característicos faciales, se analiza su evolución en el espacio 2D para conocer su comportamiento durante la pronunciación de los fonemas vocálicos. Los datos de profundidad permiten estudiar la evolución de los puntos en las coordenadas XYZ para, finalmente, generar una malla en 3D que permite visualizar las diferencias entre los 5 fonemas vocálicos.
dc.description.abstract The research that I have done in this project is based on analyzing the movement of the/nlips of the face when pronouncing vowel sounds in order to study how to offer more/nrealism in animated avatars using face transfer technology./nIn order to perform this analysis I have used Kinect camera to capture the image in RGB/ncolour as well as the depth map of the scene./nFirst I have used captured RGB images while I was pronouncing the different/nphonemes and, using an algorithm of the state of art to locate facial feature points, I/nhave analyze its evolution in the 2D space to know their behavior during the/npronunciation of vowel phonemes. From the depth data I have been able to study the/nevolution of the XYZ coordinate points and finally I have generated a 3D mesh that lets/nme visualize the differences among the 5 vowel phonemes
dc.format.mimetype application/pdf
dc.language.iso spa
dc.rights Attribution-NonCommercial-NoDerivs 3.0 Spain
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/es/
dc.subject.other Reconeixement de la cara humana (Informàtica)
dc.title Análisis de la producción de fonemas vocálicos para su aplicación en la animación de avatares
dc.type info:eu-repo/semantics/bachelorThesis
dc.subject.keyword Face transfer
dc.subject.keyword Kinect
dc.subject.keyword Mapa de profundidad
dc.subject.keyword Puntos faciales característicos
dc.subject.keyword Análisis fonético
dc.subject.keyword RGB
dc.subject.keyword Depthmap
dc.subject.keyword Facial keypoints
dc.subject.keyword Speech analysis
dc.rights.accessRights info:eu-repo/semantics/openAccess

Thumbnail
Icon

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Advanced Search

Browse

My Account

Statistics

In collaboration with Compliant to Partaking