Lip-reading visual passwords for user authentication

Enllaç permanent

Descripció

  • Resum

    The important role that technologies have in our day-to-day life makes us aware that security is in the spotlight. Biometric-based authentication methods provide a safer alternative to traditional PIN passwords since they evaluate who you are and not what you know. We propose a visual password for user authentication based on automatic lip-reading. The result of a lip-reading system is a double password, in one hand, the word detection, and in the other, the speaker recognition. The approach we develop in order to achieve this double recognition is based on Hidden Markov Models and Gaussian Mixture Models, the features chosen as the input of the system are Discrete Cosine Transform coefficients of a spoken word video frames. The results obtained in this project show an approximate 15% of general recognition error. However, most of this error comes from word recognition, which results to be suboptimal, while speaker recognition is successfully achieved with errors below 4.23%.
    Degut al paper que juguen les tecnologies en el nostre dia a dia, cada cop estem més conscienciats pel que fa la seguretat en les nostres dades personals. Això ens porta a la cerca de metodes d’autentificació d’usuaris alternatius i més segurs a les tradicionals contrasenyes PIN, com l’autentificacio basada en paràmetres biomètrics, que avaluen qui es l’usuari enlloc de què sap. En aquest projecte es proposa una contrasenya visual per a la identificació d’usuaris basada en la lectura de llavis automàtica. El resultat d’aquest tipus de contrasenya visual es una doble clau d’accés, d’una banda, la detecció de paraula, i per l’altra, el reconeixement d’usuari. El sistema que es proposa esta basat en Models Ocults de Markov i Models de Mescles Gaussianes, i com a característiques dels vídeos dels usuaris i paraules, entrada al sistema, els coeficients de la Transformada Discreta de Fourier dels diferents fotogrames. Els resultats obtinguts revelen un error en general del 15%. Tot i així, la gran majoria d’aquest error es deguda al reconeixement de paraula, ja que s’ha mostrat insuficient, mentre que el reconeixement d’usuari ha demostrat ser molt eficaç amb un error del 4.23%.
  • Descripció

    Treball de fi de grau en informàtica
    Tutors: Federico Mateo Sukno, Adriana Fernández
  • Mostra el registre complet