Segmentació de locutor per a la indexació automàtica de bases de dades multimèdia en català

Citació

  • Anguera X, Farrús M, Hernando J. Segmentació de locutor per a la indexació automàtica de bases de dades multimèdia en català. Comunicació presentada a: Actes del II Congrés d'Enginyeria en Llengua Catalana; 2004 nov 19-21; Andorra. 5 p.

Enllaç permanent

Descripció

  • Resum

    L'evolució de la societat de la informació ha esdevingut un incessant increment de continguts audiovisuals que s’emeten constantment en cadenes de televisió i emissores de radio locals i nacionals en llengua catalana. Aquestes emissions normalment s'arxiven en bases de dades multimèdia per tal de poder ser consultades posteriorment, però degut a la gran quantitat de dades emmagatzemades resulta difícil, si no impossible, i molt costós poder accedir a aquesta informació. Amb aquesta comunicació pretenem donar a conèixer les tècniques existents actualment d'indexació automàtica de material sonor en les quals estem treballant en el departament de Teoria del Senyal i Comunicacions de la UPC. Mitjançant una indexació automàtica de les bases de dades és possible realitzar cerques concretes i recuperar documents molt més ràpidament. Mostrem especial èmfasi en el cas de la indexació de la identitat de les persones que apareixen a la base de dades, i en quin interval de temps parlen. Presentem una mesura anomenada XBIC per detectar els canvis de locutor dins d'un senyal de veu, creada dins del nostre grup. Es mostren resultats d'aquesta nova tècnica sobre una base de dades recollida en llengua catalana.
  • Descripció

    Comunicació presentada a: II Congrés d'Enginyeria en Llengua Catalana, celebrat a Andorra del 19 al 21 de novembre de 2004.
  • Mostra el registre complet