Automatic image captioning for web accessibility as an Encoder-Decoder problem

Mostra el registre complet Registre parcial de l'ítem

  • dc.contributor.author Ramirez Garcia, Victor
  • dc.date.accessioned 2020-12-16T12:07:56Z
  • dc.date.available 2020-12-16T12:07:56Z
  • dc.date.issued 2020
  • dc.description Treball de fi de grau en Sistemes Audiovisualsca
  • dc.description Tutor: Juan Soler-Company
  • dc.description.abstract Automatic Image Description is one of the most signi cant problems in Arti cial Intelligence, which consists of text synthesis for describing visual scenes. One of its main applications is to assist blind people in accessing information by using screen readers. In this project, we will study di erent methodologies for the generation of descriptions, posing the task as a problem of text synthesis through an Encoder-Decoder architecture, while also developing a model that can accomplish it. Finally, we will implement a series of improvements (changes in the structure or the use of visual attention mechanisms) to the previous model. We will evaluate the results, showing that it is possible to imitate those of the State-of-the-Art.ca
  • dc.description.abstract La Descripció Automàtica d’Imatges és un dels problemes més destacats en Intel·ligència Artificial, el qual cosisteix en síntesi de text per descriure escenes visuals. Una de les seves principals aplicacions és l’assistència l’accés a la informació de persones amb ceguesa mitjançant l’ús de lectors de pantalla. En aquest Treball de Fi de Grau estudiarem diverses metodologies per la generació de descripcions, plantejant la tasca com a un problema de síntesi de text mitjançant una arquitectura de Codificador-Decodificador, així com també desenvoluparem un model que ho dugui a terme. Finalment, implementarem una sèrie de millores (canvis en l’estructura o ús de mecanismes d’atenció visual) respecte al model de referència i n’avaluarem els resultats, tot corroborant que és possible imitar els de l’estat de l’art.
  • dc.format.mimetype application/pdf*
  • dc.identifier.uri http://hdl.handle.net/10230/46067
  • dc.language.iso engca
  • dc.rights Reconeixement-NoComercial-SenseObraDerivada 4.0 Internacional (CC BY-NC-ND 4.0)ca
  • dc.rights.accessRights info:eu-repo/semantics/openAccessca
  • dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/4.0*
  • dc.title Automatic image captioning for web accessibility as an Encoder-Decoder problemca
  • dc.type info:eu-repo/semantics/bachelorThesisca