Show simple item record

dc.contributor.author Casanovas Pérez, Èric
dc.date.accessioned 2023-10-03T15:30:13Z
dc.date.available 2023-10-03T15:30:13Z
dc.date.issued 2023-10-03
dc.identifier.uri http://hdl.handle.net/10230/58030
dc.description Treball de fi de grau en Informàtica. Tutor: Horacio Saggion
dc.description.abstract Durante los últimos años, ha habido un notable desarrollo de las tecnologías de procesamiento del lenguaje natural para diversas tareas como la clasificación de textos, extracción de información y generación automática de lenguaje natural, por mencionar algunas. Sin embargo, el problema de detectar lenguaje figurado como la ironía no ha recibido tanta atención por parte de la comunidad científica. En este trabajo de fin de grado, proponemos el desarrollo de un modelo de procesamiento del lenguaje natural con el objetivo de detectar la presencia de ironía en textos en español. Para lograr esto, hemos adoptado una metodología de aprendizaje supervisado basada en redes neuronales transformadoras y la técnica conocida como fine-tuning. Específicamente, nos basamos en el modelo publicado por Google en 2018 llamado BERT. Los datos utilizados para entrenar el modelo forman parte del conjunto de datos proporcionado por los organizadores de IroSvA 2019, una de las tareas más recientes para detectar ironía en variantes del español que involucró a varias universidades. Además, analizamos la capacidad de nuestro sistema para detectar ironía en un conjunto de datos recién consolidado con la ayuda de dos expertos en lenguaje figurado. Los resultados obtenidos demuestran la efectividad de este modelo en la detección de ironía en español y pueden abrir el camino para futuras investigaciones en el campo.
dc.description.abstract Durant els últims anys, s'ha produït un notable desenvolupament de les tecnologies de processament del llenguatge natural per a diverses tasques com la classificació de textos, l'extracció d'informació i la generació automàtica de llenguatge natural, per citar-ne algunes. No obstant això, el problema de detectar llenguatge figurat com la ironia no ha rebut tanta atenció per part de la comunitat científica. En aquest treball de fi de grau, proposem el desenvolupament d'un model de processament del llenguatge natural amb l'objectiu de detectar la presència d'ironia a textos en espanyol. Per aconseguir-ho, hem adoptat una metodologia d'aprenentatge supervisat basada en xarxes neuronals transformadores i la tècnica ben coneguda com a fine-tuning. Específicament, ens basem en el model publicat per Google el 2018 anomenat BERT. Les dades utilitzades per entrenar el model formen part del conjunt de dades proporcionat pels organitzadors de l'IroSvA 2019, una de les tasques més recents per detectar ironia en variants de l'espanyol que va implicar diverses universitats. A més, analitzem la capacitat del nostre sistema per detectar ironia en un conjunt de dades recentment consolidat amb l'ajuda de dos experts en llenguatge figurat. Els resultats obtinguts demostren l'efectivitat d'aquest model en la detecció d'ironia en espanyol i poden obrir el camí per a futures investigacions en el camp.
dc.description.abstract In recent years, there has been a notable development of natural language processing technologies for various tasks such as text classification, information extraction, and automatic natural language generation, to name a few. However, the problem of detecting figurative language like irony has not received as much attention from the scientific community. In this undergraduate thesis, we propose the development of a natural language processing model with the objective of detecting the presence of irony in Spanish text. To accomplish this, we have adopted a supervised learning methodology based on transformer neural networks and the well-known fine-tuning technique. Specifically, we build upon the model published by Google in 2018 called BERT. The data used to train the model is part of the dataset provided by the organizers of IroSvA 2019, one of the most recent tasks for detecting irony in Spanish variants that involved several universities. Additionally, we analyze the capability of our system to detect irony in a newly consolidated dataset with the assistance of two experts in figurative language. The obtained results demonstrate the effectiveness of this model in detecting irony in Spanish and can pave the way for future research in the field.
dc.format.mimetype application/pdf
dc.language.iso spa
dc.rights Llicència CC Reconeixement-NoComercial-SenseObraDerivada 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.uri https://creativecommons.org/licenses/by-nc-nd/4.0/deed.ca
dc.title Detección de ironía en el texto en espanyol
dc.type info:eu-repo/semantics/bachelorThesis
dc.rights.accessRights info:eu-repo/semantics/openAccess

Thumbnail

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Advanced Search

Browse

My Account

Statistics

In collaboration with Compliant to Partaking