Detección de ironía en el texto en espanyol

Casanovas Pérez, Èric

Detección de ironía en el texto en espanyol

Permanent Link

http://hdl.handle.net/10230/58030

Description

Abstract
Durante los últimos años, ha habido un notable desarrollo de las tecnologías de procesamiento del lenguaje natural para diversas tareas como la clasificación de textos, extracción de información y generación automática de lenguaje natural, por mencionar algunas. Sin embargo, el problema de detectar lenguaje figurado como la ironía no ha recibido tanta atención por parte de la comunidad científica. En este trabajo de fin de grado, proponemos el desarrollo de un modelo de procesamiento del lenguaje natural con el objetivo de detectar la presencia de ironía en textos en español. Para lograr esto, hemos adoptado una metodología de aprendizaje supervisado basada en redes neuronales transformadoras y la técnica conocida como fine-tuning. Específicamente, nos basamos en el modelo publicado por Google en 2018 llamado BERT. Los datos utilizados para entrenar el modelo forman parte del conjunto de datos proporcionado por los organizadores de IroSvA 2019, una de las tareas más recientes para detectar ironía en variantes del español que involucró a varias universidades. Además, analizamos la capacidad de nuestro sistema para detectar ironía en un conjunto de datos recién consolidado con la ayuda de dos expertos en lenguaje figurado. Los resultados obtenidos demuestran la efectividad de este modelo en la detección de ironía en español y pueden abrir el camino para futuras investigaciones en el campo.
Durant els últims anys, s'ha produït un notable desenvolupament de les tecnologies de processament del llenguatge natural per a diverses tasques com la classificació de textos, l'extracció d'informació i la generació automàtica de llenguatge natural, per citar-ne algunes. No obstant això, el problema de detectar llenguatge figurat com la ironia no ha rebut tanta atenció per part de la comunitat científica. En aquest treball de fi de grau, proposem el desenvolupament d'un model de processament del llenguatge natural amb l'objectiu de detectar la presència d'ironia a textos en espanyol. Per aconseguir-ho, hem adoptat una metodologia d'aprenentatge supervisat basada en xarxes neuronals transformadores i la tècnica ben coneguda com a fine-tuning. Específicament, ens basem en el model publicat per Google el 2018 anomenat BERT. Les dades utilitzades per entrenar el model formen part del conjunt de dades proporcionat pels organitzadors de l'IroSvA 2019, una de les tasques més recents per detectar ironia en variants de l'espanyol que va implicar diverses universitats. A més, analitzem la capacitat del nostre sistema per detectar ironia en un conjunt de dades recentment consolidat amb l'ajuda de dos experts en llenguatge figurat. Els resultats obtinguts demostren l'efectivitat d'aquest model en la detecció d'ironia en espanyol i poden obrir el camí per a futures investigacions en el camp.
In recent years, there has been a notable development of natural language processing technologies for various tasks such as text classification, information extraction, and automatic natural language generation, to name a few. However, the problem of detecting figurative language like irony has not received as much attention from the scientific community. In this undergraduate thesis, we propose the development of a natural language processing model with the objective of detecting the presence of irony in Spanish text. To accomplish this, we have adopted a supervised learning methodology based on transformer neural networks and the well-known fine-tuning technique. Specifically, we build upon the model published by Google in 2018 called BERT. The data used to train the model is part of the dataset provided by the organizers of IroSvA 2019, one of the most recent tasks for detecting irony in Spanish variants that involved several universities. Additionally, we analyze the capability of our system to detect irony in a newly consolidated dataset with the assistance of two experts in figurative language. The obtained results demonstrate the effectiveness of this model in detecting irony in Spanish and can pave the way for future research in the field.
Description
Treball de fi de grau en Informàtica. Tutor: Horacio Saggion
Collections
Grau en Enginyeria en Informàtica. Treballs de fi de grau

Full item page

Detección de ironía en el texto en espanyol

Detección de ironía en el texto en espanyol

Files

Date

Authors

Abstract

Description

Collections