dc.contributor.author |
Casanovas Pérez, Èric |
dc.date.accessioned |
2023-10-03T15:30:13Z |
dc.date.available |
2023-10-03T15:30:13Z |
dc.date.issued |
2023-10-03 |
dc.identifier.uri |
http://hdl.handle.net/10230/58030 |
dc.description |
Treball de fi de grau en Informàtica. Tutor: Horacio Saggion |
dc.description.abstract |
Durante los últimos años, ha habido un notable desarrollo de las tecnologías de procesamiento
del lenguaje natural para diversas tareas como la clasificación de textos, extracción de
información y generación automática de lenguaje natural, por mencionar algunas. Sin embargo,
el problema de detectar lenguaje figurado como la ironía no ha recibido tanta atención por parte
de la comunidad científica. En este trabajo de fin de grado, proponemos el desarrollo de un
modelo de procesamiento del lenguaje natural con el objetivo de detectar la presencia de ironía
en textos en español. Para lograr esto, hemos adoptado una metodología de aprendizaje
supervisado basada en redes neuronales transformadoras y la técnica conocida como fine-tuning.
Específicamente, nos basamos en el modelo publicado por Google en 2018 llamado BERT. Los
datos utilizados para entrenar el modelo forman parte del conjunto de datos proporcionado por
los organizadores de IroSvA 2019, una de las tareas más recientes para detectar ironía en variantes
del español que involucró a varias universidades. Además, analizamos la capacidad de nuestro
sistema para detectar ironía en un conjunto de datos recién consolidado con la ayuda de dos
expertos en lenguaje figurado. Los resultados obtenidos demuestran la efectividad de este modelo
en la detección de ironía en español y pueden abrir el camino para futuras investigaciones en el
campo. |
dc.description.abstract |
Durant els últims anys, s'ha produït un notable desenvolupament de les tecnologies de
processament del llenguatge natural per a diverses tasques com la classificació de textos,
l'extracció d'informació i la generació automàtica de llenguatge natural, per citar-ne algunes. No
obstant això, el problema de detectar llenguatge figurat com la ironia no ha rebut tanta atenció
per part de la comunitat científica. En aquest treball de fi de grau, proposem el desenvolupament
d'un model de processament del llenguatge natural amb l'objectiu de detectar la presència d'ironia
a textos en espanyol. Per aconseguir-ho, hem adoptat una metodologia d'aprenentatge supervisat
basada en xarxes neuronals transformadores i la tècnica ben coneguda com a fine-tuning.
Específicament, ens basem en el model publicat per Google el 2018 anomenat BERT. Les dades
utilitzades per entrenar el model formen part del conjunt de dades proporcionat pels organitzadors
de l'IroSvA 2019, una de les tasques més recents per detectar ironia en variants de l'espanyol que
va implicar diverses universitats. A més, analitzem la capacitat del nostre sistema per detectar
ironia en un conjunt de dades recentment consolidat amb l'ajuda de dos experts en llenguatge
figurat. Els resultats obtinguts demostren l'efectivitat d'aquest model en la detecció d'ironia en
espanyol i poden obrir el camí per a futures investigacions en el camp. |
dc.description.abstract |
In recent years, there has been a notable development of natural language processing technologies
for various tasks such as text classification, information extraction, and automatic natural
language generation, to name a few. However, the problem of detecting figurative language like
irony has not received as much attention from the scientific community. In this undergraduate
thesis, we propose the development of a natural language processing model with the objective of
detecting the presence of irony in Spanish text. To accomplish this, we have adopted a supervised
learning methodology based on transformer neural networks and the well-known fine-tuning
technique. Specifically, we build upon the model published by Google in 2018 called BERT. The
data used to train the model is part of the dataset provided by the organizers of IroSvA 2019, one
of the most recent tasks for detecting irony in Spanish variants that involved several universities.
Additionally, we analyze the capability of our system to detect irony in a newly consolidated
dataset with the assistance of two experts in figurative language. The obtained results demonstrate
the effectiveness of this model in detecting irony in Spanish and can pave the way for future
research in the field. |
dc.format.mimetype |
application/pdf |
dc.language.iso |
spa |
dc.rights |
Llicència CC Reconeixement-NoComercial-SenseObraDerivada 4.0 Internacional (CC BY-NC-ND 4.0) |
dc.rights.uri |
https://creativecommons.org/licenses/by-nc-nd/4.0/deed.ca |
dc.title |
Detección de ironía en el texto en espanyol |
dc.type |
info:eu-repo/semantics/bachelorThesis |
dc.rights.accessRights |
info:eu-repo/semantics/openAccess |