dc.contributor.author |
Güell Noguera, Carles |
dc.date.accessioned |
2014-12-10T11:48:29Z |
dc.date.available |
2014-12-10T11:48:29Z |
dc.date.issued |
2014-12-10 |
dc.identifier.uri |
http://hdl.handle.net/10230/22924 |
dc.description |
Treball de fi de grau en informàtica |
dc.description |
Tutor: Horacio Saggion |
dc.description.abstract |
Les eines que permeten fer un resum automàtic d’un esdeveniment o d’un hashtag concret/nde Twitter, a temps real, encara no estan desenvolupades a la perfecció. En aquest treball de/nfi de grau he implementat un algoritme que associa un valor de rellevància a cada tweet/nbasat en una mitjana de similitud entre tweets./nPel desenvolupament del treball he hagut de programar un algoritme que sigui capaç/nd’identificar els tweets més rellevants dins d'un corpus de tweets que han estat seleccionats amb un hashtag concret. A part, també he fet servir una altra eina que ja existeix per al tractat de textos anomenat GATE, juntament amb el SUMMA-plugin, que permet treure els tweets rellevants basat en el mètode del centroide, que s’aplica en un resum de múltiples documents, i així, poder avaluar quin dels dos és més efectiu./nPer a l’avaluació dels dos mètodes, he preguntat als usuaris quin dels dos obté millors/nresultats avaluant els tweets més rellevants escollits per cada mètode en una escala del 1 al 5. A partir d'això, he pogut veure que en funció del tema escollit uns usuaris trobaven millor el resum fet pel GATE-SUMMA i els altres trobaven que era millor l’algoritme implementat./nTambé he creat una aplicació en què hi he integrat els dos algoritmes, i en què donat un/nhashtag produeix el resum dels tweets associats a aquest hashtag. |
dc.description.abstract |
There is an increasing interest in algorithms and tools to summarize social media content/nsuch as sets of microblogs associated to a given hashtag. In this project I have used two/ndifferent summarization algorithms that represent tweets as vectors of terms and weights/nand score based them based on a similarity measure./nThe algorithms take a set of tweets associated to a hashtag as input and select the n most/nrelevant tweets./nOne of the algorithms is a centroid-based summarization algorithm distributed with the/nSUMMA library which was adapted to summarize tweets./nI have carried out an evaluation of the two algorithms asking users to rate in a scale of 1/n(worst) to 5 (best) the output of the summarizers./nThe algorithms have been integrated in a simple application that given a hashtag produced/nthe summary of the tweets associated to that hashtag. |
dc.format.mimetype |
application/pdf |
dc.language.iso |
cat |
dc.rights |
Aquest document està subjecte a una llicència Creative Commons |
dc.rights.uri |
http://creativecommons.org/licenses/by-nc-nd/3.0/es/ |
dc.subject.other |
Mineria de web |
dc.subject.other |
Textos -- Processament |
dc.subject.other |
Twitter |
dc.subject.other |
Xarxes socials en línia |
dc.title |
Resum automàtic de tweets associats a un hashtag |
dc.type |
info:eu-repo/semantics/bachelorThesis |
dc.rights.accessRights |
info:eu-repo/semantics/openAccess |