Resum automàtic de tweets associats a un hashtag

Enllaç permanent

Descripció

  • Resum

    Les eines que permeten fer un resum automàtic d’un esdeveniment o d’un hashtag concret/nde Twitter, a temps real, encara no estan desenvolupades a la perfecció. En aquest treball de/nfi de grau he implementat un algoritme que associa un valor de rellevància a cada tweet/nbasat en una mitjana de similitud entre tweets./nPel desenvolupament del treball he hagut de programar un algoritme que sigui capaç/nd’identificar els tweets més rellevants dins d'un corpus de tweets que han estat seleccionats amb un hashtag concret. A part, també he fet servir una altra eina que ja existeix per al tractat de textos anomenat GATE, juntament amb el SUMMA-plugin, que permet treure els tweets rellevants basat en el mètode del centroide, que s’aplica en un resum de múltiples documents, i així, poder avaluar quin dels dos és més efectiu./nPer a l’avaluació dels dos mètodes, he preguntat als usuaris quin dels dos obté millors/nresultats avaluant els tweets més rellevants escollits per cada mètode en una escala del 1 al 5. A partir d'això, he pogut veure que en funció del tema escollit uns usuaris trobaven millor el resum fet pel GATE-SUMMA i els altres trobaven que era millor l’algoritme implementat./nTambé he creat una aplicació en què hi he integrat els dos algoritmes, i en què donat un/nhashtag produeix el resum dels tweets associats a aquest hashtag.
    There is an increasing interest in algorithms and tools to summarize social media content/nsuch as sets of microblogs associated to a given hashtag. In this project I have used two/ndifferent summarization algorithms that represent tweets as vectors of terms and weights/nand score based them based on a similarity measure./nThe algorithms take a set of tweets associated to a hashtag as input and select the n most/nrelevant tweets./nOne of the algorithms is a centroid-based summarization algorithm distributed with the/nSUMMA library which was adapted to summarize tweets./nI have carried out an evaluation of the two algorithms asking users to rate in a scale of 1/n(worst) to 5 (best) the output of the summarizers./nThe algorithms have been integrated in a simple application that given a hashtag produced/nthe summary of the tweets associated to that hashtag.
  • Descripció

    Treball de fi de grau en informàtica
    Tutor: Horacio Saggion
  • Mostra el registre complet