Welcome to the UPF Digital Repository

Harnessing big data news media for conflict prediction and anticipatory decision-making

Show simple item record

dc.contributor.author Chaves, Giovanna
dc.contributor.author Philipp, Margherita
dc.contributor.author Quiñones, Luis
dc.date.accessioned 2023-11-23T18:54:29Z
dc.date.available 2023-11-23T18:54:29Z
dc.date.issued 2023-07
dc.identifier.uri http://hdl.handle.net/10230/58367
dc.description Treball fi de màster de: Master's Degree in Data Science: Data Science for Decision Making Program. Curs 2022-2023
dc.description Tutors: Jesús Cerquides i Hannes Mueller
dc.description.abstract Advances in data and computing techniques have opened possibilities for real-time and cost-efficient conflict prediction and early warning capabilities, with news-based data being utilized to generate relevant forecasts. This Master’s thesis explores the use of big data news media for conflict prediction and anticipatory decision-making, with a focus on harnessing the Global Database of Events, Language and Tone (GDELT). We investigate the effectiveness of using GDELT events to predict conflict at the country-level by extracting relevant features and comparing the performance of text-based models with different target definitions and time horizons. The results show that GDELT-based features perform well in conflict prediction, particularly in tree-based and LSTM models, indicating the value of using text data for capturing patterns and providing insights into potential conflict events.
dc.description.abstract Avances en data y computación han abierto la posibilidad de la predicción costo eficiente y en tiempo real de conflictos, con capacidad de alerta temprana, utilizando datos basados en noticias para generar pronósticos relevantes. Esta tesis de maestría explora el uso de medios de comunicación de noticias de ‘big data’ para la predicción de conflictos y la toma de decisiones anticipadas, con un enfoque en aprovechar la Base de Datos Global de Eventos, Lenguaje y Tono (GDELT). Investigamos la efectividad de utilizar los eventos de GDELT para predecir conflictos a nivel de país mediante la extracción de características relevantes y comparando el rendimiento de modelos basados en texto con diferentes definiciones de objetivo y horizontes temporales. Los resultados muestran que las características basadas en GDELT tienen un buen desempeño en la predicción de conflictos, especialmente en modelos basados en algoritmos ‘Trees’ y LSTM, lo que indica el valor de utilizar datos de texto para capturar patrones y proporcionar información sobre posibles eventos de conflicto.
dc.format.mimetype application/pdf
dc.language.iso eng
dc.rights This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License
dc.rights.uri https://creativecommons.org/licenses/by-nc-nd/4.0
dc.subject.other Treball de fi de màster – Curs 2022-2023
dc.title Harnessing big data news media for conflict prediction and anticipatory decision-making
dc.type info:eu-repo/semantics/masterThesis
dc.subject.keyword Prediction
dc.subject.keyword Conflicts
dc.subject.keyword GDELT
dc.subject.keyword Predicción
dc.subject.keyword Conflictos
dc.rights.accessRights info:eu-repo/semantics/openAccess

Thumbnail

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Advanced Search

Browse

My Account

Statistics

In collaboration with Compliant to Partaking