Tracking the economy using FOMC speech transcripts

Enllaç permanent

Descripció

  • Resum

    In this study, we propose an approach for the extraction of a low-dimensional signal from a collection of text documents ordered over time. The proposed framework foresees the application of Latent Dirichlet Allocation (LDA) for obtaining a meaningful representation of documents as a mixture over a set of topics. Such representations can then be modeled via a Dynamic Linear Model (DLM) as noisy realisations of a limited number of latent factors that evolve with time. We apply this approach to Federal Open Market Committee (FOMC) speech transcripts for the period of Greenspan presidency. We are able to extract a latent factor that fairly resembles the Economic Policy Uncertainty Index for United States.
    En este trabajo proponemos una metodología para la extracción de señales de baja dimensionalidad en una colección de textos ordenados temporalmente. El enfoque propuesto prevé la aplicación de la asignación latente de Dirichlet - Latent Dirichlet Allocation (LDA) - para obtener una representación de los documentos como una mezcla de diversos temas. Dichas representaciones se pueden modelar a través de un modelo lineal dinámico - Dynamic Linear Model (DLM) - como realizaciones ruidosas de un número limitado de factores latentes que evolucionan en el tiempo. Aplicamos este enfoque a las transcripciones de los pronunciamientos del Comité Federal de Mercado Abierto para el período de la presidencia de Alan Greenspan. Utilizando este modelo podemos extraer un factor latente que se asemeja al índice de incertidumbre de política económica de Estados Unidos.
  • Descripció

    Treball fi de màster de: Master's Degree in Data Science. Curs 2019-2020
    Director: Omiros Papaspiliopoulos
  • Mostra el registre complet