Enriquecer y explorar un conjunto de datos de publicaciones científicas con técnicas de procesamiento del lenguaje natural
Enriquecer y explorar un conjunto de datos de publicaciones científicas con técnicas de procesamiento del lenguaje natural
Enllaç permanent
Descripció
Resum
Actualmente, la literatura científica se encuentra en auge. El número de artículos y documentos publicados ha experimentado un crecimiento exponencial a lo largo de las últimas décadas y han aparecido diferentes plataformas digitales que ofrecen un acceso abierto a estas publicaciones. El objetivo de este TFG es utilizar técnicas de procesamiento de lenguaje natural para analizar el contenido de estas publicaciones científicas y poder crear diferentes tipos de representaciones acerca de la información obtenida. El trabajo está basado en el análisis de la base de datos bibliográfica DBLP1 , que será investigada y analizada lingüísticamente para dar soporte a diferentes aplicaciones. Se realizará un análisis lingüístico, usando librerías disponibles, sobre los títulos, abstracts y la colaboración entre autores con el objetivo de enriquecer el contenido y la visualización de la información.
Currently, the scientific literature is in a stage of great growth. The number of published articles and documents has grown exponentially over the last decades and different digital platforms have appeared that offer open access to these publications. The purpose of this TFG is to use natural language processing techniques to analyze the content of these scientific publications and to be a ble to create different types of representations about the information obtained. The work will be based on the analysis of the DBLP bibliographic database, which will be investigated and analyzed linguistically to support different applications. A linguistic analysis will be carried out, using available libraries, on the titles, abstracts and collaboration between authors with the aim of enriching the content and the visualization of the information.Descripció
Treball de fi de grau en informàtica
Tutor: Horacio Saggion