Welcome to the UPF Digital Repository

A Corpus of Spanish clinical records annotated for abbreviation identification

Show simple item record

dc.contributor.author Aguado, Mercedes
dc.contributor.author Bel Rafecas, Núria
dc.date.accessioned 2022-04-20T12:58:57Z
dc.date.available 2022-04-20T12:58:57Z
dc.date.issued 2022
dc.identifier.citation Aguado M, Bel N. A Corpus of Spanish clinical records annotated for abbreviation identification. Procesamiento del Lenguaje Natural. 2022;(68):99-109. DOI: 10.26342/2022-68-7
dc.identifier.issn 1135-5948
dc.identifier.uri http://hdl.handle.net/10230/52865
dc.description.abstract With the deployment of Electronic Health Records, much effort is being devoted to the development of Natural Language Processing tools that convert information described in these clinical records into structured data to be exploited. Clinical records main characteristic is that they are free text. They are normally written under pressure as memory notes and contain a high number of abbreviations that are an issue for automatic processing. In this article we present the IULA Spanish Clinical Records Corpus annotated for abbreviation identification.
dc.description.abstract Con la implementación de las historias clínicas electrónicas, se están dedicando muchos esfuerzos al desarrollo de herramientas de procesamiento del lenguaje natural que convierten la información descrita en estos registros clínicos en datos estructurados para ser explotados. La principal característica de las historias clínicas es que son texto libre. Normalmente se escriben deprisa, como notas de memoria y contienen un gran número de abreviaturas que son un problema para su procesamiento automático. En este artículo presentamos el Corpus de historias clínicas españolas del IULA, anotado para la identificación de abreviaturas.
dc.description.sponsorship Research reported in this publication was partially supported by the Project PID2019-104512GB-I00 funded by Ministerio de Ciencia e Innovación (Spain).
dc.format.mimetype application/pdf
dc.language.iso eng
dc.publisher Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN)
dc.relation.ispartof Procesamiento del Lenguaje Natural. 2022;(68):99-109
dc.rights © Sociedad Española para el Procesamiento de Lenguaje Natural. Aquest article està subjecte a una llicència Creative Commons
dc.rights.uri https://creativecommons.org/licenses/by-nc-nd/4.0
dc.title A Corpus of Spanish clinical records annotated for abbreviation identification
dc.title.alternative Un corpus de historias clínicas españolas anotadas para la identificación de abreviaturas
dc.type info:eu-repo/semantics/article
dc.identifier.doi http://dx.doi.org/10.26342/2022-68-7
dc.subject.keyword Abbreviations
dc.subject.keyword Annotated corpus
dc.subject.keyword Clinical records
dc.subject.keyword Preprocessing
dc.subject.keyword Abreviaturas
dc.subject.keyword Corpus anotado
dc.subject.keyword Historias clínicas
dc.subject.keyword Normalización
dc.subject.keyword Preprocesamiento
dc.relation.projectID info:eu-repo/grantAgreement/ES/2PE/PID2019-104512GB-I00
dc.rights.accessRights info:eu-repo/semantics/openAccess
dc.type.version info:eu-repo/semantics/publishedVersion


This item appears in the following Collection(s)

Show simple item record

Search DSpace

Advanced Search


My Account


Compliant to Partaking