A Corpus of Spanish clinical records annotated for abbreviation identification

Mostra el registre complet Registre parcial de l'ítem

  • dc.contributor.author Aguado, Mercedes
  • dc.contributor.author Bel Rafecas, Núria
  • dc.date.accessioned 2022-04-20T12:58:57Z
  • dc.date.available 2022-04-20T12:58:57Z
  • dc.date.issued 2022
  • dc.description.abstract With the deployment of Electronic Health Records, much effort is being devoted to the development of Natural Language Processing tools that convert information described in these clinical records into structured data to be exploited. Clinical records main characteristic is that they are free text. They are normally written under pressure as memory notes and contain a high number of abbreviations that are an issue for automatic processing. In this article we present the IULA Spanish Clinical Records Corpus annotated for abbreviation identification.
  • dc.description.abstract Con la implementación de las historias clínicas electrónicas, se están dedicando muchos esfuerzos al desarrollo de herramientas de procesamiento del lenguaje natural que convierten la información descrita en estos registros clínicos en datos estructurados para ser explotados. La principal característica de las historias clínicas es que son texto libre. Normalmente se escriben deprisa, como notas de memoria y contienen un gran número de abreviaturas que son un problema para su procesamiento automático. En este artículo presentamos el Corpus de historias clínicas españolas del IULA, anotado para la identificación de abreviaturas.
  • dc.description.sponsorship Research reported in this publication was partially supported by the Project PID2019-104512GB-I00 funded by Ministerio de Ciencia e Innovación (Spain).
  • dc.format.mimetype application/pdf
  • dc.identifier.citation Aguado M, Bel N. A Corpus of Spanish clinical records annotated for abbreviation identification. Procesamiento del Lenguaje Natural. 2022;(68):99-109. DOI: 10.26342/2022-68-7
  • dc.identifier.doi http://dx.doi.org/10.26342/2022-68-7
  • dc.identifier.issn 1135-5948
  • dc.identifier.uri http://hdl.handle.net/10230/52865
  • dc.language.iso eng
  • dc.publisher Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN)
  • dc.relation.ispartof Procesamiento del Lenguaje Natural. 2022;(68):99-109
  • dc.relation.projectID info:eu-repo/grantAgreement/ES/2PE/PID2019-104512GB-I00
  • dc.rights © Sociedad Española para el Procesamiento de Lenguaje Natural. Aquest article està subjecte a una llicència Creative Commons
  • dc.rights.accessRights info:eu-repo/semantics/openAccess
  • dc.rights.uri https://creativecommons.org/licenses/by-nc-nd/4.0
  • dc.subject.keyword Abbreviations
  • dc.subject.keyword Annotated corpus
  • dc.subject.keyword Clinical records
  • dc.subject.keyword Preprocessing
  • dc.subject.keyword Abreviaturas
  • dc.subject.keyword Corpus anotado
  • dc.subject.keyword Historias clínicas
  • dc.subject.keyword Normalización
  • dc.subject.keyword Preprocesamiento
  • dc.title A Corpus of Spanish clinical records annotated for abbreviation identification
  • dc.title.alternative Un corpus de historias clínicas españolas anotadas para la identificación de abreviaturas
  • dc.type info:eu-repo/semantics/article
  • dc.type.version info:eu-repo/semantics/publishedVersion