dc.contributor.author |
Aguado, Mercedes |
dc.contributor.author |
Bel Rafecas, Núria |
dc.date.accessioned |
2022-04-20T12:58:57Z |
dc.date.available |
2022-04-20T12:58:57Z |
dc.date.issued |
2022 |
dc.identifier.citation |
Aguado M, Bel N. A Corpus of Spanish clinical records annotated for abbreviation identification. Procesamiento del Lenguaje Natural. 2022;(68):99-109. DOI: 10.26342/2022-68-7 |
dc.identifier.issn |
1135-5948 |
dc.identifier.uri |
http://hdl.handle.net/10230/52865 |
dc.description.abstract |
With the deployment of Electronic Health Records, much effort is being
devoted to the development of Natural Language Processing tools that convert
information described in these clinical records into structured data to be exploited.
Clinical records main characteristic is that they are free text. They are normally written
under pressure as memory notes and contain a high number of abbreviations that are an
issue for automatic processing. In this article we present the IULA Spanish Clinical
Records Corpus annotated for abbreviation identification. |
dc.description.abstract |
Con la implementación de las historias clínicas electrónicas, se están
dedicando muchos esfuerzos al desarrollo de herramientas de procesamiento del lenguaje
natural que convierten la información descrita en estos registros clínicos en datos
estructurados para ser explotados. La principal característica de las historias clínicas es
que son texto libre. Normalmente se escriben deprisa, como notas de memoria y
contienen un gran número de abreviaturas que son un problema para su procesamiento
automático. En este artículo presentamos el Corpus de historias clínicas españolas del
IULA, anotado para la identificación de abreviaturas. |
dc.description.sponsorship |
Research reported in
this publication was partially supported by the
Project PID2019-104512GB-I00 funded by
Ministerio de Ciencia e Innovación (Spain). |
dc.format.mimetype |
application/pdf |
dc.language.iso |
eng |
dc.publisher |
Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN) |
dc.relation.ispartof |
Procesamiento del Lenguaje Natural. 2022;(68):99-109 |
dc.rights |
© Sociedad Española para el Procesamiento de Lenguaje Natural.
Aquest article està subjecte a una llicència Creative Commons |
dc.rights.uri |
https://creativecommons.org/licenses/by-nc-nd/4.0 |
dc.title |
A Corpus of Spanish clinical records annotated for abbreviation
identification |
dc.title.alternative |
Un corpus de historias clínicas españolas anotadas para la identificación de
abreviaturas |
dc.type |
info:eu-repo/semantics/article |
dc.identifier.doi |
http://dx.doi.org/10.26342/2022-68-7 |
dc.subject.keyword |
Abbreviations |
dc.subject.keyword |
Annotated corpus |
dc.subject.keyword |
Clinical records |
dc.subject.keyword |
Preprocessing |
dc.subject.keyword |
Abreviaturas |
dc.subject.keyword |
Corpus anotado |
dc.subject.keyword |
Historias clínicas |
dc.subject.keyword |
Normalización |
dc.subject.keyword |
Preprocesamiento |
dc.relation.projectID |
info:eu-repo/grantAgreement/ES/2PE/PID2019-104512GB-I00 |
dc.rights.accessRights |
info:eu-repo/semantics/openAccess |
dc.type.version |
info:eu-repo/semantics/publishedVersion |