Identification of complex words and passages in medical documents in French

Mostra el registre complet Registre parcial de l'ítem

  • dc.contributor.author Sheang, Kim Cheng
  • dc.contributor.author Koptient, Anaïs
  • dc.contributor.author Grabar, Natalia
  • dc.contributor.author Saggion, Horacio
  • dc.date.accessioned 2022-09-15T07:17:13Z
  • dc.date.available 2022-09-15T07:17:13Z
  • dc.date.issued 2022
  • dc.description Comunicació presentada a: 29e Conférence sur le Traitement Automatique des Langues Naturelles, celebrat del 27 de juny a l'1 de juliol de 2022 a Avignon, França
  • dc.description.abstract L’objectif de la simplification automatique des textes consiste à fournir une nouvelle version de documents qui devient plus facile à comprendre pour une population donnée ou plus facile à traiter par d’autres applications du TAL. Cependant, avant d’effectuer la simplification, il est important de savoir ce qu’il faut simplifier exactement dans les documents. En effet, même dans les documents techniques et spécialisés, il n’est pas nécessaire de tout simplifier mais juste les segments qui présentent des difficultés de compréhension. Il s’agit typiquement de la tâche d’identification de mots complexes : effectuer le diagnostic de difficulté d’un document donné pour y détecter les mots et passages complexes. Nous proposons de travail sur l’identification de mots et passages complexes dans les documents biomédicaux en français.
  • dc.description.abstract The purpose of automatic text simplification is to provide a new version of documents that are easier to understand by a given population or easier to process by other NLP applications. However, it is important to know what should be simplified exactly within the documents before the simplification is done. Indeed, even in technical and specialized documents, it is unnecessary to simplify everything but just those segments that present understanding difficulty. Typically, the purpose of complex word identification is to diagnose the difficulty of a given document to detect complex words or passages within it. We propose to address the issue of identifying complex words and passages within biomedical documents in French.
  • dc.description.sponsorship Our work is partly supported by the project Context-aware Multilingual Text Simplification (ConMuTeS) PID2019-109066GB-I00/AEI/10.13039/501100011033 awarded by Ministerio de Ciencia, Innovación y Universidades (MCIU), by Agencia Estatal de Investigación (AEI) of Spain, and by the French National Agency for Research (ANR) as part of the CLEAR project (Communication, Literacy, Education, Accessibility, Readability), ANR-17-CE19-0016-01.
  • dc.format.mimetype application/pdf
  • dc.identifier.citation Sheang KC, Koptient A, Grabar N, Saggion H. Identification of complex words and passages in medical documents in French. In: Estève Y, Jiménez T, Parcollet T, Boito MZ, editors. Actes de la 29e Conférence sur le Traitement Automatique des Langues Naturelles; 2022 Jun 27-Jul 1; Avignon, France. Avignon: ATALA; 2022. p. 116-25.
  • dc.identifier.uri http://hdl.handle.net/10230/54078
  • dc.language.iso eng
  • dc.publisher ATALA
  • dc.relation.ispartof Estève Y, Jiménez T, Parcollet T, Boito MZ, editors. Actes de la 29e Conférence sur le Traitement Automatique des Langues Naturelles; 2022 Jun 27-Jul 1; Avignon, France. Avignon: ATALA; 2022.
  • dc.relation.projectID info:eu-repo/grantAgreement/ES/2PE/PID2019-109
  • dc.rights Cette œuvre est mise à disposition sous licence Attribution 4.0 International.
  • dc.rights.accessRights info:eu-repo/semantics/openAccess
  • dc.rights.uri https://creativecommons.org/licenses/by/4.0/
  • dc.subject.keyword Détection de mots difficiles
  • dc.subject.keyword Simplification de texte
  • dc.subject.keyword Complex word identification
  • dc.subject.keyword Text simplification
  • dc.title Identification of complex words and passages in medical documents in French
  • dc.title.alternative Identification de mots et passages difficiles dans les documents médicaux en français
  • dc.type info:eu-repo/semantics/conferenceObject
  • dc.type.version info:eu-repo/semantics/publishedVersion