Identification of complex words and passages in medical documents in French

Citació

  • Sheang KC, Koptient A, Grabar N, Saggion H. Identification of complex words and passages in medical documents in French. In: Estève Y, Jiménez T, Parcollet T, Boito MZ, editors. Actes de la 29e Conférence sur le Traitement Automatique des Langues Naturelles; 2022 Jun 27-Jul 1; Avignon, France. Avignon: ATALA; 2022. p. 116-25.

Enllaç permanent

Descripció

  • Resum

    L’objectif de la simplification automatique des textes consiste à fournir une nouvelle version de documents qui devient plus facile à comprendre pour une population donnée ou plus facile à traiter par d’autres applications du TAL. Cependant, avant d’effectuer la simplification, il est important de savoir ce qu’il faut simplifier exactement dans les documents. En effet, même dans les documents techniques et spécialisés, il n’est pas nécessaire de tout simplifier mais juste les segments qui présentent des difficultés de compréhension. Il s’agit typiquement de la tâche d’identification de mots complexes : effectuer le diagnostic de difficulté d’un document donné pour y détecter les mots et passages complexes. Nous proposons de travail sur l’identification de mots et passages complexes dans les documents biomédicaux en français.
    The purpose of automatic text simplification is to provide a new version of documents that are easier to understand by a given population or easier to process by other NLP applications. However, it is important to know what should be simplified exactly within the documents before the simplification is done. Indeed, even in technical and specialized documents, it is unnecessary to simplify everything but just those segments that present understanding difficulty. Typically, the purpose of complex word identification is to diagnose the difficulty of a given document to detect complex words or passages within it. We propose to address the issue of identifying complex words and passages within biomedical documents in French.
  • Descripció

    Comunicació presentada a: 29e Conférence sur le Traitement Automatique des Langues Naturelles, celebrat del 27 de juny a l'1 de juliol de 2022 a Avignon, França
  • Mostra el registre complet