Hacia un modelo lingüístico de resumen automático de artículos médicos en español

Mostra el registre complet Registre parcial de l'ítem

  • dc.contributor.author da Cunha Fanego, Iria
  • dc.contributor.other Wanner, Leo
  • dc.contributor.other Cabré, M. Teresa (Maria Teresa)
  • dc.contributor.other Universitat Pompeu Fabra. Institut Universitari de Lingüística Aplicada
  • dc.date.accessioned 2024-03-16T02:34:25Z
  • dc.date.available 2024-03-16T02:34:25Z
  • dc.date.issued 2011-04-12T16:35:36Z
  • dc.date.issued 2008-11-03
  • dc.date.issued 2008-04-25
  • dc.date.issued 2008-11-03
  • dc.date.modified 2024-03-15T10:58:10Z
  • dc.description.abstract En esta tesis se presenta un modelo lingüístico de resumen automático de artículos médicos en español que aúna criterios basados en la estructura textual, en las unidades léxicas y la estructura discursiva y sintáctico-comunicativa de los textos. El modelo se crea partiendo de la hipótesis de que los especialistas de cada ámbito emplean estrategias específicas a la hora de resumir. La validación de esta hipótesis mediante experimentos estadísticos permite tomar los artículos médicos acompañados de sus respectivos resúmenes como material de referencia para analizar, de cara a detectar las estrategias empleadas por los profesionales médicos para resumir sus textos. Una vez detectadas, estas estrategias se formalizan en forma de reglas y se diseña un modo de integración de las mismas. Esto da lugar al modelo presentado en esta tesis, del cual se implementa una parte. Los resúmenes resultantes se evalúan obteniendo buenos resultados, lo cual confirma que el modelo simula correctamente las estrategias empleadas por los especialistas y que estas se refieren a diversos aspectos lingüísticos.
  • dc.description.abstract In this thesis a linguistic model of automatic summarization of Spanish medical articles that joins criteria based on the textual structure, on lexical units and on the discourse and syntactic-communicative structure of texts is presented. The model is developed under the hypothesis that specialists of a domain use specific strategies when they summarize. The validation of this hypothesis by means of statistical experiments allows us to draw upon medical articles and their respective abstracts as reference in order to determine the strategies used by medical professionals. Once these strategies have been determined, they are formalized in terms of an integrated rule-based system, of which a part is implemented. The resulting summaries have been evaluated. Good results were obtained, which confirms that the model simulates correctly the strategies used by specialists and that these strategies refer to different linguistic aspects.
  • dc.description.abstract Programa de doctorat en Traducció i Ciències del Llenguatge
  • dc.format application/pdf
  • dc.format application/pdf
  • dc.identifier 9788469209769
  • dc.identifier http://www.tdx.cat/TDX-1103108-140334
  • dc.identifier http://hdl.handle.net/10803/7508
  • dc.identifier B.40584-2008
  • dc.identifier.uri http://hdl.handle.net/10230/12028
  • dc.language.iso spa
  • dc.publisher Universitat Pompeu Fabra
  • dc.rights ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.
  • dc.rights info:eu-repo/semantics/openAccess
  • dc.source TDX (Tesis Doctorals en Xarxa)
  • dc.subject.keyword specialized discourse
  • dc.subject.keyword linguistic analysis
  • dc.subject.keyword medical article
  • dc.subject.keyword extraction
  • dc.subject.keyword automatic summarization
  • dc.subject.keyword discurso especializado
  • dc.subject.keyword análisis lingüístico
  • dc.subject.keyword artículo médico
  • dc.subject.keyword extracción
  • dc.subject.keyword resumen automático
  • dc.subject.keyword 81
  • dc.title Hacia un modelo lingüístico de resumen automático de artículos médicos en español
  • dc.type info:eu-repo/semantics/doctoralThesis
  • dc.type info:eu-repo/semantics/publishedVersion

Col·leccions