Descripción y evaluación de un sistema basado en reglas para la extracción automática de contextos definitorios

Enllaç permanent

Descripció

  • Resum

    Material addicional: http://hdl.handle.net/10230/6295
    El desarrollo de herramientas computacionales de ayuda en tareas lexicográficas y terminográficas es un creciente interés dentro del campo del procesamiento del lenguaje natural. Algunas herramientas se han desarrollado para la extracción automática de términos en textos especializados. Además, algunos estudios se han enfocado en el desarrollo de métodos para adquirir conocimiento definitorio sobre términos, tomando en cuenta la idea de que los términos suelen definirse en estructuras denominadas contextos definitorios, donde se emplean una serie de patrones que pueden ser reconocidos automáticamente. Partiendo de esta premisa, en esta tesis presentamos un sistema basado en reglas lingüísticas para la extracción de contextos definitorios sobre textos especializados en español. Este sistema esta formado por cuatro procesos: la extracción de ocurrencias de patrones definitorios; el filtro de contextos no relevantes; la identificación de los elementos constitutivos en los candidatos, es decir, el término y la definición; y la organización jerárquica de los resultados con el fin de encontrar los mejores candidatos.
    The development of computational tools to help on lexicography and terminography tasks is indeed a growing interest on natural language processing field. Some tools have been developing for the extraction of terms from specialised texts. In addition, some studies have been focused on developing methods for acquiring definitional knowledge about terms, considering that the terms are commonly defined in structures called definitional contexts, which employ some patterns that can be automatically identified. Taking into account this premise, in this thesis we present a system based on linguistic rules for the extraction of definitional contexts in Spanish specialised texts. The system includes four processes: the extraction of textual fragments with definitional patterns; the filtering of non-relevant contexts; the identification of the constituent elements in the candidates, i.e., terms and definitions; and the ranking of the results to identify the best candidates.
    Programa de doctorat en Traducció i Ciències del Llenguatge
  • Col·leccions

  • Mostra el registre complet