|
Abstract:
|
This thesis addresses the problem of the development of Natural LanguageProcessing techniques for the extraction and generalization of compositionaland functional relations from specialized written texts and, in particular, frompatent claims. One of the most demanding tasks tackled in the thesis is,according to the state of the art, the semantic generalization of linguisticdenominations of relations between object components and processesdescribed in the texts. These denominations are usually verbal expressions ornominalizations that are too concrete to be used as standard labels inknowledge representation forms -as, for example, “A leads to B”, and “Cprovokes D”, where “leads to” and “provokes” both express, in abstractterms, a cause, such that in both cases “A CAUSE B” and “C CAUSE D”would be more appropriate. A semantic generalization of the relations allowsus to achieve a higher degree of abstraction of the relationships betweenobjects and processes described in the claims and reduces their number to alimited set that is oriented towards relations as commonly used in the genericfield of knowledge representation.
Esta tesis se centra en el del desarrollo de tecnologías del Procesamiento delLenguage Natural para la extracción y generalización de relacionesencontradas en textos especializados; concretamente en las reivindicacionesde patentes. Una de las tareas más demandadas de nuestro trabajo, desde elpunto vista del estado de la cuestión, es la generalización de lasdenominaciones lingüísticas de las relaciones. Estas denominaciones,usualmente verbos, son demasiado concretas para ser usadas como etiquetasde relaciones en el contexto de la representación del conocimiento; porejemplo, “A lleva a B”, “B es el resultado de A” están mejor representadaspor “A causa B”. La generalización de relaciones permite reducir el n\'umerode relaciones a un conjunto limitado, orientado al tipo de relaciones utilizadasen el campo de la representación del conocimiento.
|