Towards deep content extraction from specialized discourse : the case of verbal relations in patent claims
Mostra el registre complet Registre parcial de l'ítem
- dc.contributor.author Ferraro, Gabriela
- dc.contributor.other Wanner, Leo
- dc.contributor.other Universitat Pompeu Fabra. Departament de Tecnologies de la Informació i les Comunicacions
- dc.date.accessioned 2024-03-16T02:34:37Z
- dc.date.available 2024-03-16T02:34:37Z
- dc.date.issued 2012-10-03T07:32:09Z
- dc.date.issued 2012-10-03T07:32:09Z
- dc.date.issued 2012-07-20
- dc.date.modified 2024-03-15T10:58:05Z
- dc.description.abstract This thesis addresses the problem of the development of Natural Language Processing techniques for the extraction and generalization of compositional and functional relations from specialized written texts and, in particular, from patent claims. One of the most demanding tasks tackled in the thesis is, according to the state of the art, the semantic generalization of linguistic denominations of relations between object components and processes described in the texts. These denominations are usually verbal expressions or nominalizations that are too concrete to be used as standard labels in knowledge representation forms -as, for example, “A leads to B”, and “C provokes D”, where “leads to” and “provokes” both express, in abstract terms, a cause, such that in both cases “A CAUSE B” and “C CAUSE D” would be more appropriate. A semantic generalization of the relations allows us to achieve a higher degree of abstraction of the relationships between objects and processes described in the claims and reduces their number to a limited set that is oriented towards relations as commonly used in the generic field of knowledge representation.
- dc.description.abstract Esta tesis se centra en el del desarrollo de tecnologías del Procesamiento del Lenguage Natural para la extracción y generalización de relaciones encontradas en textos especializados; concretamente en las reivindicaciones de patentes. Una de las tareas más demandadas de nuestro trabajo, desde el punto vista del estado de la cuestión, es la generalización de las denominaciones lingüísticas de las relaciones. Estas denominaciones, usualmente verbos, son demasiado concretas para ser usadas como etiquetas de relaciones en el contexto de la representación del conocimiento; por ejemplo, “A lleva a B”, “B es el resultado de A” están mejor representadas por “A causa B”. La generalización de relaciones permite reducir el n\'umero de relaciones a un conjunto limitado, orientado al tipo de relaciones utilizadas en el campo de la representación del conocimiento.
- dc.description.abstract Programa de doctorat en Tecnologies de la Informació i les Comunicacions
- dc.format 159 p.
- dc.format application/pdf
- dc.format application/pdf
- dc.identifier http://hdl.handle.net/10803/84174
- dc.identifier B. 28451-2012
- dc.identifier.uri http://hdl.handle.net/10230/17072
- dc.language.iso eng
- dc.publisher Universitat Pompeu Fabra
- dc.rights ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.
- dc.rights info:eu-repo/semantics/openAccess
- dc.source TDX (Tesis Doctorals en Xarxa)
- dc.subject.keyword Artificial intelligence
- dc.subject.keyword Natural language processing
- dc.subject.keyword Relation extraction
- dc.subject.keyword Linguistic dependency
- dc.subject.keyword Deep syntactic parsing
- dc.subject.keyword Surface syntactic parsing
- dc.subject.keyword Valency structure
- dc.subject.keyword Relation generalization
- dc.subject.keyword Relation clustering
- dc.subject.keyword Relation cluster labeling
- dc.subject.keyword Text simplification
- dc.subject.keyword Patent processing
- dc.subject.keyword Patent claim processing
- dc.subject.keyword Meaning-Text Theory
- dc.subject.keyword Machine learning
- dc.subject.keyword 81
- dc.title Towards deep content extraction from specialized discourse : the case of verbal relations in patent claims
- dc.type info:eu-repo/semantics/doctoralThesis
- dc.type info:eu-repo/semantics/publishedVersion