Towards deep content extraction from specialized discourse : the case of verbal relations in patent claims

Welcome to the UPF Digital Repository

Ferraro, Gabriela. Towards deep content extraction from specialized discourse : the case of verbal relations in patent claims. 2012
http://hdl.handle.net/10230/17072
dc.contributor.author Ferraro, Gabriela
dc.contributor.other Wanner, Leo
dc.contributor.other Universitat Pompeu Fabra. Departament de Tecnologies de la Informació i les Comunicacions
dc.date.accessioned 2013-07-12T01:50:16Z
dc.date.available 2013-07-12T01:50:16Z
dc.date.issued 2012-07-20
dc.identifier.uri http://hdl.handle.net/10230/17072
dc.description.abstract This thesis addresses the problem of the development of Natural LanguageProcessing techniques for the extraction and generalization of compositionaland functional relations from specialized written texts and, in particular, frompatent claims. One of the most demanding tasks tackled in the thesis is,according to the state of the art, the semantic generalization of linguisticdenominations of relations between object components and processesdescribed in the texts. These denominations are usually verbal expressions ornominalizations that are too concrete to be used as standard labels inknowledge representation forms -as, for example, “A leads to B”, and “Cprovokes D”, where “leads to” and “provokes” both express, in abstractterms, a cause, such that in both cases “A CAUSE B” and “C CAUSE D”would be more appropriate. A semantic generalization of the relations allowsus to achieve a higher degree of abstraction of the relationships betweenobjects and processes described in the claims and reduces their number to alimited set that is oriented towards relations as commonly used in the genericfield of knowledge representation.
dc.description.abstract Esta tesis se centra en el del desarrollo de tecnologías del Procesamiento delLenguage Natural para la extracción y generalización de relacionesencontradas en textos especializados; concretamente en las reivindicacionesde patentes. Una de las tareas más demandadas de nuestro trabajo, desde elpunto vista del estado de la cuestión, es la generalización de lasdenominaciones lingüísticas de las relaciones. Estas denominaciones,usualmente verbos, son demasiado concretas para ser usadas como etiquetasde relaciones en el contexto de la representación del conocimiento; porejemplo, “A lleva a B”, “B es el resultado de A” están mejor representadaspor “A causa B”. La generalización de relaciones permite reducir el n\'umerode relaciones a un conjunto limitado, orientado al tipo de relaciones utilizadasen el campo de la representación del conocimiento.
dc.format.mimetype 159 p.
dc.format.mimetype application/pdf
dc.language.iso eng
dc.publisher Universitat Pompeu Fabra
dc.rights info:eu-repo/semantics/openAccess
dc.rights ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.
dc.title Towards deep content extraction from specialized discourse : the case of verbal relations in patent claims
dc.date.modified 2013-07-10T11:42:21Z
dc.subject.keyword Artificial intelligence
dc.subject.keyword Natural language processing
dc.subject.keyword Relation extraction
dc.subject.keyword Linguistic dependency
dc.subject.keyword Deep syntactic parsing
dc.subject.keyword Surface syntactic parsing
dc.subject.keyword Valency structure
dc.subject.keyword Relation generalization
dc.subject.keyword Relation clustering
dc.subject.keyword Relation cluster labeling
dc.subject.keyword Text simplification
dc.subject.keyword Patent processing
dc.subject.keyword Patent claim processing
dc.subject.keyword Meaning-Text Theory
dc.subject.keyword Machine learning
dc.subject.keyword 81

See full text
http://hdl.handle.net/10803/84174

Search


Advanced Search

Browse

My Account

Statistics