Welcome to the UPF Digital Repository

A first approach to the automatic detection of zero subjects and impersonal constructions in portuguese

Show simple item record

dc.contributor.author Rello, Luz, 1984-
dc.contributor.author Ferraro, Gabriela
dc.contributor.author Gayo, Iria
dc.date.accessioned 2020-03-06T15:08:15Z
dc.date.available 2020-03-06T15:08:15Z
dc.date.issued 2012
dc.identifier.citation Rello L, Ferraro G, Gayo I. A first approach to the automatic detection of zero subjects and impersonal constructions in portuguese. Procesamiento del lenguaje natural. 2012 Sep;49:163-70.
dc.identifier.issn 1135-5948
dc.identifier.uri http://hdl.handle.net/10230/43832
dc.description.abstract Este trabajo constituye un primer intento de abordar la detección automática de sujetos elididos y de construcciones impersonales en portugués de Brasil, una tarea que no nos consta que se haya llevado a cabo previamente en esta lengua. Para ello, creamos un corpus que contiene más de 5.600 casos anotados con las clases que deben identificarse: sujetos explícitos, sujetos o pronombres omitidos y construcciones impersonales. Estos casos se clasificaron mediante aprendizaje automático basado en rasgos lingüísticamente motivados. Los resultados obtenidos son modestos, aunque prometedores, y proporcionan una orientación para futuros trabajos en este ámbito.
dc.description.abstract In this paper we present a first approximation to the automatic detection of zero subjects and impersonal constructions in Brazilian Portuguese. To the best of our knowledge, this is the first attempt of approaching such task using machine learning in Portuguese. We compiled a corpus containing more than 5,600 instances annotated with the classes to be identified: explicit subjects, zero subjects or pronouns and impersonal constructions. We applied machine learning using linguistically motivated features to classify the instances. The results are modest but promising and provide guidance for future work.
dc.format.mimetype application/pdf
dc.language.iso eng
dc.publisher Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN)
dc.relation.ispartof Procesamiento del lenguaje natural. 2012 Sep;49:163-70
dc.rights © Sociedad Española para el Procesamiento de Lenguaje Natural https://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.uri https://creativecommons.org/licenses/by-nc-nd/4.0/
dc.title A first approach to the automatic detection of zero subjects and impersonal constructions in portuguese
dc.type info:eu-repo/semantics/article
dc.subject.keyword Elipsis de sujeto
dc.subject.keyword Construcción impersonal
dc.subject.keyword Pronombre cero
dc.subject.keyword Sujeto mulo
dc.subject.keyword Aprendizaje automático
dc.subject.keyword Subject ellipsis
dc.subject.keyword Impersonal construction
dc.subject.keyword Zero pronoun
dc.subject.keyword Null subject
dc.subject.keyword Machine learning
dc.rights.accessRights info:eu-repo/semantics/openAccess
dc.type.version info:eu-repo/semantics/publishedVersion

Thumbnail

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Advanced Search

Browse

My Account

Statistics

In collaboration with Compliant to Partaking