Welcome to the UPF Digital Repository

Spanish morphological generation with wide-coverage lexicons and decision trees

Show simple item record

dc.contributor.author Ferrés, Daniel
dc.contributor.author AbuRa’ed, Ahmed
dc.contributor.author Saggion, Horacio
dc.date.accessioned 2017-03-10T12:49:21Z
dc.date.available 2017-03-10T12:49:21Z
dc.date.issued 2017
dc.identifier.citation Ferrés D, AbuRa'ed A, Saggion H. Spanish morphological generation with wide-coverage lexicons and decision trees. Procesamiento del Lenguaje Natural. 2017;58:109-116.
dc.identifier.issn 1135-5948
dc.identifier.uri http://hdl.handle.net/10230/28208
dc.description.abstract Morphological Generation is the task of producing the appropiate in- flected form of a lemma in a given textual context and according to some morphological features. This paper describes and evaluates wide-coverage morphological lexicons and a Decision Tree algorithm that perform Morphological Generation in Spanish at state-of-the art level. The Freeling, Leffe and Apertium Spanish lexicons, the J48 Decision Tree algorithm and the combination of J48 with Freeling and Leffe lexicons have been evaluated with the following datasets for Spanish: i) CoNLL2009 Shared Task dataset, ii) Durrett and DeNero dataset of Spanish Verbs (DDN), and iii) SIGMORPHON 2016 Shared Task (task-1) dataset. The results show that: i) the Freeling and Leffe lexicons achieve high coverage and precision over the DDN and SIGMORPHON 2016 datasets, ii) the J48 algorithm achieves state-of-the-art results in all of the three datasets, and iii) the combination of Freeling, Leffe and the J48 algorithm outperformed the results of our other approaches in the three evaluation datasets, improved slightly the results of the CoNLL2009 and SIGMORPHON 2016 reported in the state-of-the-art literature, and achieved results comparable to the ones reported in the state-of-the-art literature on the DDN dataset evaluation.
dc.description.abstract La Generación Morfológica es la tarea de producir la forma flexionada apropiada de un lemma en un determinado contexto textual y en concordancia con algunas características morfol´ogicas. En este artículo se presentan y se evaluan algunos lexicones morfológicos de amplia cobertura y un algoritmo de árboles de decisión para la Generación Morfólogica en español. Los lexicones para el español Freeling, Leffe y Apertium, el algoritmo de árboles de decisión J48 y la combinación de los lexicones Freeling y Leffe con el J48 han sido evaluados con los siguientes conjuntos de datos para el español: i) conjunto de datos de la CoNLL2009 Shared Task, ii) el conjunto de datos de verbos para el español de Durrett y DeNero (DDN), y iii) el conjunto de datos para el español de la evaluación SIGMORPHON 2016 Shared Task (task-1). Los resultados muestran que: i) los lexicones morfológicos consiguen alta cobertura y precisión en los conjuntos de datos DDN y SIGMORPHON 2016, ii) el algoritmo J48 por si sólo alcanza resultados en el estado del arte en los tres conjuntos de evaluación, y iii) que la combinación de predicciones de Freeling, Leffe y el algoritmo J48 mejora los resultados de nuestras otras implementaciones en los tres conjuntos de datos evaluados, que además mejoran ligeramente los resultados reportados en el estado del arte en los conjuntos de datos del CoNLL2009 y del SIGMORPHON 2016, y que consiguen resultados comparables con los reportados en el estado del arte de la evaluación del conjunto de datos DDN.
dc.description.sponsorship This work was partly funded by the ABLETO-INCLUDE project (European Commission CIP Grant No. 621055), the TUNER project (TIN2015-65308-C5-5-R, MINECO/FEDER, UE), and the Spanish MINECO Ministry (MDM-2015-0502).
dc.format.mimetype application/pdf
dc.language.iso eng
dc.publisher Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN)
dc.relation.ispartof Procesamiento del Lenguaje Natural. 2017;58:109-116.
dc.rights © Sociedad Española para el Procesamiento de Lenguaje Natural
dc.title Spanish morphological generation with wide-coverage lexicons and decision trees
dc.type info:eu-repo/semantics/article
dc.subject.keyword Morphological generation
dc.subject.keyword Morphological lexicons
dc.subject.keyword Decision trees
dc.subject.keyword Natural language generation
dc.subject.keyword Generador morfológico
dc.subject.keyword Lexicones morfológicos
dc.subject.keyword Árboles de decisión
dc.subject.keyword Generación de lenguaje natural
dc.relation.projectID info:eu-repo/grantAgreement/EC/FP7/621055
dc.relation.projectID info:eu-repo/grantAgreement/Es/1PE/TIN2015-65308-C5-5-R
dc.rights.accessRights info:eu-repo/semantics/openAccess
dc.type.version info:eu-repo/semantics/publishedVersion


This item appears in the following Collection(s)

Show simple item record

Search DSpace


Advanced Search

Browse

My Account

Statistics

Compliant to Partaking