What do post-editors correct? A fine-grained analysis of SMT and NMT errors
Mostra el registre complet Registre parcial de l'ítem
- dc.contributor.author Álvarez-Vidal, Sergi
- dc.contributor.author Oliver, Antoni
- dc.contributor.author Badia i Cardús, Antoni
- dc.date.accessioned 2022-06-02T05:53:03Z
- dc.date.available 2022-06-02T05:53:03Z
- dc.date.issued 2021
- dc.description.abstract The recent improvements in neural MT (NMT) have driven a shift from statistical MT (SMT) to NMT. However, to assess the usefulness of MT models for post-editing (PE) and have a detailed insight of the output they produce, we need to analyse the most frequent errors and how they affect the task. We present a pilot study of a fine-grained analysis of MT errors based on post-editors corrections for an English to Spanish medical text translated with SMT and NMT. We use the MQM taxonomy to compare the two MT models and have a categorized classification of the errors produced. Even though results show a great variation among posteditors’ corrections, for this language combination fewer errors are corrected by post-editors in the NMT output. NMT also produces fewer accuracy errors and errors that are less critical.en
- dc.description.abstract Les millores recents en la TA neuronal (TAN) han impulsat un canvi de la TA estadística (TAE) a la TAN. Tanmateix, per avaluar la utilitat dels models de TA per a la postedició (PE), és fonamental analitzar els errors més freqüents i com afecten la tasca. Presentem un estudi pilot d'una anàlisi detallada dels errors de la TA basat en correccions de postedició d’un text mèdic traduït de l'anglès al castellà amb TAE i TAN. Hem utilitzat la taxonomia MQM per comparar els dos models de TA i hem classificat els errors produïts. La nostra anàlisi també inclou una avaluació de la variació entre els posteditors, que se centra en els passatges amb una major variació en la postedició.cat
- dc.description.abstract Los avances recientes en TA neuronal (TAN) han producido un giro desde la TA estadística (TAE) hacia la TAN. Sin embargo, para evaluar la utilidad de los modelos de TA para la posedición, es imprescindible analizar los errores más frecuentes y cómo afectan a esta tarea. Presentamos el estudio piloto de un análisis pormenorizado de errores en TA basado en las correcciones realizadas por los poseditores en la traducción de un texto médico realizada del inglés al castellano mediante TAE y TAN. Utilizamos la taxonomía MQM para comparar los dos modelos de TA y obtener una clasificación categorizada de los errores resultantes. Nuestro análisis incluye también una evaluación de las diferencias entre poseditores, centrada en los pasajes en los que la posedición presentaba mayor disparidad.spa
- dc.format.mimetype application/pdf*
- dc.identifier.citation Álvarez-Vidal S, Oliver A, Badia T. What do post-editors correct? A fine-grained analysis of SMT and NMT errors. Revista Tradumàtica. 2021;(19):131-47. DOI: 10.5565/rev/tradumatica.286
- dc.identifier.doi https://doi.org/10.5565/rev/tradumatica.286
- dc.identifier.issn 1578-7559
- dc.identifier.uri http://hdl.handle.net/10230/53347
- dc.language.iso eng
- dc.publisher Universitat Autònoma de Barcelona
- dc.relation.ispartof Revista Tradumàtica. 2021;(19):131-47
- dc.rights (c) 2021 Sergi Alvarez-Vidal, Antoni Oliver, Toni Badia Aquesta obra està sota una llicència internacional Creative Commons Reconeixement 4.0.
- dc.rights.accessRights info:eu-repo/semantics/openAccess
- dc.rights.uri https://creativecommons.org/licenses/by/4.0/
- dc.subject.keyword Traducció automàticacat
- dc.subject.keyword TA
- dc.subject.keyword TAN
- dc.subject.keyword Postediciócat
- dc.subject.keyword Traducció automàtica neuronalcat
- dc.subject.keyword Taxonomia d'errorscat
- dc.subject.keyword Machine translationen
- dc.subject.keyword MTen
- dc.subject.keyword NMTen
- dc.subject.keyword Post-editingen
- dc.subject.keyword Neural machine translationen
- dc.subject.keyword Error taxonomyen
- dc.subject.keyword Traducción automáticaspa
- dc.subject.keyword Posediciónspa
- dc.subject.keyword Traducción automática neuronalspa
- dc.subject.keyword Taxonomía de erroresspa
- dc.title What do post-editors correct? A fine-grained analysis of SMT and NMT errors
- dc.type info:eu-repo/semantics/article