Show simple item record

dc.contributor.authorRivera Trigueros, Irene 
dc.contributor.authorOlvera Lobo, María Dolores 
dc.date.accessioned2023-01-19T12:50:51Z
dc.date.available2023-01-19T12:50:51Z
dc.date.issued2021
dc.identifier.citationRivera-Trigueros, I. & Olvera-Lobo, M. D. (2021). Building a Corpus for Corporate Websites Machine Translation Evaluation. A Step by Step Methodological Approach. En: Mitkov, R.; Sosoni, V.; Giguère, J.L.; Murgolo, E. & Deysel, E. (eds.) Proceedings of Translation and Interpreting Technology Online (TRITON 2021), 5-7 July 2021, 93-101.es_ES
dc.identifier.urihttps://hdl.handle.net/10481/79152
dc.description.abstractEl objetivo de este trabajo es describir el proceso llevado a cabo para desarrollar un corpus paralelo compuesto por textos extraídos de las páginas web corporativas de PYMES del sur de España del sector sanitario que servirá de base para la evaluación de la calidad de la MT. Las etapas para la compilación de los corpus paralelos fueron: (i) selección de sitios web con contenidos traducidos al inglés y al español, (ii) descarga de los archivos HTML de los sitios web seleccionados, (iii) filtrado de archivos y (iii) filtrado de archivos y emparejamiento de los archivos en inglés con sus equivalentes en español, (iv) compilación de corpus individuales (EN y ES) para cada uno de los sitios web seleccionados, (v) fusión de los corpus individuales en un corpus de dos corpus generales. los corpus individuales en dos corpus generales, uno en inglés y otro en español. español, (vi) selección de una muestra representativa de segmentos que se utilizarán como traducciones originales (ES) y de referencia (EN), (vii) construcción del corpus paralelo destinado a la evaluación de la MT. El corpus paralelo generado servirá para la futura evaluación de la calidad de la traducción automática. Además, los corpus monolingües generados durante el proceso podrían servir de base para llevar a cabo investigaciones centradas en análisis lingüístico-bilingüe o monolingüe.es_ES
dc.language.isoenges_ES
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internacional*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.title Building a Corpus for Corporate Websites Machine Translation Evaluation. A Step by Step Methodological Approaches_ES
dc.typeinfo:eu-repo/semantics/conferenceObjectes_ES
dc.rights.accessRightsinfo:eu-repo/semantics/openAccesses_ES
dc.identifier.doihttps://doi.org/10.26615/978-954-452-071-7_011


Files in this item

[PDF]

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivatives 4.0 Internacional
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivatives 4.0 Internacional