Metodología para la traducción de términos compuestos mediante corpus
Metadatos
Afficher la notice complèteEditorial
Universidad de Antioquia
Materia
Corpus comparable Semántica distribucional Término compuesto Terminología Términos equivalentes Traducción de textos especializados
Date
2021-07-13Referencia bibliográfica
Cabezas García, M. (2021). Metodología para la traducción de térmi nos compuestos mediante corpus. Mutatis Mutandis. Revista Latinoamericana de Traducción, 14(2), 451-468. [https://doi.org/10.17533/udea.mut.v14n2a08]
Patrocinador
El presente trabajo se ha realizado en el marco del proyecto «Herramientas terminológicas orientadas hacia la traducción de textos medioambientales» (FFI2017-89127-P), financiado por el Ministerio de Economía y Competitividad.Résumé
Los términos compuestos son una de las principales dificultades en la traducción de los textos especializados. Dado que estos términos no siempre figuran en los recursos terminológicos o lo hacen de
forma poco exhaustiva, los traductores y terminólogos deben dominar diversas técnicas para resolver
sus dificultades. Tradicionalmente, se han utilizado textos paralelos para extraer terminología y adquirir conocimientos especializados. Estos textos pueden compilarse en forma de corpus comparables
(es decir, textos escritos originalmente en la lengua de origen y de llegada), que pueden utilizarse para
explotar un mayor número de textos de manera más eficiente. No obstante, a menudo hay reticencia
a su utilización, en algunos casos debido a la falta de conocimiento de las técnicas de consulta. En
este estudio se describe una metodología para identificar en corpus comparables los equivalentes en
inglés de los términos compuestos en español, con vistas a: 1) facilitar esta tarea en la labor cotidiana
de los traductores y terminólogos; y 2) proporcionarles técnicas de extracción manual en corpus.
Con este fin, analizamos un corpus comparable de textos especializados sobre energía eólica escritos
originalmente en español e inglés. La metodología propuesta se basa en la semántica distribucional y
consiste en la identificación y la comparación de elementos contextuales de los conceptos en ambos
idiomas. Los resultados muestran que este procedimiento simplifica la identificación de equivalentes
de los términos compuestos en corpus. Multiword terms (mwts) are one of the main stumbling blocks in specialized translation. Transla tors and terminologists must master a variety of techniques to find their interlinguistic equivalents,
because they are not always well described or even included in most terminological resources. Par allel texts, which are very useful for terminology extraction and knowledge acquisition, are usually
employed for these purposes. They can be compiled in the form of comparable corpora, which are
collections of texts originally written in the source and target languages. To make the most of them, translators must master advanced corpus query techniques. Unfortunately, this is not always the case.
This paper presents a corpus-based methodology that facilitates the identification of English equiv alents of Spanish mwts and provides terminologists and translators with manual corpus query techniques that simplify the translation of mwts. A comparable corpus formed by original Spanish and
English texts on wind power was analyzed for the purposes of the study. We proposed a translation
methodology based on distributional semantics, which entailed the obtention and comparison of
contextual elements of the concepts in the source and target languages. Our results showed that this
technique facilitates the identification of mwt translation equivalents in corpus.