Traducción automática y literatura: ¿enemigas íntimas?, Rocío Serrano

Viernes, 11 de septiembre de 2020.

Cuando hablamos de traducción literaria y mencionamos —siquiera de pasada— las tecnologías aplicadas a la traducción, el sentir general es que esta vertiente está del todo reñida con la tecnología, como si de auténticas archienemigas se tratase. En algunos casos, parece existir incluso cierta inclinación a denostar el uso de la traducción automática en concreto; el hecho de demostrar la absoluta imposibilidad de que esta pueda ser de ayuda en la traducción de una obra literaria (y si es posible, extrapolar el resultado a cualquier tipo de traducción) se vuelve para algunos toda una cruzada personal.

Sin embargo, determinados estudios recientes demuestran que el porcentaje de segmentos traducidos por motores de traducción automática cuya calidad llega a igualar la de una traducción humana va en aumento. A la vista de este hecho, cabe plantearse algunas cuestiones que atañen al futuro de la traducción literaria tal como la conocemos. ¿Se puede afirmar que la traducción automática constituye ya una amenaza para los traductores literarios? ¿Estamos cada vez más cerca de que la posedición de obras literarias sea una realidad? O, si queremos partir de un punto de vista constructivo, ¿sería posible aplicarla para mejorar de forma sustancial la productividad de los traductores sin que ello suponga un menoscabo de la calidad del texto traducido? A todo ello trataré de dar respuesta en el presente artículo.

La traducción literaria: qué tiene de especial

Desde luego que no es mi intención desgranar aquí cuáles son las características de la traducción literaria, aunque sí debo traerlas a colación para entender por qué los textos literarios se lo ponen tan difícil a los motores de traducción automática.

Hasta la fecha, los investigadores en traducción automática coinciden en que los textos literarios constituyen el mayor desafío para las máquinas (Toral y Way, 2018). No les falta razón: una de las claves que diferencian la traducción literaria de otras ramas es que lo que se dice, el mensaje, puede llegar a ocupar un segundo plano con relación a la forma en que se expresa dicho mensaje. De hecho, los textos literarios se caracterizan por incluir aspectos formales y semánticos que a los ordenadores resulta especialmente complicado interpretar —por ejemplo, las figuras retóricas y los juegos de palabras—. El humor y la ironía también son difíciles de digerir para la máquina, pese a los tímidos avances al respecto que pueda haber traído la traducción automática neuronal (sobre la que profundizaremos en breve). Y, por supuesto, no podemos olvidarnos del contexto. La reivindicación del traductor como mediador cultural no es vana, pues nuestro papel quedaría reducido al de meros transmisores de palabras o frases descontextualizadas de A a B si no tuviéramos en cuenta este aspecto. Incluso a los humanos se nos puede hacer cuesta arriba una traducción si dicho contexto no está claro, como sucede cuando en una obra literaria se insinúan hechos que se desvelan en una etapa posterior y, por consiguiente, dificultan la tarea de dar con el término exacto a la primera.
En resumen, para poder preservar la experiencia de lectura de la que se podría disfrutar en el idioma original, los factores que intervienen hasta ahora superan los límites de «comprensión» de los sistemas informáticos y, tal como afirma Bernardo (2014), una traducción hecha mediante un dispositivo no puede ofrecer características como la capacidad de crear, el poder imaginativo y la posibilidad tanto de desarrollar como de trascender los significados sin la intervención del ser pensante; esto es, el traductor humano.

Sin perjuicio de lo anterior, los avances que se han venido dando en la última década han llevado a diversos investigadores a plantear que la traducción literaria puede beneficiarse de la intervención de las máquinas, lo que ya ocurre con otro tipo de textos. Por ejemplo, según Toral y Way (2018), el auge del libro electrónico es cada vez mayor y, por tanto, su cuota de mercado no deja de crecer (solo en 2019, el crecimiento del libro digital fue de un 12,5 % en todo el mundo y de un 12 % en España ). Así pues, el hecho de que cada vez haya más libros electrónicos disponibles posibilita la creación de corpus paralelos destinados a entrenar sistemas de traducción automática adaptados a la traducción de novelas, algo que debería mejorar los resultados si tenemos en cuenta estudios como el de Pecina et al. (2014), en el que quedó patente que un motor de traducción automática estadística ofrece mejores resultados si se entrena con datos similares a los que se aplicará después.
Estos autores también mencionan la época dorada que está viviendo la traducción automática neuronal: de forma muy somera, este tipo de motores tratan de emular, mediante algoritmos muy complejos y unos ordenadores con una capacidad de procesamiento formidable, la manera en que funciona y especialmente aprende el cerebro humano. No asocian una secuencia A en la lengua de origen a una secuencia B en la lengua de destino, sino que tienen en cuenta muchos más aspectos relacionados con el propio contexto de la oración de origen, las palabras anteriores en la oración de destino y un concepto novedoso, el de atención, que se centra en la traducción de la siguiente palabra de destino teniendo en cuenta la parte determinada de la frase donde se halle. Son diferentes de los motores de traducción estadísticos, que se basan sobre todo en la idea de que las oraciones del idioma de origen pueden transformarse en las del idioma de destino mediante la tokenización, que consiste en dividir esas oraciones en sintagmas, cadenas de palabras u otros elementos significativos. En estos motores, el propio sistema calcula cuál es la secuencia de palabras más probable que puede darse en el idioma de destino para una secuencia similar en el idioma de origen.

Google incorporó motores neuronales a su traductor automático en 2016 y DeepL se presentó en 2017; desde entonces los avances en traducción automática neuronal no han dejado de sucederse y su potencial, de aumentar. Por ejemplo, procesan las frases largas con algo más de soltura que los motores estadísticos, pero donde de verdad destacan es en la fluidez con que se leen los textos que generan.

Desde luego, no se puede negar que los avances en traducción automática están siendo incontenibles y comienzan a impregnar campos que parecían inmunes a sus posibilidades, como la traducción literaria. Pero ¿en qué medida es así?

Avances recientes en traducción automática aplicada a la literatura

No hay que retroceder demasiado en el tiempo para darse cuenta de la velocidad de vértigo a la que se están produciendo mejoras en este ámbito. Aunque desde 2012 se celebra un encuentro sobre lingüística computacional aplicada a la literatura , por aquel entonces la traducción literaria parecía inmune al influjo de las máquinas. En 2013 se hizo un tímido intento de comparar las traducciones humanas y las automáticas para conocer cuáles eran los principales puntos de dificultad (Jones e Irvine, 2013). Un año después, Bernardo (2014) comparó una traducción humana al portugués de Brasil de la novela Moll Flanders, de Daniel Defoe, con los resultados generados por Google Translate. El motor, de carácter generalista y mucho menos evolucionado que el actual, arrojó unos resultados que se alejaban notablemente de la experiencia de lectura que sí posibilitaba la traducción humana. Las traducciones obtenidas reproducían las secuencias casi palabra por palabra; tampoco tenían en cuenta los aspectos culturales o el contexto donde se empleaba el léxico. Bernardo reconocía que, en los fragmentos con cierta complicación semántica, el resultado estaba muy lejos de ser satisfactorio. Ese mismo año, Besacier (2014) presentaba un experimento en el que tradujo automáticamente un relato corto del inglés al francés para su posterior posedición. Sin embargo, este experimento sacrificaba uno de los aspectos más importantes de la literatura, la calidad y, por ende, la experiencia de lectura. Los poseditores no eran traductores profesionales y el resultado del experimento incidía en la posibilidad de reducir costes, eso sí, a costa de la calidad literaria.

Con todo, solo un año después, Toral y Way (2015a) exploraban la aplicabilidad de la traducción automática a la literatura desde otra perspectiva: la de usar un motor de traducción automática estadística propio, entrenado sobre todo con textos literarios y enfocado, por tanto, a la traducción de dicho tipo de producciones escritas. Los autores tradujeron la novela El prisionero del cielo, de Carlos Ruiz Zafón, del español al catalán, dos idiomas muy relacionados, y compararon el resultado con la traducción hecha por un profesional (o traducción de referencia). Concluyeron que en torno al 20 % de las frases producidas por el motor eran exactamente iguales a las propuestas del traductor humano. Asimismo, lo generado por el motor fue sometido a evaluación humana y se determinó que un 60 % de los segmentos tenían una calidad similar a la de la traducción de referencia. Sin duda, esto constituyó un salto cualitativo notable con respecto a los estudios anteriores y, como lo denominaron los autores, «un prometedor primer paso» con respecto a la traducción de textos literarios de manera automática. Ese mismo año publicaron otro estudio (Toral y Way, 2015b) en el que, mediante el análisis de la traducción automática de L’Étranger de Albert Camus, quedó patente que el optimismo se diluía cuando las traducciones se llevaban a cabo entre idiomas más distantes entre sí, como el francés y el inglés. En cualquier caso, las propuestas generadas por el motor eran bastante más literales que la traducción de referencia, pese a lo cual los investigadores aún consideran sus resultados como un buen punto de partida para la posedición. Aun así, introducen una idea que retomaremos después: la posibilidad no ya de poseditar las obras literarias, sino de utilizar las sugerencias del motor simplemente como apoyo.
2018 fue un año especialmente prolífico en la investigación sobre traducción automática y tecnologías aplicadas a la traducción. Rothwell (2018, tal como se cita en Youdale [2020]) determinó que en la retraducción de clásicos, el uso de memorias de traducción creadas a partir de corpus bilingües conformados por el original y la traducción anterior de la obra en cuestión posibilitaba la consulta de las soluciones empleadas por el traductor anterior de un modo rápido y sencillo. Por su parte, Toral et al. (2018) llevaron a cabo un experimento de posedición pura de un capítulo de la novela Warbreaker de Brandon Sanderson (en español, El aliento de los dioses) con sendos motores, uno estadístico y otro neuronal. Seis traductores profesionales especializados en literatura llevaron a cabo tres traducciones diferentes del fragmento: desde cero, poseditando el resultado del motor estadístico y haciendo lo propio con lo generado por el neuronal. Los autores del estudio quisieron estudiar tres dimensiones: la temporal, la técnica y la cognitiva —esta última es de especial importancia, pues se hace tanto hincapié en la productividad que se deja de lado el hecho de que poseditar implica un esfuerzo cognitivo notable—. Los mejores resultados se obtuvieron con el motor neuronal, aunque con ambos se logró un aumento de la productividad: un 18 % con el motor estadístico y un 36 % con el neuronal. También registraron el número de pulsaciones del teclado que realizaban los traductores y la reducción era de un 9 % en el caso del motor estadístico, mientras que con el neuronal alcanzó el 23 %. Cuando analizaron el esfuerzo cognitivo basándose en el número de pausas y su duración: con ambos motores se hicieron menos pausas, pero estas eran un 14 % y un 25 % más prolongadas, lo que supone un aumento del tiempo dedicado a ellas en relación con el tiempo que se dedica a una traducción desde cero (63 % frente a 65,6 y 65,3 %, respectivamente).

Ese mismo año, Toral y Way (2018) publicaron un artículo en el que volvieron a comparar dos motores, uno estadístico y otro neuronal, solo que en este caso el número de novelas traducidas automáticamente fue de doce. En todos los casos, el motor neuronal superó en calidad al estadístico. Asimismo, en dos de cada tres libros traducidos automáticamente, los lectores nativos que participaron en la evaluación determinaron que una tercera parte de las traducciones generadas por el motor neuronal y una sexta parte de las producidas con el motor estadístico eran de calidad similar a las traducciones humanas.

A pesar de los resultados obtenidos en los estudios que reseñamos, los motores estadísticos continúan utilizándose en determinados contextos; además, para tipologías textuales y pares de idiomas concretos siguen funcionando muy bien, y su creación y posterior entrenamiento resultan asequibles incluso cuando no se dispone de los recursos necesarios para entrenar un motor de traducción automática neuronal. Por eso, algunos investigadores siguen trabajando para mejorar la comprensión de los textos por parte de los motores. Un ejemplo es el estudio de Al-Batineh y Rabadi (2019), en el que introducen un componente denominado Latent Semantic Analysis (análisis semántico latente, LSA), capaz de entender y categorizar textos literarios según la temática de cara a filtrar los datos de entrenamiento de un motor dado, lo cual mejora los resultados obtenidos en la posterior traducción automática.

Por último, la obra de Youdale (2020) aporta una visión no solo más actual, sino también más conciliadora en relación con el uso de traducción automática y tecnologías en el ámbito de la literatura. Entre otras cosas, aunque reconoce los avances y especifica la posibilidad de que un motor de traducción automática pueda llegar a producir traducciones de una calidad similar a la humana en determinadas circunstancias, es consciente de que todavía queda mucho camino por recorrer. Asimismo, reconoce que numerosos aspectos metatextuales siguen sin gestionarse con solvencia; aún se requieren muchas mejoras en cuanto a la sintaxis —tanto en lo que respecta al procesamiento como a la reproducción—, y los factores que comentábamos al principio (como el humor, la ironía o las figuras retóricas) siguen escapando a la comprensión de los motores.

Conclusión: ¿quién dijo miedo?

No cabe duda de que se están produciendo avances en el campo de la traducción automática que pueden resultar abrumadores. En otras ramas de la traducción, su uso se ha implantado hasta el punto de que hay textos (como los técnicos) que ya apenas se traducen desde el principio, sino que se poseditan directamente. Por el contrario, hay otros donde su aplicación llega a ser contraproducente, pues el traductor invierte más tiempo en evaluar, borrar y retraducir que si hubiera traducido el texto desde cero —por ejemplo, en traducción audiovisual o el marketing, rara vez permiten que el traductor mejore su productividad—. El caso de la traducción literaria es parecido: aunque un tercio de las frases pueda llegar a alcanzar una calidad similar a la que ofrece un traductor humano, hay dos tercios de la obra que aún necesitan de la intervención de ese ser pensante para que se pueda llegar a disfrutar de la experiencia de lectura a la que suele aspirar el lector promedio.

También es cierto que la tecnología puede llegar a ser de gran ayuda en un momento dado. Muchos traductores literarios se niegan a utilizar herramientas de traducción, pues la segmentación en frases dificulta la captación de párrafo completo y provoca que el traductor pierda la perspectiva global, pero Paul Filkin ya resolvió este inconveniente en 2013 con la segmentación por párrafos.

Youdale (2020) rescata la afirmación de Toral y Way (2015) sobre la conveniencia de emplear sugerencias de traducción automática, en lugar de ofrecer directamente la posibilidad de poseditar la obra. Además, trabajar con memorias de traducción y corpus bilingües implica que cada traductor va creando su propio repositorio de terminología que puede aprovechar en trabajos posteriores, por no hablar de la posibilidad de generar bases de datos terminológicas a partir de esas memorias de traducción que puedan dividirse por temáticas. Lo que sí es cierto es que poseditar implica una forma de trabajar diferente y, sobre todo, procesos cognitivos distintos a los de la traducción al uso, de manera que se altera la manera de leer y procesar el texto para buscar la solución más adecuada. Y, por supuesto, las máquinas carecen de algo muy necesario para encontrar la solución idónea: no pueden recrear ese ejercicio de empatía que implica ponerse en la piel del autor y tratar de trasladar a nuestro idioma lo que dijo en el suyo original.

En suma: las tecnologías aplicadas a la traducción sí pueden servir de gran ayuda al traductor literario, sobre todo si precisa recuperar en poco tiempo aquella magnífica solución que encontró hace muchas lunas. Por lo que respecta a la traducción automática, bien empleada podría ser un excelente respaldo para el traductor literario si se usa a modo de sugerencia, especialmente en idiomas muy relacionados entre sí. Y, por último, la pregunta del millón: ¿se puede poseditar la literatura? Poder se puede; otra cosa es que se deba.

Bibliografía

Al-Batineh, M. y Rabadi, R. I. (2019). «Will the Machine Understand Literary Translation? A Glimpse into the Future of literary Machine Translation through the Lenses of Artificial Intelligence». Studies in Translation, vol. 5, n.º 1. Disponible en: https://cutt.ly/WfPN55h

Bernardo, F. L. (2014). «Tradução literária homem vs máquina: um ensaio sobre a tradução online». Entretextos, Londrina, v. 14, n.º 2, pp. 191-204, jul./dic. 2014. Disponible en: https://cutt.ly/lfP43Tf

Besacier, L. (2014). «Traduction automatisée d’une oeuvre littéraire: une étude pilote». Traitement Automatique du Langage Naturel (TALN), Marsella. Disponible en: https://cutt.ly/TfP4P54

Jones, R. e Irvine, A. (2013). «The (Un)faithful Machine Translator». Proceedings of the 7th Workshop on Language Technology for Cultural Heritage, Social Sciences, and Humanities, pp. 96-101. LaTeCH@ACL. Disponible en: https://cutt.ly/vfP487b

Pecina P.; Dušek, O.; Goeuriot, L.; et al. (2014). «Adaptation of machine translation for multilingual information retrieval in the medical domain». Artificial Intelligence in Medicine, vol. 61, n.º 3. Disponible en: https://cutt.ly/8fP473z

Rothwell, A. (2018). «CAT tools and creativity: Retranslating Zola’s La Joie de Vivre». Oxford: Oxford University Press, pp. 1-7 (tal como se cita en Youdale [2020]).

Toral, A. y Way, A. (2015a). «Translating literary text between related languages using SMT. En Proceedings of the Fourth Workshop on Computational Linguistics for Literature, NAACL, Denver, Colorado (EE. UU.), pp. 123-132. Denver: Association for Computational Linguistics. Disponible en: https://cutt.ly/4fP7w0g

—           (2015b). «Machine-Assisted Translation of Literary Text: A Case Study». Translation Spaces, vol. 4:2, 2015, pp. 241–268. John Benjamins. ISSN 2211-3711. Disponible en: https://cutt.ly/EfP7ord

Toral, A.; Wieling, M. y Way, A. (2018). «Post-editing Effort of a Novel With Statistical and Neural Machine Translation». Frontiers in Digital Humanities 5:9. https://cutt.ly/cfP7oHRToral, A. y Way, A. (2018) «What Level of Quality can Neural Machine Translation Attain on Literary Text?». Translation Quality Assessment. From Principles to Practice. Nueva York: Springer. Disponible en: https://cutt.ly/XfP7pUp

Youdale, Roy (2020). Using Computers in the Translation of Literary Style: Challenges and Opportunities (Routledge Advances in Translation and Interpreting Studies, libro 42). Londres y Nueva York: Routledge.

 

Rocío Serrano es filóloga inglesa y máster en Traducción Especializada. Ejerció de profesora de idiomas durante varios años, hasta que la traducción y la informática se cruzaron en su camino casi a la par, y lleva ya trece años trabajando como traductora, revisora, poseditora, correctora, redactora de contenidos y formadora autónoma. No obstante, lo que verdaderamente le roba el corazón es entender cómo funcionan los programas y herramientas con los que trabaja para sacarles todo el partido posible, de ahí que investigue sobre posedición y traducción automática. También es responsable de las redes sociales de la Unión de Correctores (UniCo) y de la Asociación de Intérpretes de Conferencia de España. Y quizá te suene su alter egoAzote Ortográfico, con el que saca los colores a quienes se atreven a maltratar nuestra lengua sin piedad desde los medios de comunicación y las instituciones; siempre desde un punto de vista didáctico. Combina su pasión por la lengua y la tecnología con el maquillaje y la caracterización desde hace seis años.