Material preparado para el Master en Traducción, UPV-EHU en Vitoria-Gasteiz, Junio 1991

Técnicas y herramientas informáticas para la traducción

Joseba Abaitua
Fujitsu I+D, Barcelona

INDICE

  1. Introducción: Traductología, lingüística y traducción automática
  2. Traducción directa: SYSTRAN
  3. Técnica de transferencia: TAUM, METAL, CRITTER
  4. Técnica de interlingua: ATLAS, KMBT
  5. Otras alternativas: traducción estadística
  6. Aspectos concretos: el tratamiento de las colocaciones
  7. Traducción asistida, herramientas

1. Introducción

En esta 3ª entrega del curso Informática y traducción analizaremos en detalle algunos de los sistemas más representativos. Como complemento dedicaremos parte del tiempo a revisar herramientas informáticas de utilidad para el traductor y que no son propiamente traducción automática. Pero antes de entrar en materia, me gustaría discutir brevemente la relación entre la traducción automática y otras dos disciplinas íntimamente relacionadas, como son la traductología y la lingüística.

En 1946 comienza la era de los ordenadores y con ella el sueño de la traducción atomática (TA). Los pioneros en electrónica creían enfrentarse a un problema relativamente sencillo. Los idiomas se concebían como códigos que podían ser descifrados y transformados en otro idioma, igual que cualquier otro código de transmisión. Los primeros experimentos traducían palabra a palabra, sin tener en cuenta ni la ambigüedad, ni las relaciones de dependencia sintagmática y semántica de las palabras en una oración. No era de extrañar por ello que el ya famoso aforismo inglés "The spirit is willing but the flesh is weak" (El espírito es voluntarioso pero el cuerpo es débil) traducido al ruso y de vuelta al ingles diera como resultado "The wine is agreeable, but the meat has spoiled" (El vino es agradable, pero la carne se ha podrido).

Esta ingenuidad lingüística, unida a lo rudimentario de las técnicas de programación, desencadenó la gran crisis de los sesenta, que culminó con la publicación del informe ALPAC en 1966. A partir de entonces y coincidiendo con la aparición del modelo generativista, los proyectos de TA empiezan a incorporar lingüistas a sus plantillas y a adoptar criterios lingüísticos mejor fundamentados. La segmentación de un texto en unidades oracionales para su entrada en análizadores con capacidad sintáctica y semántica supuso un progreso considerable en la evolución de la TA. Este cambio de metodología significó además el nacimiento de la lingüística computacional (LC) como disciplina autónoma. La LC desde su inicio ha compartido con la lingüística teórica (LT) objetos de estudio comunes. Pero así como en su comienzo la LC iba a remolque de la LT, en la actualidad ya no puede decirse lo mismo. Existe un importante cuerpo de estudios sintácticos y semánticos surgidos de la LC que han sido incorporados después a la LT (cf. Sells 1985). La relación se ha mantenido constantemente viva por el lado inverso, es decir, la LC siempre se ha interesado por los desarrollos de la LT.

Con todo, la sintaxis y la semántica no se bastan para resolver los problemas de la TA. De la misma manera que una oración no está formado por palabras invertebradas, tampoco un texto está formado por oraciones aisladas. Un sistema de traducción que aspire a lograr un nivel de calidad aceptable precisa de información de tipo pragmático y discursivo para dar cuenta de la estructura del texto a traducir. Esta necesidad ha motivado que la pragmática y la gramática del discurso, tan mal conocidas hasta hace muy poco, sean objeto de un especial interés por parte de la LC. Basta con repasar las contribuciones en las actas de congresos como COLING, ACL y otros especializados para comprobar el creciente número de estudios realizados en la materia (cf. Sidner 1983; McKeown, 1985; etc). De cualquir manera, la incorporación de la pragmática a la TA es todavía incipiente (salvo contadas excepciones, como Hovy 1987, Dimarco & Hirst 1988 o Defrise & Nirenburg 1990).

Así como la colaboración entre los investigadores en LC y LT es probada y evidente, no se explica, sin embargo, la desconexión entre las comunidades de teóricos de la traducción y de profesionales de la TA. Existe más bien un recelo de los primeros hacia los segundos y una clara ignorancia de los segundos sobre el trabajo realizado por los primeros. La traductología como disciplina autónoma es coetánea a la LC (cf. Vinay & Darbelnet, 1958; Malblanc, 1961; Catford, 1965) y ha tenido una evolución en ciertos aspectos similar. En traductología, los enfoques de inspiración lingüística como los de Catford o Vázquez Ayora 1977 han sido paulatinamente relevados por enfoques de orientación pragmática (cf. Seleskovitch & Lederer, 1984; Hurtado, 1990; Hatim & Mason, 1990). Este paralelismo con la LC es bastante significativo y la TA debería tomar buena cuenta de ello. Por otro lado, existe un cuerpo considerable de trabajos en estilística comparada que tampoco son nada desdeñables como material de estudio para la TA (cf. Vinay & Darbelnet, 1958; Malblanc, 1961; Garnier, 1985), por citar algunos.

Con esta introducción he querido ubicar la TA en el contexto de disciplinas emparentadas. En lo que resta del curso, haré más bien lo contrario, me centraré sobre sistemas muy concretos y analizaremos sus técnicas sin apenas levantar la vista. Para un repaso general sobre la traducción automática consúltense las referencias en las hojas anexas.