(s) Material reciclado a partir de Ingeniería de la lengua y normalización lingüística, disponible para su reutilización y reciclado permanente en WWW. Página mantenida por Joseba Abaitua. Dirección de contacto: abaitua@fil.deusto.es. Facultad de Filosofía y Letras, Universidad de Deusto, E-48080 Bilbao. Primera edición: 27/11/96.


La traducción automática

Esta sección se complementa con las páginas sobre: [ LEGEBIDUNA | Unidades de traducción | La traducción por ordenador | BET (dir), BET5 (oct96), BET6 (may97), BET7 (oct97) ]


Konzeptu => Secciones => Traducción Automática => Confidencias y reflexiones Dic. 1996

Confidencias y reflexiones

Entré en contacto con la traducción automática de manera casi accidental en UMIST (Manchester). Cuando comencé a adiestrarme en el procesamiento del lenguaje natural (PLN) tenía muy claro que lo que pretendía era formalizar la gramática del euskara con la idea de implementarla en un programa informático. Hacía una proyección bastante antropomórfica de las posibilidades de la cibernética, como creo que entonces y hoy todavía hacen gran parte de los investigadores de la inteligencia artificial.

Antecedentes

Mi acercamiento al PLN se dio desde dos premisas. Desde mi formación filológica de corte estructural-funcional (Saussure, Martinet, Coseriu, etc.), con claras reminiscencias de la tradición prescriptiva, tenía un particular interés por los esfuerzos de normalización lingüística que se estaban dando en mi patria chica.

Por otro lado, tenía bastante claro que me encontraba ante un medio de comunicación y expresión nuevo, al que se le podían suponer inmediatas consecuencias culturales y económicas. Esta percepción venía motivada en gran parte por un curso de último año de licenciatura que nos ofreció un especialista en balada oral vasca, el profesor Jon Juaristi. Una parte importante del curso consistió en conocer las teorías de Walter J. Ong SJ.

Estos antecedentes en mi formación tenían como contrapartida dos deseos:

Por un lado me movía un afán, repleto de romanticismo, de contribuir a la pervivencia de una lengua minoritaria en clara recesión. Me refiero a la lengua vasca. No fui el único y de hecho existe en la actualidad un importante grupo de investigación en la Facultad de Informática de la Universidad del País Vasco (UPV-EHU) trabajando con ahínco en este empeño.

Por otro lado sentía una considerable inclinación artístico-literaria hacia ese nuevo medio. Ello empujaba mi interés a adquirir la tecnología necesaria para expresarme en él. Creo que erré el tiro por un importante fallo de puntería, que tiene que ver con lo que quiero comentar. Por este motivo, mi anhelo creativo se ha visto en gran medida frustrado.

Respecto a este segundo punto puedo adelantar que la creatividad en el nuevo medio discurre más por cauces audiovisuales que por los literarios convencionales, a pesar de que observadores como Jaques Derridá o Paul Virilo hayan acuñado términos como narrativa hipertextual para referirse a ella. Quién sabe, quizá algún día mis aspiraciones se vean satisfechas, aunque últimamente siento un ligero cansancio y hastío hacia las consolas de ordenador, que se une a una manifiesta carencia de instrumentos de trabajo.

Enfoque literario de la TA

Fueran las que fueran mis intenciones como joven estudiante, el caso es que me vi atrapado de pleno por la investigación en torno a la TA. ¿Por qué motivo no me sentía entonces muy atraído por la TA? Ahora que han pasado bastantes años desde mi estancia en esta Universidad lo puedo confesar, y ésta es precisamente la clave de mi intervención.

Entonces como ahora pensaba que el planteamiento que se le estaba dando al problema miraba más hacia un pasado de tradición literaria, de cultura escrita, que a un futuro caracterizado por la proliferación de medios, de hipermedios, de lo que por entonces no se conocían más que unos rudimentarios juegos de marcianitos. Doce años después empezamos a tener una idea más clara de la transformación que viene.

Entonces, como ahora, muchos veían la TA como una forma de ayudar, si no reemplazar, al traductor manual. Esto a mi no me interesaba gran cosa, aunque luego esta actividad me ha proporcionado un medio de vida, primero como responsable de desarrollo de un programa de TA y ahora como evaluador y, sobre todo, didacta.

Pero para el caso que nos ocupa, la TA tiene otro interés primordial y muy reconocido. Se trata de la aplicación vedette entre todas las aplicaciones del PLN, por complejidad, por expectativas, por número de proyectos y por volumen de inversiones.

Cuello de botella de la sociedad de la información

Además la traducción es, en los albores de una "nueva era" que seguirá siendo plurilingüe, el principal cuello de botella para la diseminación de información a escala mundial. Si por los procedimientos modernos de impresión es posible obtener una producción aproximada de veinte millones de páginas por hora, la traducción manual tan sólo es capaz de rendir en los casos más favorables a un ritmo de veinte páginas por día. Se trata de un trabajo todavía artesanal, muy parecido al del monje copista medieval que transcribía tres o cuatro páginas por día.

El inglés como lingua franca

La solución transitoria a este problema no es en la actualidad la traducción sino la resignación general a aceptar el inglés como lengua vehicular o lingua franca. Las esperanzas puestas en la traducción automática tardarán todavía en materializarse y vamos a reflexionar por qué.

Los objetivos de la TA

En los enfoques más ambiciosos ha existido, en mi opinión, un error de planteamiento. En su tratado sobre la traducción automática Hutchins y Somers 1992 expresan con claridad cuáles son los resultados y cómo se deben plantear las metas:

Traducciones en borrador

"Lo que se ha logrado es desarrollar programas informáticos que realizan traducciones en borrador en áreas relativamente bien delimitadas. Estas traducciones pueden luego corregirse para obtener versiones finales de calidad por unas tarifas económicas. También pueden dejarse como están, sin revisar, puesto que los especialistas pueden leerlas y entenderlas para informarse. En algunos casos, con los controles adecuados sobre el texto original, es posible alcanzar, de forma automática, resultados de mayor calidad que requieren poca o ninguna corrección."

Textos sin valor literario

"La mayor parte de los textos que se traducen en el mundo no tienen un alto valor cultural ni literario. La mayoría de los traductores profesionales se dedican a satisfacer la enorme y creciente demanda de traducciones de documentos técnicos y científicos, transacciones comerciales, informes administrativos, documentación jurídica, manuales de instrucciones, libros de texto de medicina o agricultura, patentes industriales, panfletos publicitarios, reportajes periodísticos, etc. Parte de este trabajo resulta difícil y constituye un reto, pero un gran porcentaje es tedioso y repetitivo, a la vez que exige precisión y coherencia. La demanda de estas traducciones se está incrementando a un ritmo superior a la capacidad de los traductores, por lo que la ayuda del ordenador ejerce una evidente e inmediata atracción."

Errores de planteamiento

[ [ i ] Martin Kay]

Si tan claro está, ¿por qué todavía la TA no se ha implantado en el mercado? La respuesta es sencilla. Todavía no se han fabricado productos capaces de acomodar la tecnología a las posibilidades. Pruebas palpables son los estrepitosos fracasos de proyectos como EUROTRA o ROSETTA en un pasado todavía muy reciente. La explicación de estos fracasos solo se puede encontrar en el error de planteamiento e indefinición de expectativas inicial con el que fueron diseñados.

Premisas para una TA realista

UMIST ha sido pionera en proponer y ensayar métodos realistas de TA. Personalmente comparto plenamente las ideas que desde el Centre for Computational Linguistics, hoy Department of Language Engineering, de UMIST se han ido proponiendo y que se pueden resumir de esta manera:

Integración de edición y traducción

En definitiva lo que se está proponiendo es que la traducción se convierta en una tarea íntimamente ligada a la propia confección del documento que se desea traducir.

Una de las razones que más me inclinan a defender este planteamiento es precisamente el enorme éxito que los procesadores de texto han tenido en el mercado. La redacción asistida e integrada con la traducción es una prolongación lógica de las utilidades que estos programas ofrecen al usuario.

Sistemas expertos en tipología textual

La solución no está en disponer de analizadores o generadores universales de texto escrito, semejantes en su aplicación a los correctores ortográficos (como están enfocados en la actualidad los programas comerciales de corrección sintáctica y estilística GRAMMATIK, POWEREDIT o CORRECT-GRAMMAR).

La clave para obtener soluciones efectivas pasa por desarrollar auténticos sistemas expertos en tipología textual, capaces de ofrecer al redactor modelos precisos de documentos como los que desea confeccionar (véase los trabajos de Hasan 1977, 1984, Ventola 1987 o Martin 1991, que desarrollan esta línea).

Redacción sin licencias literarias

La inmensa producción de documentos está dentro de los parámetros antes descritos (los textos sin valor literario, la documentación diplomática, técnica y comercial supone más del 90% de la demanda mundial de traducciones) y al redactor no se le permiten excesivas licencias de espontaneidad u originalidad.

Sistemas combinados

De lo que estamos hablando es de una combinación de repertorios de hojas de estilo (style sheets, cuya utilidad se va haciendo más patente con el tiempo, véase p.ej. a Sperberg-McQueen, 1994), con sistemas de autor (authoring systems) y memorias de traducción (translation memories).

Este tipo de producto todavía tardará en llegar, aunque existan anticipos como TRANSLATION-MANAGER o DéjàVu, porque el problema no es tanto de ingeniería como de falta de previsión en el estudio y procesamiento de la tipología textual, tal y como se deja traslucir en Biber 1989, Lavid 1992 o Bruce 1993.


Inicio