Oihane Ballesteros González

LA TRADUCCIÓN AUTOMÁTICA

INTRODUCCIÓN

A lo largo de este trabajo se van a exponer distintos aspectos de la traducción automática, tanto de los distintos tipos de sistemas existentes para conseguir una buena traducción como de sus múltiples inconvenientes. Todos sabemos de un modo más o menos técnico qué quiere decir traducir, es decir conocemos su significado; y a pesar de que conocemos su significado tal vez algunos de nosotros no nos hacemos a la idea de cuan difícil puede ser traducir un texto de modo automático, es decir por medio de un programa informático.

Por eso desde mi punto mi vista, para comprender lo que significa la acción de traducir con exactitud es importante saber que para poder llevar a cabo un buen paso de un idioma a otro bien de modo automático o bien del modo convencional hay que tener en cuenta la lingüística de ese idioma, ya que todos los idiomas tienen una gramática, una sintaxis y otras tantas estructuras del lenguaje que son las que definen ese idioma y que por otra parte hacen que sea tan complicado pasarlo q otro idioma con éxito, ya que la lengua meta también tiene una lingüística. La estructura del idioma meta y el origen puede ser parecida como ocurre con el español y el italiano que parten de latín, en cambio puede darse el caso de otros idiomas como por ejemplo pasar del español al euskera que no tienen básicamente nada en común ya que el euskera a pesar de haber tomado parte de otros idiomas como todos para crear palabras que no poseían en su propio idioma, pues es un idioma que no se sabe de dónde procede por lo cual traducirlo sería muy complicado.

Cuando surgió la idea de la traducción automática o TA, se pensó que sería un objetivo fácil, ya que se concibió el lenguaje como un lenguaje técnico( como bien pueden ser los lenguajes informáticos), y se pensó que podría ser traducido palabra a palabra sin ningún tipo de problema. Sin embargo, cuando hicieron las primeras pruebas se dieron cuenta de que estaban enormemente confundidos ya que los idiomas son muy ambiguos, y debido a esto las traducciones que se conseguían, exceptuando si los textos eran muy estrictos, no tenían relación con el significado del texto origen, y fue en se momento cuando se dieron cuenta de que deberían trabajar mucho para poder conseguir resultados exitosos. A decir verdad, si lo pensamos fríamente sí que debe de ser muy complicado ya que ni siquiera en la actualidad se ha conseguido un éxito rotundo.

Para concluir, hay que decir que actualmente los sistemas de traducción automática son muy empleados por los usuarios de los ordenadores ya que las traducciones son bastante satisfactorias, y están bastante cerca de la realidad. A lo largo del tiempo han sido creados diferentes sistemas de traducción alguno parecidos entre si como el que se basa en la técnica de transformación y el que se basa en la técnica interlingua, y en cambio se han generado otros que no eran tan parecido y que eran mucho mas abstractos. Lo que es verdad, es que se han conseguido grandes avances y que estos sistemas ayudan de una manera muy importante a las personas que no conocen otros idiomas ya que así pueden acceder a una gran cantidad de información que no esta en su idioma, y el mundo de las comunicaciones es muy importante hoy en día.

 

¿QUÉ ES LA TRADUCCIÓN?

La traducción consiste en el cambio del idioma en el que viene expresado un texto, la "lengua fuente", al escribir ese texto de modo equivalente en otro idioma, es decir la "lengua meta", cuyo objetivo primordial es mantener el significado del código a traducir. Sin embargo, no consiste en traducir cada palabra individualmente, sino en conocer el significado colectivo del conjunto de palabras que forman la frase.

Hay que diferenciar la traducción de un texto de la traducción oral de un discurso, ya que esta última se define mediante otro término, el cual es: interpretación; aunque tal vez es más útil pensar que la interpretación es una subcategoría de la traducción.

El lenguaje humano consiste en:

  1. Morfología: es el estudio de la estructura interna de las palabras.
  2. Semántica: es el estudio del significado de las palabras.
  3. Sintaxis: es el estudio de la estructura del lenguaje.

Por lo cual cada fragmento de texto puede ser muy difícil de traducir debido a la ambigüedad, es decir cada frase puede traducirse de múltiples y diversas maneras y con significados que a su vez pueden ser muy parecidos o no tener relación alguna.

El proceso de traducción está dividido en dos partes:

  1. Se descodifica el texto de la lengua fuente.
  2. Se codifica el texto en lengua meta.

Para una traducción muy exacta estos dos pasos han de ser llevados a cabo con mucho conocimiento de la semántica de los dos idiomas y de las culturas de sus hablantes. Por lo cual, para una buena traducción hay que tener en consideración dos ideales que son la fidelidad y la autenticidad. Por fidelidad entendemos el hecho de que al llevar a cabo la traducción no se le quite parte de su significado al texto, ni al contrario tampoco se le dé de más, y por autenticidad entendemos que si un nativo lee el texto traducido tiene que pensar que ha sido directamente escrito en su idioma, y no que ha sido traducido.

Una rigurosa traducción palabra a palabra no tendría éxito, ya que a parte de que se perderían las influencias culturales sino porque además algunos factores lingüísticos como los refranes o los dichos populares no serian bien traducidos, por lo cual la frase carecería de sentido.

Todas las formas de literatura y lengua pueden ser traducidas(novelas, películas, juegos de ordenador…), algo que a primera vista nos parece lógica; sin embargo, lo que no tenemos en cuenta es que el hecho de que haya diversas áreas dificulta más aun si cabe la labor de traducción. Si por ejemplo traduces libros de texto para un colegio es una traducción bastante más directa, en cambio si traduces literatura tienes que tener en cuenta las diferentes estructuras que el autor emplea para embellecer su escrito, bien sean metáforas, rimas o simplemente si tratas de traducir poesía. Con lo que quiero decir que hay que tener en cuenta mucho factores a la hora de traducir ya bien sea por el hecho de que no hay que traducir una frase palabra a palabra sino en su conjunto, o por el hecho de que tienes q tener en cuenta que tipo de texto es para poder darle su significado exacto a la hora de traducirlo. Por eso, voy a explicar la traducción automática a partir de ahora.

 

 

¿QUÉ ES LA TRADUCCIÓN AUTOMÁTICA?

La traducción automática es un proceso llevado a cabo por un ordenador en el que se traduce directamente de una lengua a otra. Aunque este es unos de los principales objetivos de la informática ha resultado ser una meta muy difícil debido a la complejidad del lenguaje; sin embargo en la actualidad existen algunos sistemas cuyos resultados a pesar de tener la calidad necesaria son bastantes similares al resultado que se debería obtener traduciendo con exactitud, y la finalidad de estos sistemas es ayudar a los verdaderos traductores, es decir a las personas que traducen.

La traducción automática puede ser muy útil en diversos planos, por ejemplo uno de ellos, y en los que más se ha trabajado es la traducción texto a texto. Se comienza por tener un texto en un ordenador, y después se obtiene e otro texto que también está en el ordenador y que estará traducido a la lengua meta. Otro de los planos puede ser una conversación o dialogo entre dos personas que emplean distintas lenguas para comunicarse, en este caso el sistema de traducción automática traduce de una lengua a la otra y viceversa para que las dos personas puedan llegar a entenderse.

Para conseguir que dos personas que emplean diferentes idiomas a la hora de comunicarse puedan entenderse, tienen que ocurrir dos cosas o bien que uno de los dos conoce el idioma del otro o bien se necesita el trabajo de profesionales de la traducción. En la década de los años cincuenta y sesenta se crearon grandes ilusiones en lo concerniente a los sistemas q de forma automática pasaran de un idioma a otro. El trabajo de traducción comenzó por la traducción texto-texto ya que de esa manera el texto ya estaba en el ordenador. Sin embargo, en el año 1966 la Academia de Ciencias de, Estados Unidos produjo el informe ALPAC, el cual no daba créditos a las ilusiones creadas anteriormente. A pesar, de que el informe no fue muy bien aceptado se cancelaron básicamente todos los proyectos referentes a la traducción automática en todo el mundo, debido a la gran influencia de Estados Unidos(sólo algunos proyectos no se cancelaron debido a su importancia política). En la década de los ochenta ha habido un resurgimiento en el interés por la traducción sobre todo por el auge de Japón, que es muy avanzado en el ámbito de las tecnologías y tiene graves problemas parta la comunicación, y también por la Comunidad Europea ya que de este modo se terminaría con sus problemas de la traducción de los documentos a todas las lenguas de la comunidad.

La traducción automática ha tenido varios problemas o más bien varias situaciones que no han favorecido su desarrollo. Por un lado cabe destacar el hecho de que los primeros investigadores subestimaron la complejidad de la traducción, y por otro lado hay que enfatizar el hecho de que no existe una teoría lingüística rigurosa y estricta.

En lo que corresponde a la subestimación de la complejidad de la traducción, los pioneros en electrónica pensaban que los idiomas eran códigos que podían ser descifrados con una relativa facilidad, del mismo modo que descifraban otros idiomas. Los primeros experimentos llevados a cabo traducían el texto palabra a palabra sin tener en cuenta que no se puede traducir así y que hay que tener en cuenta otra serie de factores ya que el resultado puede ser erróneo, como se demuestra en el siguiente ejemplo:

Entonces esta frase la tradujeron al ruso, y después de nuevo al ingles y el resultado fue:

Además de estos dos problemas hay que añadir el hecho de que el país que estaba más desarrollado cuando se empezó a investigar el campo de la traducción automática, es decir estados unidos, no tenia el más mero interés en este campo debido a que la sociedad estadounidense es básicamente monolingüe, y no tenían intenciones de traducir el ingles a otros idiomas. Es mas, hay que destacar el hecho de que la gran influencia estadounidense desde el fin de la segunda guerra mundial hizo que el ingles se convirtiera en idioma oficial de todo el mundo obligando al resto a aprenderlo.

Sin embargo, el aumento del comercio internacional y los sentimientos nacionalistas de los países compradores ha hecho que estos países exijan que los manuales de instrucciones y las descripciones de los sistemas estén en su lengua. Estas exigencias han conseguido que se suscite de nuevo un gran interés en lo referente a la traducción automática, ya que el hecho de que cada vez haya mas información que necesite ser pasada a otros idiomas conlleva el tener personas contratadas especializadas en traducir, lo cual resulta muy caro.

El renovado interés hizo que se dieran avances en este campo, así se dejó de traducir cada texto palabra a palabra y se empezaron a sementar o partir los textos en unidades oracionales para su entrada en analizadores con capacidad sintáctica y semántica. El cambio del método supuso el nacimiento de la lingüística computacional, que es una disciplina autónoma que tiene objetivos comunes con la lingüística teórica.

Sin embargo, la sintaxis y la semántica no fueron suficientes para terminas con los problemas de la TA(traducción automática), ya que un texto no esta formado por oraciones individuales o aisladas, sino que esta formado por estructuras oracionales que están relacionadas entre si, por lo cual para que la traducción tenga una buena calidad aceptable precisa de información de tipo pragmático y discursivo para dar cuenta de la estructura del texto a traducir; la LC (lingüística computacional) es la que se encarga del estudio de la pragmática y la gramática del discurso.

LA TRADUCCIÓN DIRECTA

Según Trujillo "La traducción directa conlleva la traducción palabra por palabra junto con un proceso de equivalencias de cadenas y reordenación del texto meta. Los problemas inherentes a tal metodología son evidentes: el sistema no toma en consideración la estructura sintáctica de la frase ni las relaciones semánticas que existen entre las palabras".

El objetivo de un sistema de traducción automática es transformar las frases del lenguaje origen al lenguaje meta, y esto se consigue siguiendo un diccionario bilingüe, y cambiando las palabras de la lengua origen a la lengua meta y después reorganizando las palabras según las reglas de la lengua meta, lo cual se comprende

 

con esta figura de Hutchins & Somers:

A lo largo de los siguientes pasos se explicara con brevedad cómo se traduciría la frase "El gato buscará al ratón":

 

Por lo que nos quedaría la frase de este modo:

"The cat will seek to the mouse"

, y así no esta de forma correcta desde el punto de vista de la gramática ya que el verbo inglés "seek" no lleva "to" , en cambio un sistema básico seria incapaz de modificarlo.

Hay determinados factores que limitan el uso de la traducción directa, así por ejemplo no contemplan la ambigüedad, además hay una inexistencia total de gramática de la lengua meta, lo que hace que ocurran un gran numero de errores, como el comentado anteriormente de añadir "to" detrás del verbo "seek". Como consecuencia, estos sistemas no te garantizan que la traducción sea satisfactoria, aunque también es cierto que en algunos casos el resultado se asemejará pero en otros casos el texto resultante no será más que un conjunto de palabras sin sentido, o como bien decía Arnold et al: "una ensalada de palabras".

Teniendo en cuenta todo esto deducimos que este sistema de traducción automática no es el más adecuado. A pesar de ello, hay que tenerlo muy en cuenta ya que Systran es un sistema de primera generación.

Systran:

El doctor Peter Toma creo la primera versión en el año y lo que hacia este sistema era traducir del ruso al inglés para las fuerzas aéreas americanas, a decir verdad es un ejemplo de buen diseño, lo que le ha permitido tener una gran evolución a lo largo de los años. En 1976 la Comisión europea lo compró debido al interés del burócrata Loll Rolling y actualmente se esta ampliando a otros 16 idiomas. Este sistema ha traducido millares de documentos en Europa y en Japón.

En el año 1996 más de 200.000 páginas fueron traducidas por medio de este sistema de traducción, de las cuales sólo un tercio fueron pedidas por el Servicio de Traducciones de la Comunidad, y los otros dos tercios fueron traducidas por petición personal y directa de los trabajadores en sus distintos empleos.

Los datos de una encuesta de la comisión europea revelaron que los principales motivos por los que se emplea la traducción por medio de systran son:

  1. traducciones urgentes
  2. ojear los contenidos de los documentos
  3. obtener versiones preliminares

La opinión publica cree que las mejores traducciones son del francés al ingles, del ingles al francés y del castellano al italiano, también sabemos por medio de esta encuesta que los usuario ahorran bastante tiempo empleando este sistema y que el grado de satisfacción es bastante alto.

 

Spanam y Engspan

La Organización de la Salud Panamericana (OPS) ha venido utilizando Spanam (español-inglés) y Engspan (inglés-español) desde 1980 y, a día de hoy, según la pagina oficial de la OPS, se han procesado más de 70 millones de palabras y a su vez traductores profesionales revisan y pulen el texto para conseguir de este modo producir traducciones de alta calidad. La OPS, que está situada en Washington DC y fue creada en 1950, actualmente cuenta con más de 2.000 traductores en plantilla.

 

TÉCNICA DE TRANSFERENCIA

La principal característica de la técnica d transferencia es la necesidad de que exista una especie de "pila" intermedia que recoja el significado del texto a traducir para luego crea de este modo una oración en el idioma meta q sea equivalente.

Según Hutchins & Somers "en Éste módulo de transferencia puede trabajar en distintos niveles de análisis lingüístico, por lo que se pueden distinguir tres tipos de transferencia":

  1. Transferencia sintáctica: Según Vauquois & Boitet "utilizando un análisis sintáctico basado en una PSG, las operaciones que se realizan sobre las cadenas de caracteres son transformaciones de árbol a árbol que "transfieren" las estructuras sintácticas de LO a las estructuras sintácticas de LM. Buenos ejemplos de sistemas basados en transferencia sintáctica son metal y ariane. En el primero las transformaciones árbol-a-árbol se usan indexándolas a reglas gramaticales individuales, que son aplicadas después del análisis; en el segundo se construye una estructura interfaz de LO que después se transfiere a la estructura interfaz de LM, y se somete a una reestructuración posterior"
  2.  

  3. Transferencia semántica: Esta representación deriva básicamente de la estructura sintáctica ( a nivel QLF)y se basa en la traducción sobre predicados.
  4.  

  5. Transferencia mixta: Según Trujillo" en donde las relaciones de transferencia se construyen con información sintáctica, funcional, semántica y algunas veces incluso pragmática. Puesto que el sistema utiliza múltiples niveles de información, el sistema puede codificar las equivalencias de traducción en el nivel más apropiado para las lenguas en cuestión ".

En cuanto a los sistemas basados en transferencia, bien sean de un tipo o de otro, todos tienen una característica común, que es el gran número de módulos que han de ser implementados cada vez que crece en numero de lenguas. Concretamente para que trabajen n lenguas han de ser implementadas por lo menos n(n-1) módulos de transferencia.

Estos sistemas que se basan en la transferencia necesitan ser analizados primero de modo monolingüe para pasar después a un análisis bilingüe. En un sistemas tradicional la oración se analiza primero desde el punto de vista de la morfología, posteriormente el resultado obtenido se analiza desde el punto de vista de la sintaxis obteniendo así, después de ambos análisis una representación sintáctica superficial. Después el resultado que hemos conseguido se transforma en una representación más abstracta que no tiene en cuenta algunos fenómenos que no son tan relevantes en el campo de la traducción. Es en este momento cuando el modulo de transformación convierte esta representación que aun esta en la lengua de origen en una representación que esta al mismo nivel en cuanto a lo que corresponde a la abstracción, pero esta ya orientada hacia la lengua meta. A las dos representaciones obtenidas en el ámbito de la abstracción tanto en la lengua meta como en la original, se las denomina interfaz. A partir de este momento es el proceso sufre una inversión ya que estos dos módulos, es decir las interfaces generan una representación sintáctica del texto, y finalmente se consigue lo que se deseaba desde un primer momento, la traducción de la cadena de texto en la lengua meta.

Este sistema tiene un problema que es que el hecho de que a partir de una estructura sintáctica superficial se derive una estructura abstracta puede dar lugar a que haya algunos problemas en el orden de las palabras, como por ejemplo ocurre en este caso:

  1. Sam gave the money to Max
  2. Sam gave Max the money

Se podría estudiar el hecho de imponer un orden canónico y de este modo reemplazar las palabras que no tienen contenido léxico.

 

TÉCNICA DE INTERLINGUA

Los sistemas basados en la técnica de interlingua empezaron a desarrollarse en la década de los sesenta, y se basan en emplear una lengua "pivot" para traducir entre dos lenguas.

Por un lado, según dos defensores su gran ventaja es una notable reducción en el numero de módulos de transferencia necesarios para su implementaron, y que es mas adecuada psicológicamente hablando al proceso de traducción. A decir verdad, se produce una gran reducción en el numero de módulos que han de ser implementados, ya que en estos sistemas se necesita una sola lengua "pivot" para traducir en varias lenguas; En este caso se requieren 2n módulos, y no como en el sistema de transferencia que como se ha dicho anteriormente necesitaba n(n-1), por lo cual iba aumentando progresivamente su numero.

Los sistemas de traducción basados en esta técnica realizan su función en dos pasos, en primer lugar se le asigna una estructura al texto que va a ser traducido(es una oración el lenguaje universal que contiene el significado del texto a traducir), y posteriormente partiendo de esta estructura se genera el texto traducido sin tener en cuenta cual es el lenguaje de origen.

El sistema de traducción basado en la transferencia y el que esta basado en la técnica de interlingua no son tan diferentes entre si, ya que en ambos es muy importante el campo de la abstracción, ya que cuan más abstractas sean las interfaces intermedias para llegar a la traducción deseada, entonces menores son las diferencias entre las lenguas origen y meta, lo cual es una ventaja, ya que se puede llegar al punto de que las representaciones en la lengua meta y origen sean iguales.

Según algunos autores, como Whitelock & Kilby " esta aparente ventaja de los sistemas de interlingua puede no ser beneficiosa en la práctica. La razón es que, si un sistema prescribe una separación radical entre la información específica de las distintas lenguas, la representación de un texto puede no especificar valores para atributos específicos de una determinada lengua, puesto que los valores de un atributo tienen significado sólo a partir de los otros valores para el mismo atributo", algo en lo que pueden tener razón ya que como no se ha llegado a obtener un sistema que traduzca a la perfección hay que tener en cuenta los conocimientos de todos los expertos en el tema.

Algunos autores como Trujillo afirman que ésta es la línea a seguir para conseguir inventar un sistema que traduzca a la perfección, en cambio como ocurre en casi todos los ámbitos también hay detractores de este sistema a nivel teórico.

 

 

TRADUCCIÓN ESTADISTICA

En 1949,aparecio otro método de traducción automática basado en la estadística, que fue propuesto por Warren Weawer, que era un pionero en la informática teórica. Esta nueva propuesta no tuvo muy buena aceptación debido a motivos teóricos, y el principal motivo no fue referente a la teoría sino a las limitaciones de los ordenadores, ya que no existían muchos textos escritos en formato magnético, lo cual era imprescindible en un experimento de esas características.

En Nueva York se llevo a cabo un proyecto en el que se traducía frase a frase y se basaba en la estadística, ya que como cada oración es una traducción posible en cualquier lengua, entonces se asigna a cada par de oraciones una probabilidad, la cual se refiere a la probabilidad de que un traductor produzca una traducción en la lengua meta a partir de la lengua origen.

Este sistema de traducción es bastante difícil de explicar y analizar levemente, ya que está basado en términos estadísticos, con probabilidades y más términos estadísticos, por lo cual solamente lo menciono levemente ya que para comprenderlo hay que tener conocimientos básicos de la estadística.

 

 

Traducción por ejemplos:

Este sistema de traducción se basa en principios similares ala traducción estadística, es decir en datos tomados del corpora.

El ordenador lo que hace, es decir su función es interaccionar con el usuario, es decir se relaciona con el usuario proponiéndole ejemplos de traducciones

Este tipo de estrategia ha sido propuesto por varios investigadores: Nagao & Sato(Kyoto University), Sadler (ATR), Saito & Tomita (CMU), Somers, Tsuji & Jones (UMIST).

 

 

 

Modelos conexionistas:

Estos sistemas de traducción están programados mediante redes neuronales, las cuales son entrenadas para analizar los textos y así poder después poder generar los textos meta a partir de los analizados anteriormente.

Ejemplos de esta técnica son:

 

 

El futuro: Sistemas híbridos:

En estos sistemas la clasificación de las tecnologías es más metodológica que real. En este caso se elige en enfoque dependiendo de la aplicación, y se caracterizan por su eclecticismo.

 

CONCLUSIÓN

A lo largo de las diferentes partes se ha podido comprobar lo que había expresado en la introducción, es decir la dificultad de conseguir crear un sistema que consiga su objetivo de modo exitoso siempre, algo que es realmente complicado, como se ha explicado en los diferentes sistemas existentes basados en tan diversas técnicas.

Sin embargo, es muy útil emplear traductores, porque si por ejemplo buscas información en Internet y lo traduces aunque la traducción no sea completamente perfecta, te guía y de ese modo puedes emplear la información obtenida, algo que no podríamos llevar a cabo si no existieran los traductores.

Las comunicaciones son muy importantes hoy en día, y cada año se mueve muchísima información, lo cual hace que si ésta pudiera ser traducida todos podríamos disponer de una cantidad de información sobre todos los temas que necesitásemos, algo que por otro lado puede ser un problema, ya que si tienes demasiada información te puedes llegar a agobiar, pero ese es otro tema.

Para finalizar quiero expresar mi deseo de que la traducción automática consiga su objetivo primordial de modo que así todos podamos disfrutar de sus ventajas es este mundo en el que las comunicaciones cada vez tienen más importancia.

 

SÍNTESIS

La traducción automática se basa en sistemas que emplean diversas técnicas para llegar a traducir un lenguaje desde su lengua origen hasta su lengua meta. A lo largo de las décadas se han desarrollado diferentes sistemas que tiene bastante calidad y que cada día son utilizados por muchas personas para que les ayuden o complementen a la hora de realizar sus trabajos. Actualmente, hay traductores que realizan su trabajo de un modo bastante exitoso; sin embargo, aun no se ha llegado a su principal objetivo: la perfección en todos sus trabajos.

 

BIBLIOGRAFÍA