REPORT A

Traducción Automática (Machine Translation)

 

 

Introducción

Actualmente vivimos en una sociedad en la que la información nos desborda; la tenemos presente en cada cosa que hacemos a lo largo del día. Podemos encontrar información en una gran cantidad de medios como por ejemplo: la televisión, bibliotecas, etc. pero sin lugar a dudas, el lugar que mayor cantidad de información nos proporciona  hoy día es Internet. En resumen, hoy en día vivimos en lo que ya mucha gente se a apresurado en llamar 'La era de la información'.

Pero el gran problema que nuestra sociedad encuentra en algunos de estos medios de información (y con nuestra sociedad me refiero a toda la comunidad hispano parlante) es la gran barrera del idioma, para muchos insalvable, ya que el idioma predominante es el ingles. Para salvar este problema, podemos encontrar gran cantidad de traductores automáticos, capaces de traducir un texto, o una simple palabra a varios idiomas.

En ello es len lo que se va a basar este trabajo, en a traducción automática, tanto en sus ventajas y desventajas, como en muchos otros aspectos relacionados directamente con ello.

 

 

 

    1.    ¿Que es y en que consiste la traducción automática?

La traducción automática es, valga la redundancia, la traducción del termino en ingles 'Machine Translation' que podremos encontrar en varios lugares expresado  con las siglas 'MT', o bien en castellano 'TA'.

Según la enciclopedia Larouse, traducir es trasponer un texto de una lengua o otra, y automático es aquello que opera por medios mecánicos, luego de ello deduciríamos que traducción automática es la acción de trasponer un texto por medios mecánicos. De ello, y explicándolo claramente se entiende, que la traducción automática, es un proceso realizado por una maquina, la cual  es capaz de traducir un texto de una lengua a otra, fijándose en aspectos como la sintaxis, o resolviendo posibles ambigüedades etc. Por ejemplo, la traducción de lenguas naturales, necesita una gran cantidad tanto léxica como de conocimiento del mundo, es por ello que con cuantos mas recursos y herramientas de este tipo cuente el traductor que vamos a usar para traducir nuestro texto, mejor será el resultado, lo cual no quiere decir que sea el mejor ni uno que se ajuste necesariamente al texto de origen. Las herramientas que sirven de apoyo a la traducción automática, las cuales se basan en el empleo de diccionarios, dependen tanto de que el diccionario a usar contenga las palabras deseadas, como de que se puedan tener en cuenta las posibles inflexiones de las palabras. Para evitar malos resultados al realizar una traducción, lo ideal seria intentar reproducir artificialmente las estructuras de conocimiento de un traductor humano, lo que lograría un mejor entendimiento de todas las estructuras y una mejor comprensión a su vez de los procesos de la mente humano en cuanto a la comprensión del lenguaje se refiere.

Respecto al aspecto lingüístico, la traducción automática, debería tener en cuenta los distintos niveles del lenguaje, como son el sintáctico, el semántica, el morfológico y el fonológico (el el caso de la traducción de voz, la cual aun esta desarrollándose).

Para traducir mecánicamente un texto se deben llevar a cabo varios procesos:

Estos son algunos de los procesos que un traductor ha de seguir, aunque no siempre ha de realizarlos todos, y no solo son estos.

El procesamiento de la oración a traducir, conlleva a su vez, dos tipos de procesamiento: el análisis( también llamado reconocimiento) del texto original, y la generación del texto en lo que llamaremos 'lengua de destino',es decir, la lengua a la que se desea traducir el texto. En la fase de análisis, se intenta determinar si, tanto la estructura del texto, como la gramática son correctas. Respecto al proceso de la fase de generación del texto, cabe destacar que descomponiendo las sentencias en su estructura arbórea, no resulta demasiado complicado.

La traducción automática es una tarea compleja que necesita del desarrollo de muchas otras aplicaciones y recursos, como pueden ser un sistema de representación adecuado, o un deposito de información con un léxico rico y bien estructurado. también se puede decir, que de todos los sistemas de traducción automática que podemos encontrar, los que mas éxito suelen tener son aquellos que adoptan una postura que mas se acerca a los métodos de traducción humana, y que a su vez integran diversas técnicas.

Según indica el profesor de la universidad de Málaga, de la facultad de filosofía y letras, Antonio Moreno Ortiz, en un escrito publicado y disponible en la dirección  http://elies.rediris.es/elies9/index.htm , y cito textualmente:

"Muy genéricamente cabría distinguir dos tipos radicalmente diferentes de paradigmas:

Es decir, el profesor Antonio Moreno Ortiz dice que podemos encontrar dos ejemplos que nos valgan de norma como aquellos que se apoyan en la experiencia y no en la teoría, diga esta lo que diga, y aquellos que son o que hacen todo lo contrario, es decir, los que se basan en la teoría o como el lo llama, las reglas, y no en la experiencia.

Además de todo lo dicho en este punto anteriormente, también podemos añadir que la traducción automática es un punto que la inteligencia artificial ansia conquistar desde hace muchos años. Es mas, se puede decir que desde el castigo de la Torre de Babel, se anhela el llegar a una lengua única.

 

 

 

    2.    Orígenes y comienzo de la traducción automática.

Basándonos en el trabajo realizado por Pilar Hernández Mercedes, titulado "En torno a la traducción automática" publicado en la revista Cervantes del Nº 2 de Marzo de 2002, disponible en Internet, en la pagina: http://internet.cervantes.es/internetcentros/cultura/pdf/TraduccionAutomatica.pdf      , podemos conocer parte del origen de la traducción automática.

Se puede decir que ya mas o menos en el siglo XVII se podía hablar de diccionarios mecánicos, los cuales se basaban en códigos numéricos. El fin de estos diccionarios era superar las barreras que el idioma presentaba y que actualmente sigue presentando aunque en menor medida, para poder alcanzar finalmente el "lenguaje universal" al que se intento llegar sin demasiados resultados (recordemos lo que ocurrió con el esperanto).

Acercándonos mas a nuestro periodo, se puede decir que es en el siglo XX cuando la TA toma impulso y comienza a interesar mas a la gente. Es en el año 1933, cuando dos grupos de científicos de dos países, Rusia y Francia, piden una patente para crear una "maquina de traducir". De estos grupos, cabe destacar a dos personas: por una parte el francés Georges Artsouni, y el ruso Petr Smirnov-Troyanskii. En la actualidad los métodos de traducción automática se siguen basando en las ideas de este ultimo, ya que decía que las fases del proceso de traducción eran tres: análisis, transferencia y generación, y basándonos en lo anteriormente mencionado, podemos decir que en la actualidad, el proceso consta de dos de esas tres fases: análisis y generación. Desde este momento y hasta la época de principios de los años 50, la traducción automática estuvo en pleno auge. Un auge este, provocado por el éxito de la codificación.

Es precisamente en 1951, cuando se nombra al que fue el primer investigador dedicado exclusivamente a ello. Era Bar-Hillel, un vienes trasladado a Estados Unidos para trabajar en el MIT (Massachussets Institute of Technology), donde logro colocarse al mando de un importante proyecto llamado FAHQT (Fully Automatic High Quality Traslation), el cual interesaba y beneficiaba a los Estados Unidos, ya que les resultaba de un gran interés estratégico. Y fue precisamente Bar-Hillel, quien un año después, es decir, en 1952 aproximadamente organiza el primer congreso que trataría sobre este tema. Fue un congreso en el cual no solo se trataron los avances realizados en cuanto a traducción automática, sino que también se trazaron las líneas necesarias para las investigaciones venideras. El balance que se hizo de este congreso fue positivo.

Los siguientes 10 años aproximadamente fueron prósperos. Se habían creado varios grupos de investigación, los cuales se basaban en diferentes aspectos de la traducción automática para realizar sus investigaciones; se crearon grupos dedicados a la investigación teórica, grupos dedicados a crear sistemas que funcionasen en periodos breves de tiempo etc.

El problema que esto trajo, fue la falta de resultados, la cual desanimo por completo, tanto a los investigadores, como a aquellas personas que financiaban dichas investigaciones. Entonces, en este periodo aparece un informe en el que se deduce que la traducción automática es mucho mas lenta y cara que la traducción humana, por lo cual la traducción automática no resultaría útil. Este era el informe fue redactado por el comité ALPAC (Automatic Language Processing Advisory Committee). Fue un informe tan sumamente demoledor, que a partir de su publicación, todas las propuestas y proyectos que surgían, eran denegados con mayor rapidez, y  fue entonces cuando se dio una 'crisis' , y la investigación sobre la traducción automática quedo relegada a grupos pequeños y muy dispersos, o como objetivo muy disperso de la IA (inteligencia artificial) a largo plazo etc.

En esta época, se quiso hacer una demostración, traduciendo un texto del ingles al ruso, ya que eran los idiomas con mayor prioridad en dicha investigación. El resultado no fue el esperado. Veamos lo que paso: se intento traducir una misma frase en primer lugar del ingles al ruso y luego viceversa; la frase en cuestión era en ingles algo así como "El espíritu es fuerte, pero la carne es débil " . Al traducir al ruso y volverlo a traducir al ingles, resulto algo como "El vodka es bueno, pero el filete está podrido ", luego no extraño a nadie demasiado el informe del ALPAC.

En la siguiente década (estamos hablando los años comprendidos entre 1965 y 1975 aproximadamente), básicamente la totalidad de las investigaciones que se llevaron a cabo sobre el tema, lo hicieron fuera de los Estados Unidos, y los lugares donde comenzaron a desarrollarse fueron básicamente  Europa occidental, Canadá y Japón. Pero a finales de los 70, la traducción automática recobra una notable importancia en Japón, por lo cual, consigue llegar a resurgir con cierta fuerza.

Con el resurgimiento dado en Japón, también comienza a cobrar de nuevo importancia en la CEE, y fue precisamente aquí donde se creo un sistema de traducción del ingles al francés, el cual fue llamado SYSTRAN. Los programas SYSTRAN cobraron una notable importancia durante la época de los 80, y en la actualidad, su robusto diseño, le ha permitido evolucionar de una forma sorprendente, ya que como ya se ha mencionado anteriormente, su arquitectura hoy día esta un poco desfasada.

 Unos años mas tarde, también fue financiado un proyecto basado en crear un programa que fuese capaz de traducir de una lengua comunitaria cualquiera a otra lengua comunitaria cualquiera, cualquier texto introducido. Estamos hablando de lo que entonces se llamo EUROTRA, un proyecto que mantuvo ocupados a un gran numero de investigadores de la CEE, durante muchos años, exactamente hasta 1992.Finalmente, en la época de los 90, y añadiendo también los primeros años del siglo XXI hasta llegar a nuestros días, se ha avanzado mucho en cuanto a traducción del discurso, y se han creado "estaciones de trabajo" para traductores profesionales etc.

Han sido creados también, una nueva tecnología que ha sido denominada como traducción asistida, consistente en un programa al que también se le denomina memoria de traducción, del cual el traductor se sirve, y que le ayuda a resolver problemas de traducción anteriormente ya resueltos. Se sirven de traducciones hechas anteriormente, para encontrar coincidencias totales o parciales con el texto a traducir, y dando ideas para transformar el trozo de texto que varia y así lograr su comprensión. Uno de los mas usados programas de este tipo es Trados, del cual se puede obtener información en varias paginas web, de las cuales facilitare la siguiente: http://www.terminometro.info/b39/es/trados_es.htm .

Ha sido esta, nuestra época, cuando se ha llegado a los avances mas novedosos, cuyas bases ya estaban sentadas años atrás, pero las cuales no se habían puesto en prueba en sistemas reales nunca. Hoy en día podemos decir que la traducción automática esta en un buen lugar, y que comienza a dar sus primeros frutos que tantos años de trabajo conseguido, a pesar de que hay pocos proyectos tanto dentro como fuera de Europa. Aun así, no cabe duda, y podemos asegurar casi a ciencia cierta que la traducción automática será un hecho cotidiano, en un futuro cercano.

 

 

 

    3.    Ventajas y desventajas de la TA.

Así como la traducción automática puede presentar un gran numero de  ventaja, esta también presenta un gran numero de desventajas, y es que una traducción literal de un idioma a otro, puede desde ser un texto sin sentido, un texto con un significado distinto al del texto de origen etc.

Recordemos una cita interesante que dijo Alonso de Madrigal, El Tostado, en el siglo XV:

El surgimiento de programas de traducción automática al mercado, y al alcance de todo el mundo, creo confusión entre la gente, ya que esta pensaba, que seria un programa sin ningún tipo de inconvenientes, y resulto no ser así. 

Principalmente se deberían establecer las diferencias existentes entre un traductor humano y uno automático, y las básicas son los conocimientos:

Aunque a simple vista estos conocimientos presentes en el traductor humano y no en el automático puedan parecer insignificantes y carentes de sentido, estos conocimientos pueden llegar conseguir un texto bien traducido o por el contrario, un texto mal traducido, dependiendo de si se han tenido en cuenta o no.

    "Para hacer una traducción son dos cosas al menos necesarias: la primera, entendimiento de la  verdad que se  interpreta. La segunda, perfecto conocimiento de los idiomas.

     Un traductor no puede traducir con verdad si no tiene conocimiento de lo que traduce."

Así es que podemos darnos cuenta de que todos aquellos problemas que surgen con la traducción humana, surgen con mayor fuerza todavía con la traducción automática; por que ¿acaso existe alguien que conozca a la perfección varios idiomas como para traducirlos perfectamente?.Esta pregunta nos hace dudar ahora también de el conocimiento que tenemos sobre el idioma, y nos podríamos preguntar también si acaso llegamos a conocer con un cierto grado de perfección un idioma, el materno. Luego, si ni siquiera nosotros, lo s seres humanos, somos capaces de conocer bien un idioma, ¿como vamos a ser capaces de crear una maquina o un programa que sea capaz no solo de hacerlo, si no también de llegar a transformarlo a otro idioma?

Encuentro en este punto, una reflexión de Juan Manuel de la Fuente, publicada en la pagina: http://www.ati.es/gt/lengua-informatica/simo1/SIM1_jmf.html#_Toc467918003 , con el titulo: "Glorias y miserias de la traducción automática". Cito textualmente:

"Hace ya bastantes años, leyendo una traducción de "Fiesta", de Hemingway, tropecé con una frase que me produjo cierta perplejidad. Era algo así como (cito de memoria) "... el sol brillaba sobre las paredes concretas de la plaza".

¿A cuento de qué venía lo de "concretas"? Me resultaba difícil entonces, y me lo resulta todavía, concebir las paredes de una plaza de toros (ese era el contexto) como un ente abstracto. Fueron necesarios un poquito de reflexión y unos conocimientos, siquiera elementales, de inglés para colegir que el traductor se había dejado engañar por lo que se conoce como un "falso amigo", en este caso provocado por una homografía. Lo que con toda seguridad había en la mente de Hemingway al escribir "concrete walls" eran unas "paredes de hormigón" o, lo que es lo mismo, de concreto, término que si bien en España se usa poco con ese significado, es muy usado en América. 

(...)A mi entender, el traductor (cuyo nombre no merece ser recordado) podía haber resuelto la dicotomía con un poquito de sentido común, de pensar un poco lo que leía y lo que escribía. Pero seguramente tenía prisa. Otra cosa que podía haberle ayudado habría sido pasar la traducción por el tamiz crítico de una lectura ajena, lo que algunas agencias de traducción llaman "la sombra", alguien no sujeto a los condicionantes lingüísticos que a menudo sufren (sufrimos) los traductores (literalidad, calcos sintácticos, los mencionados "falsos amigos", etc.), y que al leer el texto traducido sin estar influenciado por el texto original, detecta fácilmente la falta de naturalidad, las expresiones oscuras o ambiguas o los términos de difícil comprensión. En la traducción automática "la sombra" es una absoluta necesidad, lo que se conoce como postedición, que pone un poco de cordura en los frecuentes dislates léxicos y sintácticos con que nos regala los sentidos el traductor automático. "

Esto es parte de la reflexión que hace respecto a la traducción literaria, pero también nos habla de la traducción científica, es decir, la traducción de textos técnicos o científicos. Los problemas básicos de este tipo de traductores son el orden léxico y conceptual, que también es un problema en otro tipo de traducciones como ya hemos mencionado anteriormente.

"Pero los problemas léxicos son los de más fácil solución en traducción automática. Es ‘solamente’ una cuestión de recopilar un buen corpus de la materia o materias que se pretende traducir, cosa que al fin y al cabo, también debe hacer el traductor humano. Pero los textos técnicos no suelen contener la riqueza lingüística de los literarios, por lo que sí son los candidatos naturales a la traducción automática. "
 

 

 

    4.    Reconocimiento de voz

Otro aspecto que la traducción automática pretende llegar a lograr es la traducción de la voz, es decir, llegar a traducir un texto sin necesidad de ser escrito, tan solo con el reconocimiento de la voz humana. Pero este es un proyecto que todavía no esta muy desarrollado. Para llevarlo a cabo, se deben tener en cuenta parámetros tales como tamaño del vocabulario, dependencia o independencia del interlocutor, el uso o no de micrófono etc.      En Estados Unidos, concretamente las fuerzas armadas, están financiando un proyecto sobre este asunto que consiste en un sistema de reconocimiento de al voz instalado en un ordenador supercompacto (tanto que se podría llevar en la ropa) , que seria capaz de captar el habla humana y traducirlo inmediatamente produciendo una traducción en voz alta. Este proyecto es algo que conseguiría beneficiarnos a todos, ya que podríamos mantener conversaciones con personas que hablan en distintos idiomas, sin la necesidad de terceras personas que tengan que traducido.

Este tipo de tecnología (reconocimiento de voz), también esta siendo investigada para ser aplicada en otros casos, como por ejemplo para darle ordenes al ordenador en vez de tener que usar el teclado para escribirlas o el ratón. Resultaría un gran avance ya que se podrían evitar determinadas lesiones que se pueden producir al usar el teclado o el ratón durante un tiempo prolongado.

Aunque este tipo de programas (todos los que afecten al reconocimiento de voz, ya sean traductores o no), han avanzado mucho en sus años de existencia, y aunque los expertos opinan que este campo ha avanzado ya un 80%, todavía le queda un largo camino por recorrer.

 

 

 

    5.    Conclusión

La traducción automática es un sueño anhelado desde muchísimo tiempo atrás, que en la actualidad se esta cumpliendo poco a poco. Sus múltiples abandonos y retomes a lo largo de su no larga pero tampoco corta existencia, ya que a lo largo de sus, como muchos se han aventurado en clasificar, cuatro etapas, lo que han conseguido ha sido básica y exclusivamente ralentizar su proceso de desarrollo.

Vivimos en una sociedad en la que ( a la inmensa mayoría de la gente) , lo nuevo nos asusta, y por ello lo rechazamos. Tenemos miedo y aunque siempre será negado, sentimos cierto rechazo por todo aquello nuevo y desconocido, como son las nuevas tecnologías; y hablo incluyéndome a mi dentro de ese grupo, aunque en realidad no debería hacerlo. A diario veo gente que cumple esto, no dice abiertamente que lo rechace, pero lo cierto es que se demuestra en actitudes como por ejemplo no querer aprender a utilizar ciertos instrumentos que conseguirían hacer nuestra vida mas fácil, etc.

Creo que a la traducción automática en general, le queda mucho camino por recorrer, y algunas de las múltiples ramas que puede abarcar, como por ejemplo el reconocimiento de voz, aun le queda mas camino, pero cada día se acerca mas a una realidad, y no a un sueño.

 

 

 

REFERENCIAS

 

 

 

 

 

 

 

 

 

 

 

 

Traducción Automática

Elena Fernández Fernández

78877931

ESIDE