INTRODUCCIÓN A LA TRADUCCIÓN AUTOMÁTICA

W. John Hutchins y Harold L. Somers

PREFACIO

Traducción dirigida por: Joseba K. Abaitua Odriozola

Traductores: Joseba K. Abaitua Odriozola, Manuel Cadierno Vázquez, María Gortázar González, Raquel Pardo Pardo y Sara Pérez Primicia.

PREFACIO

Mucho antes de que existieran ordenadores ya se especulaba seriamente con la idea de traducir por medios mecánicos. Más tarde, con la aparición de la informática, la traducción fue uno de los primeros problemas que se intentaron resolver. Desde entonces la traducción automática ha sido objeto de encendidos y polémicos debates. El empeño en conseguir máquinas traductoras ha merecido la atención de algunas de las mentes más preclaras de disciplinas como la lingüística, la filosofía, las matemáticas o la informática. La traducción automática ejerce, además, una irresistible atracción sobre un nutrido grupo de incondicionales. ¿A qué se debe toda esta fascinación?

Existen múltiples razones. La simple lectura de la Biblia del Rey Jacobo, de la versión inglesa que hizo Fitzgerald de las Rubaiyat de Omar Khayyam, de cualquiera de las más de doce traducciones de revistas como Scientific American o Geo que se publican cada mes, o de las revistas con que las compañías aéreas canadienses obsequian a sus clientes demostrará que la traducción es uno de los logros más altos del arte humano. En muchos aspectos es comparable a la creación de una obra literaria. Es de suponer, por todo ello, que reproducir este arte en una máquina equivaldría a reproducir una parte esencial del espíritu humano, o lo que es lo mismo, que se comprende parte de su misterio. Sin embargo, precisamente porque hay una parte tan importante del espíritu humano en la traducción, muchos rechazan de plano la posibilidad de que alguna vez una máquina sea capaz de traducir. Todo lo que una persona sabe, conoce, percibe o imagina puede en un momento dado ser determinante para hacer una buena traducción. Para ser traductor no basta con poseer propiedades humanas: se ha de ser completamente humano.

Algunos estudiosos piensan que a partir de los experimentos con la traducción automática se pueden obtener conclusiones muy interesantes, incluso cuando se prueba con textos simples sin pretensiones de obtener resultados de calidad. En la traducción tienen cabida todas las habilidades lingüísticas humanas, exceptuando las que están directamente relacionadas con el habla, sin que para ello haga falta contacto alguno con el mundo real. Un científico interesado en analizar la forma que tienen las personas de combinar palabras para formar oraciones y oraciones para formar textos podría tratar de probar sus teorías mediante un programa de ordenador que produjese oraciones y textos. Este experimento requeriría transmitir al ordenador un mensaje que contar. Los ordenadores, por lo general, no tienen deseos ni sienten necesidad de expresar nada por sí mismos; tampoco tienen opiniones sobre el mundo, ni nada que les incite a iniciar una conversación. Por este motivo, uno de los primeros pasos de este experimento consistiría en que la máquina sientiera ganas de hablar. Un modo de conseguirlo, que evita además tratar el problema de la percepción, así como la mayoría de las cuestiones relacionadas con la motivación, es hacer que el ordenador se limite a decir aquello que se le ordena. Como esta solución obviamente trivializa el problema, una alternativa aceptable sería proporcionar los estímulos a través de una lengua distinta de la que se desea obtener.

La investigación de la traducción automática ha sido motivada por una serie de factores. Existe, por un lado, una creciente demanda de traducciones que obliga a competir con precios y plazos de entrega cada vez menores. La internacionalización de los mercados conlleva la necesidad de superar las barreras lingüísticas. Informes, acuerdos, contratos, manuales y todo tipo de correspondencia comercial han de redactarse cada día en un mayor número de lenguas. Por otro lado, la tecnología moderna evoluciona y cambia con más rapidez que nunca y, en consecuencia, la documentación que la acompaña debe actualizarse también apresuradamente. Los productos en los que se aplican nuevas tecnologías (automóviles, electrodomésticos, ordenadores, etc.) ya no son adquiridos sólo por compradores con un alto nivel de formación o con un buen conocimiento de idiomas, sino que son adquiridos por el gran público. Por este motivo, los manuales que explican el funcionamiento de tales productos deben estar redactados en idiomas distintos del inglés. Además, en los países de la Unión Europea, en Canadá, en muchos otros países en vías de desarrollo y en los de la antigua Unión Soviética se exigen traducciones a los idiomas propios por motivos nacionalistas o porque la legislación así lo establece, incluso cuando una sola versión serviría para cumplir con las necesidades comunicativas.

Durante los últimos años, debido al espectacular incremento de la demanda de traducciones y a la dificultad de antederla de forma manual, presenciamos la reaparición del interés hacia la traducción automática, especialmente en Europa y en Japón. Por supuesto que las metas fijadas no tienen nada que ver con la traducción de la Biblia del Rey Jacobo o las Rubaiyat de Omar Khayyam. Tampoco se pretende traducir textos como los que aparecen en el Scientific American o los mensajes publicitarios. A corto plazo, lo que se pretende es aplicar la traducción automática fundamentalmente a dos tipos de documentos. En primer lugar, a documentos que traten materias muy concretas y que se aborden de un modo rutinario, de tal manera que para producir una traducción no se requiera realmente comprender el contenido. En segundo lugar, a documentos que estén destinados a lectores a los que les baste con una traducción aproximada. Los manuales técnicos pertenecen a la primera categoría. En la segunda categoría se inscriben los textos que no suelen publicarse y que tienen una función meramente comunicativa, tanto dentro de empresas multinacionales como en agencias gubernamentales.

Sólo en circunstancias muy especiales tienen acceso al producto real de la traduccion automatica sus clientes, ya que la sorpresa al comprobar la gran diferencia entre este producto y el texto final que ellos reciben sería considerable. El resultado de un programa de traducción automática se somete la mayoría de las veces al examen de un revisor humano. Los defensores de la traducción por ordenador alegan que lo mismo sucede con la traducción manual, es decir, la primera version suele ser examinada por un revisor que introduce por lo general importantes modificaciones. Por contra, los críticos de la traducción automática son más proclives a adjudicar el mérito de la traducción a los revisores y a infravalorar la aportación de la máquina. Alegan que, incluso cuando la traducción se aplica a textos sobre materias muy concretas y sin pretensiones literarias, los resultados que produce la máquina nunca le serían aceptados a un traductor humano. Todavía no se sabe con seguridad de qué manera o mediante qué procedimiento se conseguirá mejorar sustancialmente los resultados. Irónicamente, las colosales sumas invertidas desde los años setenta no se han materializado en mejoras tangibles.

Como destacado estudioso, John Hutchins ha publicado numerosos trabajos de divulgación antes de producir este libro. Por su parte, Harold Somers ha estimulado, desde su puesto de profesor, el interés por esta disciplina entre varias generaciones de alumnos del Instituto de Ciencia y Tecnología de la Universidad de Manchester (UMIST), que en la actualidad, y gracias a sus propios esfuerzos, se ha convertido en uno de los principales centros de investigación sobre traducción automática en el mundo. Ambos autores mantienen sus propios puntos de vista sobre las cuestiones que quedan sin resolver, pero estas cuestiones no son tratadas en este libro. El lector tiene en sus manos una excelente introducción, de carácter rigurosamente técnico, en la que los componentes de los sistemas de traducción automática más conocidos, así como los principios sobre los que se sustentan dichos componentes y las teorías más relevantes de la lingüística y de la informática, son tratados en profundidad. No es necesario poseer conocimientos previos: el presente libro es una meritoria obra de divulgación. En la primera parte se ofrecen las nociones necesarias para comprender las descripciones posteriores. Estas descripciones, que son muy precisas y están bien documentadas, muestran en la segunda parte del libro los programas de traducción automática más representativos. A buen seguro, serán pocos, incluso entre los profesionales, los que no encuentren algún dato nuevo o sorprendente.

Martin Kay

INTRODUCCIÓN

Al ritmo actual de crecimiento de la demanda de traducciones, la traducción manual dificilmente podrá cubrir las necesidades en un futuro próximo. La primera vez que se aplicó un ordenador a la traducción fue hace más de cuarenta años. Aunque entonces la noticia causó un gran impacto, el interés se desvaneció muy pronto ante la falta de resultados palpables. Recientemente, sin embargo, la disponibilidad de herramientas informáticas que ayudan al traductor por precios muy asequibles ha hecho que la traducción automática haya vuelto a despertar la curiosidad de los investigadores, de los traductores y de muchos otros potenciales usuarios. Por este motivo se ha detectado una demanda de manuales que expliquen la materia de forma asequible.

Este libro tiene como objetivo permitir que los profesores de universidad, tanto de licenciatura como de postgrado, cuenten con un buen texto de apoyo para introducir a sus alumnos en la traducción automática. Pero, además, este libro puede servir para documentar programas docentes de lingüística o de informática, en materias como la lingüística computacional o la inteligencia artificial. Como libro de texto será más adecuado para alumnos que ya tengan nociones de lingüística o de informática, o mejor de ambas. No obstante, se han incluido dos capítulos introductorios pensando en los lectores que no posean tales nociones. Por este motivo, no es imprescindible estar familiarizado ni con la lingüística ni con la inteligencia artificial.

Una segunda categoría de lector será el investigador sobre cualquier área del procesamiento del lenguaje natural que busque una visión de conjunto, tanto de los problemas como de los métodos y técnicas que se aplican a la traducción automática. De hecho, muchos profesionales de la inteligencia artificial, de las ciencias cognitivas, de la recuperación documental y de las industrias de la lengua en general muestran un interés cada vez mayor hacia los resultados de la investigación en torno a la traducción automática. Asimismo, los teóricos de la lingüística son cada vez más conscientes de que tales programas pueden proporcionar campos de prueba importantes a sus hipótesis sobre el lenguaje.

La tercera categoría de lector será el profano que se sienta atraído hacia la materia, alguien interesado en indagar las posibilidades reales de automatizar la traducción. Los autores desean que ninguna parte del libro resulte tan incomprensible como para obligar al lector a abandonar su lectura, aunque quizá algunos capítulos de la segunda parte requieran un esfuerzo especial.

Nuestro propósito es presentar lo que puede legítimamente llamarse el núcleo consolidado de métodos y enfoques de la traducción automática. Se abordan los problemas y dificultades de programar los ordenadores para traducir, lo que se ha conseguido hasta el momento y lo que resta por hacer. Por el contrario, no se tratan los aspectos prácticos de los programas que ya están disponibles para su aplicación. Algunos capítulos dan información sobre programas comerciales y de cómo evaluarlos. Pero de ninguna manera se puede buscar en este libro una guía para usuarios interesados en comparar las prestaciones de los productos comerciales, ni su funcionamiento, ni su eficacia en un entorno laboral. Eso constituiría un libro diferente que sin duda tendría una buena acogida, pero que sería muy distinto de éste.

Nuestro libro consta de dos partes. En la primera se describen los procesos básicos, los problemas y los métodos. El capítulo 1 es una introducción general que incluye una breve exposición histórica. En el capítulo 2 se presentan los fundamentos lingüísticos y en el capítulo 3 los computacionales, que el lector con conocimientos previos puede omitir. En el capítulo 4 se introducen los enfoques principales utilizados en el diseño de programas de traducción automática. Los capítulos 5, 6 y 7 constituyen el eje central del libro. Estos capítulos describen respectivamente las tres fases de la traducción: análisis, transferencia y generación. En el capítulo 8 se aborda la utilización práctica de estos programas y en el capítulo 9 se explican distintos criterios de evaluación.

En la segunda parte se presentan con detalle algunos de los programas más representativos. Los lectores se darán cuenta de que no siempre se pueden aplicar con claridad las distinciones establecidas en la primera parte del libro. Por otra parte, la mayoría de los programas estudiados están todavía en fase de desarrollo, es decir, no se trata de productos terminados, por lo que las descripciones quizá no coincidan con el estado presente de tales programas, ni tampoco las manifestaciones de sus responsables sean mantenidas en la actualidad.

El capítulo 10 está dedicado a Systran, que es el programa de enfoque "directo" más conocido. Además, es el más utilizado entre los programas instalados en un servidor central. En el capítulo 11 se describe el programa Susy, el mejor ejemplo del enfoque de "transferencia". El capítulo 12 aborda la traducción en dominios especializados, o de "sublenguajes", con el ejemplo del programa Météo, utilizado desde mediados de los años setenta. El capítulo 13 se centra en el programa Ariane, que ha sido considerado durante años como uno de los proyectos de investigación más importantes. El capítulo 14 gira en torno a Eurotra, famoso proyecto multilingüe patrocinado por la Comisión Europea. En el capítulo 15 se analiza el programa comercial de mayores prestaciones, METAL, que es el resultado de largos años de investigación en la Universidad de Texas. El capítulo 16 describe uno de los proyectos más ambiciosos, Rosetta, en el que se explora un enfoque "isomórfico" composicional basado en la Gramática de Montague. En el capítulo 17 se presenta el proyecto DLT, que se caracteriza por utilizar el esperanto como modelo de lenguaje para definir la interlingua. En el último capítulo se mencionan una serie de proyectos y programas de interés, entre los que destacan un sistema basado en el conocimiento, otro que utiliza la estrategia de traducción por ejemplos, otro fundado en la estadística y un cuarto programa diseñado para usuarios monolingües. También se citan un par de proyectos de traducción de sublenguaje y de lenguaje controlado ideados para la traducción de conversaciones telefónicas. El capítulo concluye discutiendo las tendencias hacia las que se orientará la traducción automática en el futuro.

El libro no constituye una descripción exhaustiva de los programas de traducción automática. Se han omitido dos cuestiones. El lector se dará cuenta, por ejemplo, de que no se describe ningún programa japonés, ni tampoco ninguno de los programas que se encuentran actualmente en el mercado. Esta circunstancia no refleja un prejuicio por parte de los autores, que en otras ocasiones se han hecho eco ampliamente de ellos. Los criterios para seleccionar los programas han consistido en elegir aquellos que más adecuadamente representan las principales técnicas y enfoques, los que mejor ilustran la evolución experimentada, los proyectos más influyentes y los que disponen de una documentación más ámplia, en particular si está redactada en inglés. Se trata por ello de los programas que mayor predicamento tienen entre los investigadores de la traducción automática y que conviene conocer mejor.

Durante la redacción del libro hemos contado con el apoyo de un nutrido grupo de compañeros, sobre todo en el Centro de Lingüística Computacional (CCL) de UMIST, cuyos colegas y alumnos de lingüística computacional y de traducción automática han aportado numerosos datos. Asimismo, agradecemos a la Universidad de East Anglia el permiso de excedencia concedido a John Hutchins que permitió que este libro llegara a buen término. Merecen una mención de agradecimiento especial Iris Arad, Claude Bédard, Paul Bennet, Jeremy Carrol, Jacques Durand, Martin Earl, Rod Johnson, Martin Kay, Jock McNaught, Jeanette Pugh y Nick Somers. También queremos mencionar a Liz Diggle, por transcribir las conferencias sobre las que se basan algunos capítulos, y a Jane Wooders, por colaborar en la versión para la imprenta. Por último queremos agradecer a nuestras esposas por la paciencia que mostraron durante la larga gestación del libro.

W. John Hutchins

Harold L. Somers

PRÓLOGO A LA EDICIÓN ESPAÑOLA

Han pasado algo más de dos años desde que se publicó la versión inglesa de este tratado de la traducción automática. En un sector tan dinámico como el de las aplicaciones informáticas, un lapso de dos años puede parecer mucho tiempo, suficiente como para restarle actualidad a un texto así. No obstante, si bien es cierto que en el área del hardware se producen innovaciones a un ritmo vertiginoso, no se puede decir lo mismo de las aplicaciones de software. Aunque sea verdad que también el mercado de software evoluciona con rapidez (constantemente se anuncian nuevos productos, nuevas aplicaciones, programas más capaces y vistosos), en general se trata de cuestiones de forma (nuevas interfaces, gráficos, ventanas, iconos, etc.), más que de contenido. Por otra parte, lo más preocupante de la traducción automática, como de cualquier otra aplicación de la ingeniería lingüística, es que, pese a los extraordinarios esfuerzos e inversiones realizados durante las pasadas tres décadas, los resultados no acaban de materializarse. De hecho, en estos dos últimos años cabría hablar incluso de retroceso, por lo menos en lo que respecta a la trayectoria de los métodos de investigación.

Existe la sensación generalizada de que los métodos preponderantes a partir de los años setenta han llegado al límite de sus posibilidades. Otros métodos, más simples y que fueron arrinconados por la "élite" hace treinta años, vuelven a recabar la atención de los investigadores. En estos dos últimos años hemos presenciado además la cancelación de dos importantes proyectos, Eurotra y Rosetta, cuya repercusión en la comunidad de investigadores ha sido más que notable. Debido a estos relativos fracasos y pese a la presencia en el mercado de aplicaciones útiles para el traductor, entre los investigadores existe cierta decepción cuando se habla de la traducción automática (hay que considerar que los productos que hoy en día se encuentran en el mercado reflejan la metodología de hace 10 o más años). Esta decepción, que ya vaticinaba en 1960 Yehoshua Bar-Hillel, es en gran medida proporcional al grado de ambición de los proyectos fustrados. La tendencia a elevar las metas de la traducción automática se ha visto recientemente truncada y nos encontramos, a mediados de la década de los noventa, ante un importante cambio de estrategias y de actitudes. Si la década de los sesenta, por influencia de la gramática generativa y de la inteligencia artificial, marcó un giro en el enfoque de los estudios hacia la consideración de la sintaxis y de la semántica, en los noventa presenciamos un retorno a postulados más simples, más rudimentarios, pero que son también más realistas y prácticos (memoria de traducción, traducción por ejemplos, cálculo de probabilidades, etc.).

Se puede decir que este libro cierra el final de una etapa, una etapa en la que los métodos simbolistas (el procesamiento mediante reglas) han protagonizado la escena de la investigación. El final de esta etapa coincide con la evaluación de resultados encargada por la Comisión Europea, publicada en 1990 (Informe Danzin) y la cancelación del proyecto Eurotra un año más tarde. Este libro refleja perfectamente la actividad de este cuarto de siglo, entre la publicación del Informe ALPAC en 1966 y el Informe Danzin. Ha sido un período muy intenso en proyectos y actividades que, aunque no ha ofrecido los frutos deseados, ha aportado una valiosísima experiencia cuya utilidad se mantendrá en desarrollos futuros.

La nueva etapa de la traducción automática, en la misma línea que el conjunto de proyectos de ingeniería lingüística, recoge las recomendaciones del Informe Danzin y se caracteriza por:

El nuevo planteamiento reconoce que para que las aplicaciones se traduzcan en productos es necesario tratar grandes cantidades de conocimiento lingüístico. Uno de los problemas más graves de la investigación ha sido la enorme dispersión y desaprovechamiento de esfuerzos. Con frecuencia, cuando los resultados no han superado la fase de prototipo, gran parte del material desarrollado (diccionarios, gramáticas, traductores, herramientas diversas de software, etc.) ha quedado arrinconado en el olvido. En otras ocasiones se ha repetido estérilmente el mismo trabajo por falta de conocimiento o coordinación entre los distintos grupos. Este es el motivo por el que durante estos últimos años se estén adoptando medidas, algunas promovidas expresamente por las instancias públicas que financian los proyectos, cuya principal meta es la reutilización y diseminación de recursos, así como el establecimiento de estándares que faciliten la colaboración y el intercambio de medios. Entre las iniciativas más importantes se pueden citar CLR, GENLEX, AQUILEX o EDR para el tratamiento del léxico y creación de diccionarios; TEI, ACL-DCI, NERC para la recopilación y tratamiento de corpus; EAGLES, MULTEX para la estandarización y desarrollo de herramientas comunes; y el propio Eurotra 7, que ya no es un proyecto de traducción sino de reutilización de material. Este empeño en aunar esfuerzos se debe plasmar en nuevas aplicaciones que permitan la automatización de la traducción de forma masiva. Cuando esto suceda, quizá dentro de una década, habrá llegado el momento de escribir un nuevo tratado que reemplace a éste.

Puede parecer una ironía tratándose de un manual de traducción automática, pero este libro no lo ha traducido un ordenador. La ayuda del ordenador se ha limitado a la utilización de un procesador de textos. La traducción manual, por otra parte, ha sido extremadamente laboriosa y complicada. No se trata de un texto sencillo. La traducción automática como solución hubiera sido completamente descabellada. Hoy por hoy no existe un programa que satisfaga las exigencias de una traducción de esta naturaleza y seguramente no va a existir en mucho tiempo, si es que alguna vez existe. La automatización de la traducción va por otros derroteros. Obras como ésta requieren la construcción de algo más semejante a un sistema experto, o a una base de conocimientos, que a un programa de traducción por ordenador. Se trata de una obra redactada en un estilo original, propio, con fragmentos que en cierto sentido son irrepetibles. Quiero decir que no se van a prodigar con la frecuencia suficiente como para que se justifique la especialización de un programa de traducción (como en cambio pueden ser los partes meteorológicos, los manuales de un producto, o los documentos de un organismo público).

El prologuista de la edición original inglesa, Martin Kay, patriarca y guru reconocido de la lingüística computacional, en una célebre conferencia pronunciada en 1991 constataba la existencia de dos líneas de investigación: una que estudia el lenguaje singular (remarkable language) y otra, en cierta medida contrapuesta, que analiza el lenguaje no singular (unremarkable language). Esto que llamamos lenguaje singular es lo que aparece en situaciones de habla concretas, en las que se recurre al uso de tropos y otros elementos estilísticos o retóricos, como puede ser la ironía. De esta manera es posible diferenciar dos clases de textos: los textos singulares o creativos, por un lado, y los no creativos por otro, que son respectivamente no aptos y aptos para su automatización. Entre los creativos habría que incluir la literatura, así como los textos de carácter espontáneo (por ejemplo, un guión de cine o el lenguaje periodístico en la trascripción de una entrevista, una información deportiva, una reseña crítica, etc.), y, por supuesto, libros como éste.

El interés de la distinción de Martin Kay reside en que claramente identifica el ámbito lingüístico en el que es viable la automatización de la traducción, esto es, el ámbito de los textos no singulares, del lenguaje repetitivo, controlado, normalizado, conocido en la traducción automática como el ámbito de los sublenguajes: disposiciones administrativas, legislación, informes y manuales técnicos, boletines divulgativos, partes informativos, teletipos, etc., etc. Del total de la producción mundial de documentación, la que mejor se presta a la automatización es también la que más rápidamente está creciendo, la que ha incrementado notablemente la demanda de traducciones. También es la más anodina y la que merece menor interés por parte del traductor humano. Por contra, la traducción automática se aplicará al lenguaje creativo sólo de manera anecdótica y la participación del traductor humano será siempre necesaria.

Los planteamientos más ambiciosos de la traducción automática han pecado de considerable ingenuidad, que explica la desilusión ante los logros alcanzados. En la inmensa mayoría de los proyectos, no se ha incluido a traductores profesionales en los grupos encargados del diseño. Su lugar ha estado ocupado por lingüistas, generalmente de corte teórico, ingenieros, informáticos, matemáticos y hasta físicos. No existe una piedra filosofal, como muchos de ellos han creído, que resuelva el problema de la comprensión del lenguaje humano. En la línea de lo que defiende la Escuela de Praga, podemos decir que el lenguaje humano, tal y como se revela en los textos escritos, es un código extremadamente complejo, heterogéneo, variable, con múltiples formas y manifestaciones. El lenguaje humano subyace a todas las ramas del saber, es vehículo y transmisor del conocimiento, motivo por el cual es casi imposible disociar uno del otro. Un buen traductor debe casi siempre conocer la materia sobre la que trata el texto, como bien hemos constatado al traducir esta obra. La escasez de buenos programas de traducción, si se comparan las inversiones con los resultados, contrasta con el éxito de la informática en otras áreas: la medicina, la física, las matemáticas, la astronomía, el diseño industrial, etc., etc. Este hecho confirma la dificultad que entraña el lenguaje humano como objeto de trabajo, y debería ser revindicado más a menudo por los traductores y otros profesionales de la lengua como prueba del mérito de su labor.

La traducción de este libro ha supuesto un considerable esfuerzo de indagación terminológica y de adopción de soluciones no siempre suficientemente contrastadas. Cuestiones tan básicas como las formas source o target language, para las que Julio César Santoyo ha propuesto lengua "de origen" y "meta", pero para las que una parte importante de la comunidad de traductores hispanos utiliza lengua "de partida" y "de llegada", ilustran el problema. En la traducción hemos mantenido anglicismos que ya están muy extendidos en el ámbito de la informática. Las palabras hardware y software se utilizan sin más junto con los términos "soporte físico" y "soporte lógico"; sin embargo se han evitado input y output para indicar "texto de origen" y "resultado", entre otras posibles soluciones. En cuanto a la terminología más específica, hemos optado, por ejemplo, por el término "interlingüe", en lugar de "interlingual", muy corriente entre los investigadores. Preferimos el término más clásico "artículo" de diccionario en lugar de "entrada". Sin embargo, mantenemos por lo general los préstamos "preedición" y "postedición", en lugar de utilizar los equivalentes "adaptar" y "revisar". Raw translation se ha traducido casi siempre como "traducción sin pulir", en una difícil elección en la que también entraban como candidatos "en bruto" y "en borrador". Hemos intentado evitar la utilización del término "sistema" cuando "programa" era igualmente válido, pero sin excluirlo totalmente. La Academia nos ha faciltado el trabajo al aceptar el término "implementar", tan habitual en los textos de informática. Los conceptos técnicos suponen un reto todavía mayor; así, pattern matching se ha traducido como "reconocimiento de patrones", aunque en alguna ocasión se haya empleado la palabra "cotejo", chart se ha traducido como "diagrama" y backtracking como "reevaluación". Estos tres casos son un claro exponente de la dificultad terminológica de la obra, ya que entre los especialistas habitualmente se utiliza la forma original inglesa. En definitiva, estos ejemplos sirven de pequeño botón de muestra. Hemos intentado utilizar los términos que hemos considerados más apropiados para la versión española, buscando el difícil equilibrio entre claridad y fidelidad. Por supuesto, la idoneidad de las soluciones es una cuestión muy subjetiva y será difícil que agraden a todos por igual. Al final del libro se incluye un índice, con los términos en español y las formas originales inglesas, que será de gran utilidad al lector.

Esta traducción se ha hecho en equipo y en ella han trabajado de manera tenaz Manuel Cadierno, quien, además de traducir, ha dedicado un tiempo ímprobo a las correcciones y al reprocesamiento del texto, María Gortázar, que ha aportado su excelente dominio de la norma escrita, Raquel Pardo, Sara Pérez y yo mismo. Debemos citar también por su participación inicial a Maite Martiartu. Han resuelto dudas terminológicas nuestros colegas Juan Carlos Ruiz, Josu K. Díaz, Javier Oliver y Andoni Eguíluz. Como participante en la traducción y revisor de toda la obra he de decir que la versión que ponemos en manos del lector es por supuesto mejorable, a pesar de que se han realizado interminables correcciones. Había que parar en algún un punto y las posibles deficiencias son responsabilidad mía.

Antes de concluir quiero aclarar la idea apuntada anteriormente sobre el futuro de la traducción automática. Decía que este futuro no incluye al lenguaje creativo. Pero esto se debe entender desde la perspectiva del lenguaje tal y como lo conocemos hoy en día, es decir, a través de los medios escritos o hablados. Los medios electrónicos, lejos de representar un corsé, van a posibilitar una nueva forma de creatividad con el lenguaje. A esta nueva forma ya se le ha comenzado a llamar hipertexto. Muy posiblemente, el próximo hito en la presentación de un manual comparable a éste aparecerá en la forma de libro electrónico, muy distinto en su concepción al que el lector tiene en sus manos, y que a buen seguro estará traducido íntegramente por ordenador.

Joseba Abaitua