LENGUA INGLESA Y NUEVAS TECNOLOGIAS

REPORT A

 

Tecnologias del Lenguaje Humano

y su papel dentro de la Sociedad de la Informacion

 

 

· Introduccion:

 

            El lenguaje es el medio natural de comunicación entre personas; el modo más eficaz de que disponemos para comunicarnos con los demás. Lo utilizamos de muy diversas maneras: para explicar ideas y conceptos complejos; para gestionar recursos humanos, negociar, convencer, dar a conocer nuestras necesidades; para expresar nuestros sentimientos, contar historias y transmitir nuestra cultura a las generaciones venideras. La lengua es, para la mayoría de nosotros, fundamental en todos los aspectos de nuestras vidas.

La utilización de la lengua sufre, sin embargo, restricciones. En general, se utiliza sólo en las comunicaciones directas entre seres humanos y no en nuestra interacción con los sistemas, servicios y aplicaciones que utilizamos en la vida cotidiana. Incluso entre las personas, el entendimiento suele limitarse a aquellos grupos que comparten una lengua común, de modo que la lengua puede, a veces, considerarse más un obstáculo que una ayuda a la comunicación.

En nuestros días, tiene lugar un cambio que va a revolucionar la utilización de la lengua y que aumentará considerablemente su valor en todos los aspectos de la comunicación. Dicho cambio es el resultado de los avances en ingeniería lingüística.

Cuando una máquina comprenda el lenguaje humano, traduzca entre varias lenguas y genere resultados orales e impresos, dispondremos de una herramienta poderosísima que nos ayudará en muchos ámbitos de nuestras vidas. La ingeniería lingüística tendrá éxito cuando haga realidad todas estas posibilidades. No obstante, algunas de estas cosas pueden hacerse ya, aunque requieren un mayor perfeccionamiento. El ritmo del progreso se acelera y en los próximos años podremos asistir a muchos avances.

 

1.¿Que es la Sociedad de la Informacion?

 

            El lenguaje es, sin duda, el principal medio a través del cual los seres humanos intercambiamos información. Ningún otro sistema de comunicación es tan eficaz para compartir ideas, transmitir saberes, expresar emociones y crear, en definitiva, lo que hoy conocemos como cultura. Por ello, no es extraño que suela relacionarse la aparición del lenguaje con la ventaja evolutiva de disponer de un procedimiento que permita la expresión del conocimiento común. Lenguaje, sociedad e información son tres términos que aparecen entretejidos desde el principio de la civilización.

Sin embargo, en su sentido más actual, el concepto de Sociedad de la Información incorpora otros componentes, entre los cuales destacan las tecnologías que permiten la difusión del conocimiento compartido. No es la primera vez que nos encontramos ante técnicas que facilitan la transmisión del saber; sólo cabe recordar que el papel de las nuevas tecnologías en la pervivencia de las lenguas y las culturas ha sido muy a menudo comparado al que en su momento tuvo la imprenta.

Las nuevas tecnologías, y muy especialmente las relacionadas con Internet, ponen a nuestro alcance una gran variedad de datos y de sistemas de interacción: en la red podemos acceder a sistemas de enseñanza asistida por ordenador, ir de compras, establecer nuevas relaciones, conversar con amigos o colegas que están al otro lado del planeta y consultar todo tipo de información. Suele insistirse, por este motivo, en que el acceso a la información se ha "democratizado": sólo hay que pensar que, por ejemplo, hasta hace muy poco tiempo, si un investigador quería conocer los trabajos de la Universidad de Harvard, no existía otra alternativa que solicitar una beca y realizar una estancia de unos meses; sin embargo, en la actualidad es perfectamente factible acceder a cualquier campus universitario, entrar en contacto con los profesores que allí trabajan, informarse con detalle sobre las investigaciones que se están llevando a cabo e imprimir las últimas publicaciones, todo ello mediante una simple consulta en la web.

Esta facilidad en las comunicaciones contribuye indudablemente a la creación de un nuevo nivel de realidad, la denominada "realidad virtual", que permite desarrollar el mismo tipo de interacciones que la realidad "presencial". En esta realidad virtual ni el espacio ni la distancia imponen ningún tipo de trabas, por lo que la intervención en nuestro entorno puede hacerse de una manera mucho más eficaz.

 

2. ¿Cual es el papel de la Tecnologia del Lenguaje Humano?

            El papel central de la lengua en la Sociedad de la Información no puede concebirse en la actualidad sin el complemento de unas tecnologías - las tecnologías del lenguaje - que se apoyan, en buena parte, en el uso de los sistemas informáticos de procesamiento de información.

El procesamiento del lenguaje y las tecnologías del habla son el núcleo de las actuales tecnologías del lenguaje, en las que confluyen la informática y la lingüística. Tales tecnologías constituyen también la base de lo que se ha dado en llamar ingeniería lingüística, entendida como "la aplicación de los conocimientos sobre la lengua al desarrollo de sistemas informáticos que puedan reconocer, comprender, interpretar y generar lenguaje humano en todas sus formas" .

Las tecnologías lingüísticas comprenden una serie de procedimientos relacionados con el tratamiento informático del lenguaje. En general, suelen distinguirse las que se aplican al tratamiento de la lengua hablada de las propias del procesamiento del texto escrito.

El desarrollo de las tecnologías lingüísticas requiere también la existencia de los denominados recursos lingüísticos, consistentes en corpus textuales, orales o léxicos que proporcionan los datos necesarios para el desarrollo y el funcionamiento de las aplicaciones. La utilización de tales corpus está ligada a una serie de procesos - como la codificación, el etiquetado, y el análisis lingüístico - y herramientas - por ejemplo los programas de concordancias - que facilitan su uso y su explotación. Su constitución constituye actualmente uno de los ámbitos a los que, tanto el sector público como el privado, dedican mayores esfuerzos.

Finalmente, es importante señalar que las perspectivas aquí expuestas tienen una importante repercusión en el futuro profesional de todas aquellas personas que tienen el lenguaje y la comunicación como herramienta de trabajo. Dado el papel central del lenguaje en la Sociedad de la Información, parece evidente que se abre para el lingüista una amplia gama de posibilidades. Por otra parte, campos tradicionales como la edición y la traducción adquieren una nueva dimensión que, de alguna manera, los dignifica, al situarlos en un contexto más amplio que requiere la realización de tareas más complejas y que supone, al mismo tiempo, una menor dedicación a actividades mecánicas y repetitivas.

Sin embargo, la incorporación del lingüista a los nuevos sectores de actividad no puede ser efectiva sin una formación específica. En el caso de la gestión de contenidos, son esenciales los conocimientos de informática y de lingüística computacional, así como la capacidad de abstracción y de razonamiento lógico, de organización y estructuración de datos y de formalización del lenguaje. Las tecnologías del habla, por otra parte, requieren especialistas con sólidos conocimientos de fonética, de tratamiento digital de señales y de las peculiaridades del proceso de interacción entre personas y sistemas informáticos.

Al contrario de lo que sucedía en la filología tradicional, el desarrollo de sistemas de procesamiento de la información, del lenguaje y del habla requiere la colaboración de especialistas en diversas áreas. Por ello, es también esencial en el perfil del lingüista que aspire a centrar su actividad en el nuevo entorno de la Sociedad de la Información, una buena capacidad de trabajo en equipo y de organización y gestión de proyectos multidisciplinares en los que la labor individual se oriente a la consecución de un objetivo común.

 

3. ¿Por que las tecnologias del lenguaje son tan importantes en la sociedad de la  información?

 

            Las necesidades que plantea la Sociedad de la Información determinan en cierta medida los objetivos de la lingüística computacional en el cambio de siglo: la revolución tecnológica ha dado lugar a cambios en profundidad en los sectores productivos y las profesiones relacionadas con el lenguaje, y también en aquellos sectores que, sin estar directamente relacionados con el lenguaje, necesitan dotar su actividad del valor añadido de una comunicación eficiente y fluida con clientes y usuarios. Esta nueva realidad impone la necesidad de desarrollar aplicaciones de procesamiento del lenguaje y del habla que tendrán un amplio abanico de posibles usuarios y que han de tratar con centenares de millones de documentos escritos o sonoros, lo que a su vez implica la necesidad de disponer de recursos básicos de ingeniería lingüística que deben permitir el desarrollo efectivo de estas aplicaciones.

 

4. Información y conocimiento

            Para poder usar información, primero debemos comprenderla. El proceso de comprensión es una asimilación de la información en la estructura compleja de nuestro conocimiento. La información debe pasar a ser parte de nuestro conocimiento antes de poder ser usada.

Cuando queremos conocer alguna ciudad extranjera, podemos comenzar estudiando el mapa de la ciudad. Estudiando el mapa, al comienzo nosotros memorizamos la disposición principal de la ciudad. A medida que el estudio avanza, asimilamos la información provista por el mapa en nuestra mente. Cuando, mas tarde, viajamos a la ciudad, usamos la información asimilada como conocimiento para encontrar nuestro camino.

Una vez que la información es correctamente asimilada, puede ser usada como conocimiento. Toda información puede asimilarse transformandose en conocimiento.

Pese a esto, no todo nuestro conocimiento es obtenido de esta manera. Por ejemplo, no pudimos obtener de esta manera la habilidad básica de aprender. Esto ilustra que al menos un conocimiento inicial (habilidades mentales) es requerido para empezar. Nuestra mente contiene ese conocimiento inicial y el adquirido.

Aplicamos los resultados del conocimiento a una acción o en la creación de nueva información. Hay siempre una parte del conocimiento usado expresado en el resultado.

Usando el lenguaje, expresamos conocimiento que pertenece al lenguaje. La estructura de las oraciones y la selección de palabras que usamos lleva información acerca del lenguaje.

Cuando construimos una casa, expresamos parte del conocimiento acerca de la construcción de casas en la casa en sí misma.

Una vez que tenemos un entendimiento básico de un lenguaje extranjero, podemos extender nuestro conocimiento sobre el lenguaje oyendolo o leyendolo. Esto es posible porque parte del conocimiento del lenguaje esta expresado en la aplicación del lenguaje que leemos.

El hecho que la información es expresada por sus aplicaciones es la mayor contribución a su propagación.

La información asimilada se transforma en conocimiento. El uso del conocimiento causa la expresión del conocimiento usado junto con el resultado. Hasta el conocimiento innato es expresado en nuestras acciones, si no fuera así, no seria posible investigar este conocimiento en el comportamiento de los niños.

Esto ilustra que una mutua traducción es posible entre información y conocimiento. La diferencia entre conocimiento e información radica en las circunstancias mas que en la naturaleza de ésta.

Como una primera aproximación, podemos sugerir que todo lo que pueda ser comunicado es información. Debido a que nosotros comunicamos conocimiento continuamente, no debemos extender esta noción de información para incluir comportamiento.

Pero, información y conocimiento no son sinónimos. La información es el término general y el conocimiento es información bajo determinadas condiciones. Cuando la información se encuentra en las condiciones adecuadas para propagarse, la llamamos conocimiento. La forma en que los seres informáticos se expresan a si mismos es parte del estudio del comportamiento de la información.

.

 

5. Evolución de la información.

La información se adapta a nuevas circunstancias y evoluciona. Debido a que el conocimiento es también información, este evoluciona de la misma forma. El sentido común, la inteligencia y el lenguaje son ejemplos de los resultados de una larga evolución del conocimiento por selección natural.

Sentido Común:

Conocimiento que es útil en varias circunstancias y será aplicado a estas frecuentemente. Esto causa una amplia propagación de dicho conocimiento. Cuando existe una posible elección entre varias formas de pensar, la forma que mejor se adapte a las condiciones generales de vida en la Tierra y en nuestro cuerpo se propagaran mas fertilmente. Esto permite que los conjuntos de información que más se propaguen se adquieran por la mayoría de los seres humanos. Este conocimiento compartido es llamado sentido común.

El sentido común es un complejo conjunto de información compartido por todos los seres humanos, éste corresponde al ser humano más que a un individuo.

 

 

 

6. ¿Tener grandes cantidades de datos implica que estemos bien informados?

            Debe también considerarse que la aparición de Internet como red de telecomunicaciones y, especialmente, de la web, está cambiando el concepto de lo que se considera información y el modo de tratarla: no está mejor informado quien más datos tiene, sino quien dispone de los mejores medios para recopilar única y exclusivamente aquellos que necesita.

Ahora bien, el entorno comunicativo que deriva de la aplicación de estas nuevas tecnologías plantea retos hasta el momento inexistentes: el acceso a la información debe ser eficaz, rápido, sencillo y flexible ante posibles errores de los usuarios. Es deseable también que se integre en un mismo entorno el habla, la imagen y la lengua escrita y que se tenga en cuenta la variedad de lenguas en las que la información puede encontrarse, tanto en el acceso a la misma como en los documentos que se recuperan.

La recuperación de información, una actividad que hasta hace poco se restringía a colectivos de profesionales muy concretos, ha pasado a ser uno de los problemas centrales a los que deberá hacer frente la Sociedad de la Información. Internet constituye un gran banco de datos que puede devenir inservible si no se dota de sistemas de recuperación de información que satisfagan las demandas de los usuarios. Por otra parte, las instituciones (gobiernos, ministerios) , organismos (hospitales, centros de información y atención diversos,) y empresas de todo tipo, en la medida en que disponen de una gran cantidad y variedad de información, precisan también de este tipo de sistemas.

Puede decirse que el problema de la recuperación de información se centra en dos aspectos fundamentales: el filtrado de los datos y el multilingüismo. En el primer caso, se trata de diseñar sistemas de recuperación de información que ofrezcan sólo los documentos que interesan al usuario, que eviten el exceso de "ruido" - es decir, la presencia de textos irrelevantes - y que no ignoren ningún texto que pueda ser de interés. En lo que se refiere al segundo aspecto, se hace necesario contar con recursos que permitan el acceso multilingüe a los datos, los cuales, a su vez, son también multilingües.

Estas necesidades que plantea la Sociedad de la Información inciden de manera muy directa en la orientación de la lingüística computacional en el cambio de siglo; un aspecto esencial del cambio radica en el tratamiento de textos lingüísticos sin restricciones, en contraste con las líneas de trabajo anteriores. Las repercusiones de este nuevo enfoque son muchas y afectan en profundidad a la definición de los campos de investigación tradicionales. Cabe añadir que la orientación que han adoptado las aplicaciones más clásicas de la lingüística computacional, así como las nuevas opciones que están emergiendo, requieren disponer de recursos lingüísticos a gran escala y para el mayor número de lenguas posible, tal como se señala en el siguiente apartado.

Finalmente, no debe olvidarse que la revolución tecnológica que ha significado la aparición de los nuevos sistemas de comunicación está provocando un cambio en profundidad en las profesiones y sectores productivos relacionados con el lenguaje, como puedan ser la traducción, la edición - en especial la de diccionarios y enciclopedias - y la enseñanza. Tales cambios exigen un reciclaje profundo a los profesionales de estas áreas. Por otro lado, pese al surgimiento de nuevos sectores que tienen a Internet como paradigma y que se centran en la gestión de contenidos, no se han ideado aún sistemas que permitan acceder de manera "inteligente" a la gran cantidad de información almacenada en formato electrónico. Los hospitales, la prensa y los medios de comunicación audiovisual, el mundo editorial, la banca etc. requieren sistemas que permitan extraer de manera guiada la información de la que ya disponen.

 

7. Sobrecarga de la informacion

 

            El término "sobrecarga de información" es usado para describir la situación en la cual un ser humano excede su capacidad de procesar información. La sobrecarga en sí y sus perniciosos efectos ha sido comparada como vivir bajo condiciones extremadamente superpobladas.

 

En primer lugar, la sobrecarga de información se debe a un crecimiento explosivo en la cantidad de información disponible, a escala global. En segundo lugar, mucha gente comete la equivocación de pensar que mientras más información mejor. El problema no es la cantidad de información sino la calidad de la información, porque la mayoría de ésta es irrelevante.

 

Las personas tienden a crear y a distribuir porque pueden, no porque sea útil. Los datos externos no están organizados. Todo lo anterior se puede resumir en el llamado push de información. La información es "empujada" hacia las personas, gracias al desarrollo del papel, imprentas, fotocopiadoras y correo, lo cual superó todas las barreras al poder proporcionarle a todas las personas su propia copia. Se hace inminente dejarlas obtener la información cuando la necesiten, para que estén en control. Son las fuentes electrónicas de información y las tecnologías WEB las que nos están prestando la posibilidad de superar este problema de una manera radical, mediante el pull de información, que se puede traducir como una extracción de información.

 

La mayoría de los usuarios que dependen de la información no se dan cuenta de los problemas que les podría estar causando. Estas personas no creen sufrir una sobrecarga de información, por lo cual no pueden percibir la necesidad de que esta sea administrada.

 

 

 

 

 

 

8. ¿Por que el lenguaje puede ser a veces una barrera para la comunicación?

 

            El lenguaje humano es, en esencia, un medio de comunicación oral. Pero las limitaciones naturales de una señal de desvanecimiento tan rápido como el habla desencadenaron la aparición de medios de transmisión alternativos, del tipo de la escritura. Con este precedente, las dificultades que el habla plantea a un tratamiento informatizado nos pueden llevar a creer que el texto es el cauce natural para el procesamiento de las lenguas. Sin embargo, su condición secundaria frente al discurso oral y las características propias de la lengua escrita confieren al procesamiento del discurso textual problemas específicos. En primer lugar, en todas las lenguas es habitual la homografía, esto es, la identidad en la escritura de signos lingüísticos diferentes. En español, por ejemplo, 'canto' o 'ama' pueden ser sustantivos o verbos, y en lenguas con una morfología más pobre, como el inglés, los casos se multiplican: la forma cut puede corresponder a un sustantivo, un verbo o un adjetivo y la forma right puede encerrar un sustantivo, un adjetivo o un adverbio. Como es de esperar, este sincretismo en las formas léxicas de las lenguas produce enormes problemas a la hora de traducir, interpretar o generar automáticamente un texto escrito.

Y las dificultades no acaban ahí. Incluso si no hay dudas sobre la categorización adecuada para una forma escrita, la polisemia o pluralidad de significados que podría albergar exige el uso de reglas contextuales muy finas. En español el verbo 'pegar' puede significar 'azotar' o 'adherir' y, sólo el esquema sintáctico en que se incluya dar la clave para resolver el conflicto: 'pegar' seguido de un complemento indirecto significa 'azotar'; seguido de un complemento directo, 'adherir'. Un sistema automático sólo podría interpretar verbos de este estilo estableciendo una primera versión sobre su significado básico y volviendo luego atrás para efectuar las modificaciones oportunas. Así el verbo inglés to grow equivale al español 'crecer' pero si el sistema se encuentra con que va seguido de un complemento directo animado deberá traducirlo al español por 'criar'; si ese complemento directo fuese inanimado y del tipo planta, to grow se identificaría con 'cultivar'. Ejemplos como éstos explican la evolución de la lingüística computacional. Aunque en los comienzos se optó por la estrategia ingenua de tratar un texto palabra por palabra, en seguida se comprendió que el análisis y la delimitación de las relaciones sintácticas latentes en él era un paso ineludible.

Por otra parte, las lenguas humanas son códigos afectados de fuertes dosis de imprecisión. En realidad, un código dispuesto para el intercambio cotidiano no necesita ser muy preciso. Si se admite que el fin último del lenguaje es la comunicación, se comprenderá que el hablante -urgido por la necesidad de comunicarse- tienda a eliminar de sus mensajes lo que le parezca accesorio. Toda la información que su interlocutor pueda deducir del contexto o la situación en que se produce el discurso, o todo lo que se desprenda de la experiencia estará ausente de los mensajes lingüísticos. Pero al aligerar el mensaje, el hablante lo hace más impreciso y se arriesga a propiciar la colisión de interpretaciones distintas. Este tipo de imprecisión, denominado ambigüedad, no es más que un accidente que tiene su origen en las imperfecciones del simbolismo utilizado, pues"ambiguo"se opone, de algún modo, a"unívoco". Una de sus caras más frecuentes en las lenguas es el sincretismo o capacidad de un significante para canalizar dos significados divergentes, como en el caso de las homografías ya vistas. No obstante la ambigüedad puede tener mayor alcance. Así, de esa dimensión terminológica se pasa a una ambigüedad estructural. Un caso típico es el de cláusulas como 'La tirada fue reducida', capaces de fomentar una lectura pasiva -si se entiende que el editor redujo la tirada de una edición- y otra atributiva -si, simplemente, se trata de consignar que la tirada contó con un escaso número de ejemplares-.

Ante un discurso ambiguo, el receptor indaga en el contexto la información necesaria para decodificarlo convenientemente. Pero para los tratamientos computacionales el problema radica en construir sistemas capaces de acceder al contexto. Además de las dificultades técnicas para lograr ese objetivo, hay que valorar el hecho de que buena parte de esas ambigüedades se resuelven en el procesamiento humano de la información a partir de conocimientos extralingüísticos. Una secuencia como 'Todas las jovencitas están enamoradas de un cantante' permite suponer que todas aman a uno en particular, o bien que todas aman a alguno sin que sus preferencias tengan que coincidir absolutamente en la misma persona. Aunque la primera interpretación es perfectamente legítima, la segunda sería la que cualquier hablante daría por buena en condiciones no-marcadas. La elección, sin embargo, no depende del contexto sintáctico o semántico sino, más bien, del conocimiento del mundo que nos da una cierta lógica de la vida cotidiana. Por supuesto, el modo en que efectuamos esos razonamientos ordinarios es difícil de formalizar. Pero difícil no significa imposible. Y de ahí que la investigación más reciente sobre el tratamiento computacional del texto se oriente hacia análisis pragmáticos, provistos de depuradas modelizaciones del conocimiento que el ser humano tiene sobre el mundo que le rodea.

 

9. ¿De que formas puede la Ingeniería del Lenguaje mejorar el uso del lenguaje?

            La ingeniería lingüística es la aplicación de los conocimientos sobre la lengua al desarrollo de sistemas informáticos que puedan reconocer, comprender, interpretar y generar lenguaje humano en todas sus formas. En la práctica, la ingeniería lingüística consiste en una serie de técnicas y recursos lingüísticos que se aplican, en el primer caso, por medio de programas informáticos y que, en el segundo, constituyen una fuente de conocimientos a los que se puede acceder por medio de programas informáticos.

La ingeniería lingüística es una tecnología que utiliza nuestros conocimientos de la lengua para mejorar la utilización de los sistemas informáticos:

Merced al creciente conocimiento de la lengua, surgen nuevas oportunidades de cambiar la forma en que hacemos muchas cosas, para que resulten más fáciles y eficaces.

Cuando, además de aceptar datos mecanografiados, una máquina pueda reconocer la escritura natural y la voz en varias lenguas, podremos disfrutar mejor de los beneficios de una vasta gama de servicios de información y comunicación, así como de la posibilidad de realizar operaciones comerciales a distancia por teléfono o mediante otros servicios telemáticos.

Cuando una máquina pueda ayudarnos a entender mejor y más rápido a los demás, podremos cooperar y colaborar con mayor eficacia tanto en las cuestiones económicas como en las políticas

Los procesos básicos de la ingeniería lingüística consisten fundamentalmente en:

 

 

10.¿Cuales son las principales técnicas usadas en la Ingenieria del Lenguaje?

 

Identificación y verificación del locutor

La voz humana es, como las huellas dactilares, única para cada persona. Por esta razón, se puede identificar a un hablante determinado, lo que permite comprobar que la persona está autorizada a acceder a un servicio o recurso. Esta técnica plantea una serie de problemas como, por ejemplo, reconocer que la voz no está grabada, discriminar la voz del ruido (ambiental o del medio de transferencia) y efectuar la identificación con fiabilidad, independientemente de los cambios temporales (por ejemplo, los causados por una enfermedad).


Reconocimiento del habla

Un ordenador recibe el sonido de la voz en forma de ondas analógicas, que se analizan para identificar las unidades de sonido (denominadas fonemas) constitutivas de las palabras. Se utilizan modelos estadísticos de fonemas y palabras para reconocer la introducción de datos orales discretos o continuos. La producción de modelos estadísticos de calidad requiere disponer de amplias muestras de entrenamiento (corpus). Con este fin, se han recogido ya, y se seguirán recogiendo, una amplia gama de corpus orales.

No obstante, deberán superarse muchísimos problemas para que el habla llegue a utilizarse de manera generalizada como medio para comunicar con un ordenador. El primero de ellos es la capacidad de reconocer el habla continua en lugar de enunciados emitidos deliberadamente por el hablante en forma de palabras independientes separadas por una pausa. El problema siguiente es reconocer a cualquier hablante, evitando la necesidad de entrenar al sistema en el reconocimiento de la voz de una persona determinada. Se da asimismo el grave problema de la interferencia del ruido, procedente del entorno en el que el hablante utiliza el sistema o del propio ruido producido por el medio de transmisión, por ejemplo, la línea de teléfono. La reducción del ruido, la amplificación de la señal y el reconocimiento de palabras clave pueden utilizarse para conseguir un reconocimiento claro y preciso en ambientes ruidosos o en redes de telecomunicaciones. Por último, existe el problema de los acentos y dialectos del lenguaje hablado que, con frecuencia, no responden a las normas recogidas en las gramáticas de la lengua escrita.


Reconocimiento de caracteres e imágenes

El reconocimiento de textos escritos o impresos exige obtener una representación simbólica de la lengua a partir de la forma espacial de sus símbolos gráficos. En la mayoría de las lenguas, esto significa reconocer y transformar caracteres. Hay dos tipos de reconocimiento de caracteres:

El ROC puede lograr, a partir de una familia de fuentes de imprenta, un elevado nivel de precisión. Los problemas vienen cuando la fuente se desconoce o es excesivamente decorativa, o cuando la calidad de la impresión es mala. En estos casos de dificultad, así como en el caso de la escritura, sólo pueden obtenerse buenos resultados utilizando el RIC. El RIC consiste en técnicas de reconocimiento de las palabras que utilizan modelos lingüísticos, tales como léxicos o información estadística sobre las secuencias de palabras.

El análisis de imágenes documentales está estrechamente relacionado con el reconocimiento de caracteres, pero implica el análisis del documento para determinar, en primer lugar, cómo se han compaginado gráficos, fotografías, líneas de separación y texto, y luego, de la estructura del texto para distinguir los títulos, subtítulos, leyendas, etc., a fin de procesar el texto correctamente.


Comprensión del lenguaje natural

Es obvio que la comprensión del lenguaje resulta fundamental en muchas aplicaciones. No obstante, una perfecta comprensión no es siempre imprescindible. De hecho, conseguir una comprensión parcial suele ser un primer paso de gran utilidad, porque permite seleccionar con inteligencia el grado de comprensión de los distintos niveles.

El análisis superficial o parcial de los textos se utiliza para conseguir una sólida clasificación inicial de textos sin restricciones. El análisis inicial puede utilizarse luego, por ejemplo, para centrarse en partes "interesantes" de un texto, con vistas a un análisis semántico más profundo que determine el contenido del texto dentro de un dominio delimitado. Puede utilizarse también, conjuntamente con los conocimientos estadísticos y lingüísticos, para determinar automáticamente las características lingüísticas de las palabras desconocidas, que pueden luego añadirse a los conocimientos del sistema.

Los modelos semánticos se utilizan para representar el significado de la lengua en términos de conceptos y de las relaciones existentes entre ellos. Un modelo semántico puede utilizarse, por ejemplo, para representar una solicitud de información con un significado básico independiente de la terminología utilizada o de la lengua en la que se haya realizado la consulta. Así se posibilita el acceso multilingüe a la información sin necesidad de estar familiarizado con la terminología o la estructura empleadas para indizar la información.

La combinación de análisis y generación con un modelo semántico permite la traducción de textos. En el estado actual de los conocimiento, las aplicaciones de traducción de textos exigen vocabularios y conceptos limitados, para que puedan utilizarse los recursos de ingeniería lingüística adecuados. Con vistas a la generación de textos de gran calidad, pueden utilizarse plantillas para la estructura de los documentos y frases comunes con partes variables.


Generación del lenguaje natural

Es posible utilizar la representación semántica de un texto como base para la generación de lenguaje. Una interpretación de datos básicos o el significado subyacente de una oración o frase pueden representarse en una cadena superficial de manera preestablecida, tanto en una lengua determinada como en función de las indicaciones de carácter estilístico de un sistema de planificación de textos.


Generación del habla

El habla se genera a partir de plantillas rellenadas, mediante la reproducción de grabaciones "enlatadas" o concatenando unidades de habla (fonemas, palabras). El discurso generado tiene que tener en cuenta aspectos como la intensidad, duración y acento, para producir una respuesta continua y natural.

El diálogo puede establecerse combinando el reconocimiento del habla con la simple generación, a partir de la concatenación de elementos del habla humana almacenados o sintetizando las reglas del discurso.

Una biblioteca de sistemas de reconocimiento y generación de habla, junto con una herramienta gráfica para estructurar su aplicación, permite a quienes no sean expertos en tratamiento del habla ni programadores informáticos diseñar un diálogo estructurado que puede utilizarse, por ejemplo, para la gestión automatizada de las llamadas telefónicas.

 

11.¿Que recursos lingüisticos son componentes esenciales en la Ingenieria              Lingüística?

Los recursos lingüísticos son un elemento esencial de la ingeniería lingüística. Constituyen una de las principales formas de representar el conocimiento de la lengua, que se utiliza en los trabajos de análisis que conducen al reconocimiento y la comprensión.

El trabajo de producir y mantener recursos lingüísticos es una tarea descomunal. De la producción de los recursos se encargan centros de investigación e instituciones públicas, con arreglo a formatos y protocolos normalizados que permiten utilizarlos en muchas de las lenguas de la UE. La Asociación Europea de Recursos Lingüísticos (ELRA, "European Language Resources Association") produce buena parte de estos recursos.


Léxicos

Un léxico es un depósito de palabras y de conocimientos sobre ellas. Entre éstos se cuentan la información sobre la estructura gramatical de cada palabra (morfología), la estructura fonética (fonología) o el significado de la palabra en diferentes contextos textuales, por ejemplo, en función de la palabra o del símbolo de puntuación que esté antes o después de ella. Para ser útil, un léxico debe tener cientos de miles de entradas. Son necesarios para cada lengua de aplicación.


Léxicos especializados

Existen algunos casos especiales de léxicos que se suelen investigar y producir independientemente de los léxicos de carácter general:

Nombres propios: Los diccionarios de nombres propios son esenciales para una comprensión eficaz de la lengua, al menos para que éstos puedan ser reconocidos dentro de su contexto como lugares, objetos, personas o incluso animales. En muchas aplicaciones adquieren un significado especial, cuando el nombre es fundamental para la aplicación, por ejemplo, en el caso de los sistemas de navegación por voz, los sistemas de reserva de vacaciones o la información de los horarios de ferrocarril, que se basan en la gestión automática de las llamadas telefónicas.

Terminología: En el complejo entorno tecnológico de nuestros días, existe una multitud de términos que es preciso registrar, estructurar y poner a disposición de las aplicaciones lingüísticas. Muchas de las aplicaciones más productivas de la ingeniería lingüística, como la gestión de documentos técnicos multilingües y la traducción automática, dependen de que se disponga de los bancos terminológicos apropiados.

Redes de palabras ("wordnets"): Las redes de palabras describen las relaciones existentes entre las palabras, por ejemplo, los sinónimos, antónimos, sustantivos colectivos, etc. Tienen un gran valor para aplicaciones como la búsqueda de información, las herramientas integradas de apoyo a la traducción y los sistemas ofimáticos inteligentes de creación de documentos.


Gramáticas

Las gramáticas describen la estructura de una lengua a diversos niveles: palabra (gramática morfológica), frase, oración, etc. Las gramáticas pueden tratar la estructura en términos formales (sintaxis) y de significado (semántica y discurso).


Corpus

Un corpus es una muestra amplia de lengua escrita o hablada, que proporciona las bases para:

Existen corpus nacionales que contienen cientos de millones de palabras, pero se trata de corpus construidos para fines concretos. Por ejemplo, un corpus puede contener grabaciones de conductores de automóvil para simular un sistema de control capaz de reconocer órdenes verbales, que sirve después para determinar los necesidades de los usuarios con vistas a su producción comercial.

 

 

12.Términos relacionados con la Ingenieria Lingüistica

 

Término

 

 

alineación de texto

 

proceso de alinear diversas versiones lingüísticas de un texto para identificar términos, frases o expresiones equivalentes

ambigüedad

 

situación en la que una palabra o una frase pueda comprenderse de diversas maneras; en el primer caso porque la palabra tiene más de un significado y en el segundo, porque la estructura de la frase puede analizarse de manera que tenga más de un significado

análisis del discurso

 

análisis para identificar la dependencia lingüística existente entre frases

analizador superficial

 

programa que analiza el lenguaje hasta la consecución de un nivel rudimentario de comprensión; se utiliza a menudo para determinar pasajes de texto que pueden analizarse luego con más profundidad para alcanzar un objetivo concreto

analizar

 

estudiar la lengua para establecer su estructura y sus relaciones sintácticas y/o semánticas

búsqueda de concepto

 

se utiliza en el contexto de la recuperación de información para significar que la búsqueda se hace utilizando un análisis semántico del filtro de búsqueda, que se coteja con un análisis semántico de la base de datos

diálogo

 

intercambio lingüístico bidireccional, alterno e interactivo entre dos personas, entre una persona y una máquina, o entre dos máquinas

diccionario

 

lista de palabras con su descripción, generalmente limitada a su significado y, en ocasiones, a su etimología

diccionario electrónico

 

diccionario (véase arriba) que puede ser leído por programas informáticos

dominio

 

se refiere generalmente a los campos de aplicación de los programas con capacidad lingüística, por ejemplo, banca, seguros, viajes, etc.; su significado en ingeniería lingüística es que el vocabulario de una aplicación queda restringido, delimitándose el ámbito de ésta, para reducir las necesidades de recursos lingüísticos

extracción de información

 

proceso de seleccionar la información de una base de datos por medio de índices basados en palabras claves, la semántica, y/o la búsqueda de concepto

formalismo

 

medio de representar las normas que se utilizan en la creación de un modelo de conocimiento lingüístico

habla continua

 

producida cuando el hablante no tiene en cuenta al oyente (por ejemplo, un dispositivo de reconocimiento de habla) y habla sin hacer pausas después de cada palabra

herramientas de creación

 

medios que se facilitan con el procesador de textos para ayudar al autor de documentos, y que suelen constar de diccionario en línea y correctores ortográficos, gramaticales y de estilo, así como de recursos para estructurar, integrar y enlazar documentos

herramientas integradas de apoyo a la traducción

 

entorno informático de trabajo para traductores humanos que ofrece una serie de medios de ayuda, como diccionarios, tesauros, memorias de traducción en línea, etc.

hipertexto

 

sistema que se utiliza comúnmente en los archivos de ayuda y en la World Wide Web, por el que un texto resaltado sirve para enlazar (como si se tratase de un índice) con otro texto relacionado con él (a menudo una explicación más detallada del punto resaltado)

lenguaje controlado (también, lenguaje artificial)

 

lenguaje que se ha diseñado para restringir el número de palabras y la estructura lingüística utilizada, para facilitar el tratamiento de la lengua; los usuarios característicos del lenguaje controlado trabajan en campos donde la precisión y la velocidad de respuesta es fundamental, por ejemplo, policía y servicios de emergencias, pilotos de aviones, control del tráfico aéreo, etc.

lingüística computacional

 

campo de la lingüística aplicada relacionado con el procesamiento del lenguaje natural por ordenadores

multilingüe

 

se utiliza propiamente para expresar que algo existe en una forma que puede comportar varias lenguas, pero a menudo se emplea para describir la existencia de varias versiones lingüísticas

procesamiento del lenguaje natural

 

término en uso desde los años 80 que describe un tipo de sistemas informáticos para el tratamiento inteligente de textos

traducción asistida por ordenador

 

ayuda al traductor humano para traducir de una lengua a otra por medio de herramientas informáticas

traducción automática

 

proceso de traducir de una lengua a otra por ordenador

traducir

 

trasladar un texto de una lengua a otra

 

13. Multilengüaje : barrera a la comunicación

 

El lenguaje constituye un eficaz medio de comunicación. Es también un medio para registrar y asimilar información y, en la práctica, la manera más conveniente de representar la mayor parte de la información que necesitamos. El lenguaje es vital tanto para nuestras actividades económicas como para nuestra administración. Es también muy importante en muchos de los aspectos sociales, culturales y políticos de nuestras vidas. El lenguaje forma parte integrante de nuestra cultura y nos ayuda a tener una identidad propia.

Para todos nosotros, la propia lengua es fundamental desde el punto de vista de la identidad nacional y cultural. La lengua tiende un puente con nuestras tradiciones y proporciona la base de nuestra educación y nuestro tiempo libre.

En Europa disfrutamos de una gran variedad de lenguas y culturas que nos permiten aprender mucho sobre los modos de vida de los otros, lo cual constituye una de las bases para la cohesión de la sociedad europea.

Si las ventajas de una sociedad multilingüe han de ser uno de los rasgos del modo de vida europeo, debemos, sin embargo, buscar la manera de superar los obstáculos a la comunicación y a la comprensión que conlleva dicho rasgo.

A veces se dice que en las actividades económicas, administrativas y políticas de ámbito internacional basta con utilizar una o dos lenguas, lo que en cierta medida es cierto. No obstante, esta circunstancia podría no ser del todo satisfactoria.

El predominio de unas pocas lenguas podría originar un desequilibrio de poder inaceptable y una pobre utilización de los recursos.

Sobre todo, reduciría de manera significativa el número de personas que pueden participar en cualquier actividad, lo que forzosamente lleva a la exclusión de contribuciones valiosas y al descontento. Con el tiempo, un planteamiento de este tipo marginaría también a las lenguas menos extendidas, reduciendo aún más su ámbito de utilización y disminuyendo inevitablemente la riqueza y la variedad de nuestra cultura. Por último, afectaría desfavorablemente no sólo a nuestro sentido de la identidad nacional, regional y cultural, sino también al de pertenecer a una auténtica sociedad europea que tolera a sus minorías y las apoya, reconociendo su valor.

Un planteamiento tan restrictivo del uso de la lengua también podría limitar la disponibilidad de una amplia gama de importantes servicios y medios nuevos, negando a muchas personas la posibilidad de utilizar los sistemas informáticos en su propia lengua.

La posición de Europa como comunidad naturalmente multilingüe en un mundo multilingüe puede utilizarse como una ventaja comercial.

Habida cuenta de nuestros esfuerzos para colaborar cada vez más, para crear un mercado único comparable con el nacional, tenemos el incentivo especial de encontrar soluciones a los problemas que plantea un mercado multilingüe. Si atiende con éxito a nuestras propias necesidades lingüísticas, especialmente en los campos de la economía, la administración y la educación, la ingeniería lingüística nos ayudará a competir en el mercado mundial. Por un lado, nuestras empresas tendrán una ventaja competitiva gracias a su experiencia en la utilización de la tecnología para satisfacer las necesidades de un mercado multilingüe. Por otro, dispondremos también de productos lingüísticos para vender al resto del mundo.

Una de las características más importantes de la sociedad de la información será el aprendizaje a lo largo de toda la vida. Asimismo, todo el mundo conviene en que los gestores del futuro deberán dominar más de una lengua. La ingeniería lingüística contribuirá mucho al desarrollo de los sistemas de formación personal, no sólo para el aprendizaje de lenguas sino también en lo tocante a una mejor adaptación a las necesidades del estudiante.

Los productos lingüísticos mejorarán el rendimiento tanto de las empresas y administraciones como de los particulares. Los productos creados por medio de las tecnologías de la lengua revolucionarán nuestros métodos e incrementarán la gama de servicios para empresas, administraciones y el público en general.

El reconocimiento, comprensión y generación del habla por ordenador hará más eficaz y humana la interacción entre las personas y los ordenadores.

Las máquinas entenderán el lenguaje natural y satisfarán nuestras necesidades de información con más precisión y sensibilidad, ayudándonos a superar el problema del exceso de información.

Los servicios de traducción asistida por ordenador y la generación de documentos en lenguas extranjeras no sólo mejorarán nuestros negocios en Europa sino que también contribuirán a ampliar nuestros mercados exteriores.

14. ¿Qué factores hacen a la tecnología un elemento indispensable?

 

En nuestra capacidad para desarrollar la utilización de la lengua reside la clave de la sociedad de la información multilingüe, de la sociedad europea del futuro. Los nuevos avances en ingeniería lingüística nos permitirán:

 

15. Maquinas traductoras frente a traducción humana

 

A la traducción maquinal le conciernen dos campos distintos: la traducción de textos escritos y la del lenguaje hablado. Este último es un problema muy grande ya que involucra dos áreas poco desarrolladas de la computación: la traducción y la interpretación de la voz. Cualquiera que haya experimentado con alguno de los muchos programas de traducción que actualmente pueden usarse en internet tiene una idea del nivel de incoherencia e ineptitud que estos programas pueden tener. Los más populares de éstos son www. babelfish.altavista.com, www. freetranslation.com y www. systranet.com entre otros. Hoy, a diferencia de hace unas décadas, el principal problema de la traducción por computadora ya no son las limitaciones de memoria ni la velocidad de procesamiento, sino los problemas de lógica, fonética y sintaxis. Sin embargo, se han logrado progresos notables al realizar traducciones en contextos específicos. Por ejemplo, si se limita el vocabulario a un área técnica específica, como para traducir manuales, los resultados pueden ser bastante sorprendentes; en cambio, si se trata de traducir sin un contexto delimitado, el resultado es generalmente muy fallido ya que el significado no reside en las palabras individuales sino en las frases. Esto de entrada es un progreso notable, ya que mientras un traductor humano puede traducir alrededor de dos mil palabras al día, una máquina con un procesador pentium III de 700 mhz puede hacer por lo menos unas 50 mil. Es de esperar que por lo menos en áreas de traducción estrictamente técnica la máquina sustituirá muy pronto al hombre. Esta no será la primera vez que la computadora reemplace a un trabajador que hace una labor intelectual; de hecho, la palabra computadora se refería hasta mediados de los años cuarenta a las personas, especialmente mujeres, que se ganaban la vida haciendo cálculos equipadas de una rudimentaria sumadora.

 

16.Ciclo de vida de la documentación

Si pensamos en la cadena de producción de las industrias de la información, cada vez tiene menos sentido abordar la traducción como una tarea autónoma o aislada. La mayor parte de los textos que se generan a diario no son especialmente originales, se repiten una y otra vez, con pequeños cambios y actualizaciones: textos comerciales, manuales de referencia, instrucciones de uso, disposiciones legales, informes, partes, teletipos... Este tipo de producción documental supone el porcentaje mayoritario de demanda de traducciones. Por ello es importante disponer de métodos eficaces que permitan controlar no solo la traducción, sino todo el ciclo de vida de los documentos (concepción, redacción, revisión, traducción, difusión, catalogación, almacenamiento, reutilización, control de calidad). En este orden de cosas, en los últimos años han adquirido gran importancia los estándares y normas internacionales, tanto en la producción documental (SGML/XML), como en el control de calidad, bien del proceso industrial en su conjunto (ISO 9000), o bien específicamente de la traducción (DIN 2345).

 

17.Globalización y localización, ¿cómo afectan al diseño del software?

La localización se denomina a la modalidad de traducción que mejor encaja en el medio electrónico. Este enfoque tiene dos aspectos novedosos: tratar la traducción como un eslabón más en el ciclo de vida de la documentación; y añadir a la idea de traducción la de adaptación del producto a las demandas del mercado.

Cuando un producto o un servicio se lleva a un nuevo mercado, diferente del inicial para el que fue diseñado, no sólo tiene que ser "traducido" a la lengua de los nuevos clientes, sino que debe tener en cuenta todas las particularidades culturales, sociales, económicas, etc. de ese nuevo mercado. Ello implica la consideración de muchas más cuestiones que las meramente lingüísticas y puede suponer la revisión completa del propio diseño del producto. Un buen diseño es aquel que separa los aspectos ligados al uso particular en un mercado de las propiedades generales del producto, de forma que permita una internacionalización efectiva y facilite su posterior adaptación a otros mercados locales. En la medida en que los mercados se internacionalizan, productos y servicios deben adaptarse a los requisitos locales y gustos personales de los usuarios (Esselink, 1998).

A modo de colofón cabe decir que el mundo no por estar cada día más globalizado dejará de ser multilingüe ni multicultural. Por ello, en esta nueva era de la información, las tecnologías de la traducción y localización tienen asignado un papel estelar.

 

18. Principales problemas de la traducción automatica

 

Tipología de textos

Los traductores saben muy bien que cada traducción es un mundo. Hay una gran variedad de textos, cada uno con sus peculiaridades. No es lo mismo traducir una convocatoria de asamblea, que una crónica deportiva o una columna de Francisco Umbral. Para abordar estas diferencias se suele recurrir a conceptos como género, registro, estilo o tipo (Trosborg, 1997). Las diferencias entre estas nociones no siempre están muy claras, pero son tan fundamentales para traducir manualmente como mecánicamente.

Densidad léxica

La distinción entre lenguajes de especialidad y lengua común tiene relación con otras dos nociones importantes, la de granularidad,  de Melby, y la de densidad léxica de Laviosa (1998). La definición de granularidad se basa en el tamaño de las unidades léxicas en las que se puede segmentar un texto. Los textos de granularidad más gruesa son los que contienen combinaciones mayores de palabras: fórmulas, frases hechas, nombres propios, términos compuestos. La densidad de un texto es inversamente proporcional a la granularidad. A mayor densidad, menor granularidad. Los textos que muestran una densidad alta son generalmente de ámbitos de especialidad.

Podemos decir en resumen que

Distancia lingüística y cultural

Un tercer aspecto que va a incidir de manera fundamental en la dificultad de traducir por medios mecánicos es la distancia lingüística y cultural entre lenguas. Esta dimensión es clave para acertar en el diseño de un traductor mecánico

Pero al problema de la distancia lingüística hay que sumar la distancia cultural. Las gramáticas del euskara y del japonés tienen muchos puntos de coincidencia, pero esto no quiere decir que se pueda obtener un sistema con la misma facilidad con la que se obtiene para el gallego y el español.

 

19.Principales metodos, tecnicas y enfoques de la traduccion automatica

Los métodos aplicados a la traducción automática se pueden dividir en dos grandes familias:

Desde el punto de vista teórico son aproximaciones radicalmente contrapuestas que dan origen a sistemas de diseño muy distinto. Los sistemas basados en reglas han sido influidos en su concepción teórica por los avances en Lingüística Generativa e Inteligencia Artificial, sobre todo a partir de la década de 1970. Son estos sistemas los que por lo habitual se consideran propiamente como sistemas de "traducción automática". Los sistemas basados en analogías han hecho su aparición en la década de 1990 y aplican métodos de proximidad estadística sobre muestras de textos previamente traducidos. Aplican técnicas afines a las utilizadas en los sistemas de reconocimiento del habla y en la Lingüística de Corpus. Algunos autores los describen como sistemas de "traducción asistida".

En la traducción por reglas destacan dos métodos que se caracterizan por utilizar representaciones intermedias. Por este motivo, se conocen como métodos indirectos de traducción por reglas. Así pues, una distinción preliminar es la que distingue los métodos directos de los indirectos. En los métodos directos no se utilizan representaciones intermedias y la traducción se realiza en un único paso: se consultan las palabras de la lengua de origen en el diccionario y directamente se generan sus correspondencias en la lengua meta, aplicando sólo algunas reglas ad hoc de flexión, concordancia y reordenamiento. Pero esta técnica tan sencilla de traducción palabra por palabra hace tiempo que se ha abandonado por inviable y todos los sistemas conocidos, incluso los que traducen entre lenguas muy cercanas como el español y el catalán (InterNOSTRUM), proclaman utilizar representaciones intermedias de uno u otro tipo.

El cambio de enfoque en los noventa se ve favorecido por el drástico abaratamiento de los microprocesadores y las unidades de almacenamiento. Con ello comienzan a proliferar las colecciones de textos en formato electrónico y su disponibilidad favorecida por Internet es una invitación a probar los métodos probabilísticos y conexionistas que tan buenos resultados habían dado ya en el tratamiento de corpora orales. El número de sistemas diseñados se multiplica (Catizone y otros 1993, Kay y Röscheisen 1993; Vogel y otros 1996, Wu 1996 y Tillmann y otros 1997), de forma que puede decirse que a partir de los noventa el paradigma de la traducción por reglas comienza a perder adeptos en beneficio de la traducción por analogías (Jones 1992).

 

 

20-. Nuevas direcciones y breves adelantos de la traducción automatica

En relación con la futura sociedad de la información, la Comisión Europea ha puesto un énfasis especial en el estímulo a las llamadas "industrias de la lengua" y a la tecnología necesaria para su desarrollo, la "ingeniería lingüística". Son tres pilares destacados de sus programas de fomento cuya razón de ser no es gratuita. El plurilingüismo que caracteriza a Europa, y la distingue del gigante americano, demanda realizar esta apuesta. La manera en que Europa resuelva sus barreras lingüísticas servirá de modelo a un mundo que, no por ser cada vez más pequeño, dejará de ser multilingüe.

El futuro de la traducción automática pasa por la normalización a gran escala de la documentación escrita. Si se plantea como un objetivo práctico, sólo tiene sentido automatizar la traducción cuando se trata de lenguaje estático. El lenguaje estático es una forma de lenguaje que, por un motivo u otro, ha sido fijada, en la que abundan las fórmulas y los clichés y que está, de manera más o menos rigurosa, sometida a control permanente. Se opone al lenguaje dinámico o de la lengua común, que se encuentra en los textos espontáneos o creativos y en el habla coloquial.

La lengua común, por su propia naturaleza, se resiste a los esfuerzos de formalización precisa y exhaustiva que requiere la automatización de la traducción. En este campo, solo cabe hablar en un sentido especulativo, o como complemento o ayuda al traductor humano, que es irremplazable, al modo de los libros de frases y diccionarios, o también con la aportación de fondos documentales que contengan traducciones modélicas que puedan servir de referencia.

En otro orden de cosas, la popularización de Internet abre un nuevo horizonte, debido a su condición globalizadora y plurilingüe, y ofrece un interesante campo de pruebas. En cierto sentido, cuando se editan páginas en varios idiomas, el tipo de trabajo se asemeja a la adaptación o localización de software, área en la que tienen mucho éxito las memorias de traducción.

La experiencia reportada por los mayores consumidores de herramientas informáticas para la traducción se resume de la siguiente manera:

·         La cercanía entre los usuarios de las herramientas y sus desarrolladores es una garantía de que éstas se adapten mejor a la utilidad pretendida.

·         Las herramientas se deben integrar en el flujo documental, con soluciones de ingeniería de software para el tratamiento de formatos, caracteres, correo electrónico, filtros, etc.

·         El desarrollo de los diccionarios es una de las claves del éxito..

 

 

· Referencias:

 

·La ingenieria lingüística en la sociedad de la información

            Maria Antónia Marti Antonin

            Joaquim Listerri

            http://www.uoc.edu/humfil/articles/esp/llisterri-marti/llisterri-marti.html

            http://liceu.uab.es/~joaquim/publicacions/FDS2000.html

 

· Lenguaje y nuevas tecnologías: el campo de la lingüística computacional

            Teresa Moure

            http://liceu.uab.es/~joaquim/publicacions/llisterri_moure_96.html

 

·Compotamiento de la Informacion

            Por Luc Claeys

            http://www.smalltalking.net/Papers/boi/ch03.html

 

· Sobrecarga de la informacion:

            http://www.sitios.uach.cl/caminosfor/CristianSalazar/SIE/SI.html

· Las Habilidades de información en un mundo electrónico: la formación investigadora de los estudiantes

     de doctorado

            Christine A. Barry

            http://www.um.es/fccd/jagh/C.%20Barry.doc

· Introducción a la traducción automática

            Joseba Abaitua

            http://sirio.deusto.es/abaitua/konzeptu/ta/mt10h_es/index.html

 

· Quince años de traducción automática en España

            Joseba Abaitua

            http://www.serv-inf.deusto.es/abaitua/konzeptu/ta/ta15.htm

 

 

                                                                                              DANIEL RODRIGUEZ GASCA

                                                                                                    18596017-B …. ESIDE

                                                                                                 rodriguezdani@hotmail.com