Handout


Programa de doctorado en Lengua y Literatura, 1999/2000

Nuevas tendencias en la lingüística contemporánea

Eclecticismo en la práctica lingüística

Joseba Abaitua
Departamento de Filología Inglesa
Universidad de Deusto

Programa

Índice

  • Antecedentes (Jesús Mosterín, Yorick Wilks, Alan K. Melby)
  • Sintaxis: Teorías, formalismos, análisis, datos (Stuart Shieber). La jerarquía de Chomsky. Gramáticas de rasgos (Stuart Shieber, Ivan Sag)
  • Pragmática
    • Discurso, resolución de referencias anafóricas
    • Traductología y traductemas
    • Actos de habla y tipología textual
  • Lecturas recomendadas
  • Citas y otra bibliografía útil
  1. Primer día
  2. Segundo día
  3. Tercer día: Unidades de traducción y bitextos

Primer día

  1. Tres manzanas
  2. El maestro y los maestrillos
  3. Virtudes y límites de los formalismos
  4. Alternativas (1990):

Notas en borrador:
¿cómo se forma un lingüista ecléctico?

Aviso: Estas notas fueron preparadas para un curso de doctorado. No deben ser citadas ya que se trata de un borrador.

Quiero hablar de dos cuestiones: de la lingüística llevada a la práctica, pero también de la teoría. El orden no es importante, pero tal vez empiece por este orden, primero práctica y luego teoría. Suele ser al revés, lo sé, pero es que precisamente no quiero insistir en la teoría previa a la práctica, de la que ya se habla mucho, sino de teorizar a partir de hechos prácticos, a la manera de evaluación y validación de nuestras hipótesis y enfoques teóricos previos.

A la manera de introducción y como forma, espero, de motivar mi participación en el curso, quiero hablaros antes de nada de mi propia trayectoria como lingüista. En junio haré cuarenta años y la edad sirve de excusa para tomar ciertas licencias. Voy a permitirme una de ellas, conocida vulgarmente como "contar batallitas"

Mi primer contacto con la lingüísitca lo tuve en COU. Un profesor joven nos habló de Chomsky y su revolución en el estudio del lenguaje humano. Nos explicó lo de la competencia y la actuación y lo comparó, distinguiéndolo, de lo de lengua y habla de Saussure. Tras el COU me alisté/matriculé en la recién estrenada licenciatura de Filología Vasca en la Universidad de Deusto (1977). Eramos la segunda promoción. En Vitoria, en la UPV-EHU comenzó un año más tarde. En Deusto mi primera (y única) profesora de lingüística fue Itziar Turrez. Tengo un recuerdo muy agradable de ella como profesora -era amena, ordenada, asequible-, pero a la vuelta de los años y, sobre todo, tras mi experiencia de doctorado, tuve la sensación de que nos había dado una visión de la disciplina trasnochada. Esto era injusto, una más de esas injusticias que los alumnos cometemos con frecuencia con nuestros profesores. Ella empleaba bibliografía de la década de los 50 a 70. Es como si yo citara ahora a mis alumnos referecias de los 80 al 2000. ¡Pues ni tan mal! Es precisamente lo que hago.

Itziar Turrez nos explicó toda la evolución de la lingüística, desde por lo menos los babilonios, si no antes, basándose en la referencia de Mounin (Historia de la lingüística desde los orígenes al siglo XX. Madrid, Gredos, 1968). Por entonces tenía mucha ilusión y me compraba todos los libros que nos recomendaban, la mayoría editados por Gredos. La parte fuerte del curso fueron Saussure, la Escuela de Viena, la de Praga, Hjelmslev, Coseriu, Martinet y Bally. Nada o muy poco sobre Chomsky. Me gustó de manera particular lo de Bally, sobre lo que volveré un poco más tarde. Pero me costó mucho entender la diferencia entre sistema y norma de Coseriu.

En todo caso, por este y otros motivos, creo que mi mente lingüística quedó bastante marcada como estructuralista, funcionalista. Me sigo sintiendo muy afín a la escuela de Praga y al positivismo lógico. Esto quiere decir que soy partidario del empirismo como método de estudio científico más que por el racionalismo. Aristóteles frente a Platón, como veremos más adelante. Este posicionamieto mío con la escuela de Praga es con frecuencia motivo de mofa por parte de los seguidores de Chomsky, ya que la ven como una etapa superada y desfasada. Lo que muchos de ellos no quieren saber es que Chomsky hace tiempo que ha sido superado también.

Una serie de avatares familiares que no vienen al caso contar influyeron negativamente en mi progresión en la licenciatura, lo que me llevó a perder todo el tercer curso en Deusto, ocasión que aproveché para replegarme a mi ciudad natal, Vitoria, y seguir desde allí con la licenciatura. En Vitoria entré en contacto entre otros con Luis Michelena, Jon Juaristi, Ibón Sarasola, Patxi Goenaga y Javier Hernández Palacios. De todos ellos los que más me influyeron fueron los dos primeros, especialmente el segundo, por lo que luego explicarés. Sarasola y Palacios me enseñaron los rudimentos de la lógica de predicados y de las gramáticas formales; y Goenaga de la aplicación del modelo transformacional de Chomsky al euskara. Fueron en total tres cursos entre 1980 y 1983, que culminé con una tesina consistente en el estudio de la ortografía de Oihenart con ayuda del ordenador.

Al comienzo de la década de los ochenta, la informática empezaba a ser una ciencia que causaba una gran expectación y esto se veía reflejado en la prensa escrita y en la proliferación de academias privadas en las que se enseñaba informática. Los cursos 1981/82 y 1982/83 me matriculé en una de ellas, Ceinmark, y obtuve un diploma como programador de aplicaciones en COBOL. Programar me parecía un divertimento y lo pasaba muy bien, aunque entonces se hacía sin ordenador, en unas plantillas que luego alguien corregía a mano. IBM acababa de sacar al mercado los primeros ordenadores personales, y ya por entonce costaban parecido a los de ahora, medio millón de pesetas.

El momento clave fue un curso de introducción a la Lingüística Computacional que Hernán Urrutia organizó en Deusto. Allí conocí a Montserrat Meya y a Luis de Sopeña.

Luego me fui a la Universidad de St. Andrews, en el Condado de Fife, en Escocia. Allí me contrataron como Language Demonstrator de euskara y castellano. Iba con el plan de pegar el salto al doctorado. Mi objetivo era el Centre for Cognitive Studies de la Universidad de Edinburgo. Edinburgo era entonces el sitio más prestigioso para estudiar Lingüística Computacional de todo Europa. Tenían un programa de doctorado muy solicitado. Henry Thomson, Marc Steedman, Marc Moens enseñaban gramáticas categoriales, semántica de Montague y programación lógica (Prolog). Era lo que se llevaba entonces. Pero en el concurso-oposición que había que pasar para ser admitido fui tumbado.

Menos mal que había pedido el ingreso en otras universidades. Así que por avatares del destino aterricé en el CCL de UMIST. El CCL estaba especializados en Traducción Automática, algo que a mí a priori no me interesaba. Sin embargo aquello fue un inesperado golpe de suerte que ha marcado mi vida profesional muy positivamente. Me parece que la traducción no solo es una de las aplicaciones más apasionante -por compleja- que se puedan plantear desde la informática, sino además una de las más bellas.

Muchos autores han hablado de la mente humana como de una máquina. La inteligencia artificial lo ve así. Yo no tengo una opinión formada al respecto ya que la neurología no es uno de mis fuertes. En cualquier caso, lo que muchos autores han hecho es suponer que es posible tratar la mente como una máquina, sobre todo los neurólogos.

Formal linguistics

Noam Chomsky. 1963. Formal Properties of Grammars. R. Kyce, R. Bush & E. Galanter (eds.) Handbook of Mathematical Psychology, vol II. Wiley.

Martin Kay. 1985. Unification in Grammar. V. Dahl & P. Saint-Dizier (eds.) Natural Language Understanding and Logic Programming, vol I: 251-278.

Alan K. Melby. 1995. The Possibility of Language. A discussion of the nature of language with implications for human and machine translation. John Benjamins

Jesús Mosterín. 1973. La matemática como lenguaje. Filosofía y ciencia en el pensamiento español contemporáneo (1960-1970): 25-36. Simposio de lógica y filosofía de la ciencia. Tecnos. Madrid.

C. Raymond Perrault. 1984. On the Mathematical Properties of Linguistic Theories. Computational Linguistics 10: 165-176.

Stuart Shieber. 1987. Separating Linguistic Analysis from Linguistic Theories. Whitelock, P., M Wood, H. Somers, R. Johnson, & P. Bennett. (eds.) Linguistic Theory and Computer Applications. Academic Press.

Yorick Wilks. 1976. Philosophy of Language. Eugene Charniak and Yorik Wilks (eds.) Computational Semantics: An introduction to Artificial Intelligence and Natural Language Comprehension North-Holland: 205-233.

Constraint-based grammars

Gerald Gazdar & G. K. Pullum. 1985. Computationally Relevant Properties of Natural Languages and their Grammars. W.J. Savitch et al. (eds.) The Formal Complexity of Natural Language: 387-437

Ronald Kaplan & Joan Bresnan. 1982. Lexical-Functional Grammar: A Formal System for Grammatical Representations. J. Bresnan (ed.) The Mental Representation of Grammatical Relations. MIT Press.: 173-280.

Martin Kay. 1985. Parsing in Functional Unification Grammar. D.R. Dowty, L. Karttunen & A.M. Zwicky (eds.) Natural Language Parsing, Cambridge University Press: 251-278

G. K. Pullum & Gerald Gazdar. 1982. Natural Languages and Context-Free Languages. Linguistics and Philosophy 4: 471-504.

Ivan A. Sag. 1991. Linguistic Theory and Natural Language Processing. Klein & Veltman (eds.) Natural Language and Speech. Springer-Verlag: 69-80

Peter Selles. 1985. Lectures on Contemporary Syntactic Theories. CSLI. Stanford University. [Versión española: 1989. Teorías sintácticas actuales. Editorial Teide, Barcelona].

Stuart Shieber. 1986. An introduction to unification-based approaches to grammar. CSLI. Standford University

Discourse

Janet Hitzeman and Massimo Poesio. 1998. Long Distance Pronominalisation and Global Focus. COLING-ACL'98: 550-556.

Dan Cristea and Bonnie Webber. 1997. Expectations in Incremental Discourse Processing. ACL'97:88-95.

Barbara J. Grosz and Candace L. Sidner. 1985. The structures of discourse structures. CSLI, Stanford University.

Barbara J. Grosz and Candace L. Sidner. 1986. Attention, intentions and the structure of discourse. Computational Linguistics 12, 175-204

Barbara J. Grosz, A.K. Joshi, and S. Weinstein. 1995. Centering: A framework for modelling the local coherence of discourse. Computational Linguistics 21-2:202-225.

U. Hahn and M. Strube. 1997. Centering in-the-large: Computing referential discourse segments. ACL'97: 104-111.

N. Kameyama. 1985. Zero anaphora: The case of Japanese. Doctoral dissertation. Stanford University.

M. A. Walker. 1996. Limited attention and discourse structure. Computational Linguistics 22-2:255-264.

Bonnie L. Webber. 1991. Structure and ostension in the interprtation of discourse deixis. Language and Cognitive Processes 6-2:107-135.


Tipos de gramática

Las reglas se clasifican de mayor a menor complejidad o generalidad.


Tres manzanas

¿Puede una descripción reemplazar al objeto descrito?

En sentido estricto, nunca. Sacamos tres manzanas de una bolsa y pedimos voluntarios que las describan. Las descripciones nunca podrán reemplazar a las manzanas mismas. Las descripciones permitirán comunicar sensaciones, aportarán datos más o menos "objetivos", medida, peso, tamaño, color, olor, sabor, tacto, sonido... Pero el objeto "manzana" será una cosa y la descripción otra.

Nuestra ciencia de la manzana permitirá quizá crear sucedáneos, zumo, sidra, perfumes, otros productos con sabor a manzana, objetos que parezcan manzanas... La clonación genética permitirá reproducir la manzana, pero clonación es distinto de síntesis, aunque supongo que en algún momento ambos conceptos acabarán solapándose.

El problema con el lenguaje es que usamos el mismo lenguaje para describirlo. Esto se conoce como el problema del metalenguaje, que tanto ha preocupado a los filósofos (Kurt Gödel, Richard Montague, Ludwig Wittgenstein, Douglas R. Hofstadter). ¿Con qué se describe el metalenguaje? Se necesita una nueva abstracción, otro metalenguaje y así hasta el infinito.

Es decir que usamos lenguajes, creamos lenguajes para describir el lenguaje humano. Y, en este caso, es muy fácil confundir el objeto con su descripción. De hecho, cuando se trata de lenguaje, es posible reemplazar el lenguaje por un metalenguaje, como se hace con las matemáticas. ¿Cuál es mejor, más útil? Las matemáticas se desarrollaron para suplir las deficiencias de la lengua común. La ciencia depende de las matemáticas. Los límites de la ciencia (de la física, sobre todo) dependen de los avances en matemáticas (unificación de la macro y microfísica, teoría de las supercuerdas).

Ciencia y vida y el ejemplo de las teres manzanas.

Funciona la mente como una máquina. Es el ser humano una máquina. Pueden los seres vivos ser considerados máquinas


El maestro y los maestrillos

Noam Chomsky
vs.

Yorik Wilks, Martin Kay, Joan Bresnan, David Warren, Stuart Shieber, Beth Levin, James Putejovsky, Alan K. Melby, George Godfarb...


Doctrina
vs.

Ciencia, tecnología, ingeniería, industria...

Todo depende de qué busquemos, de cuáles sean los objetivos de nuestras pesquisas lingüísticas, de para qué queramos analizar el lenguaje humano.

Por eso es imortante tener claros los objetivos. Si son teóricos, o si son prácticos. Cuando los objetivos son prácticos, habitualmente es mejor ser ecléctico.

Si somos teóricos, ¿se puede ser ecléctico? ¿o hay que adoptar hipótesis y llevarlas hasta sus últimas consecuencias, hasta alcanzar la confirmación o refutación de nuestra hipótesis? Como "búsqueda de la verdad", así se define la filosofía. Como "búsqueda de la razón", o logos, así se define la filología. ¿Pero cómo definimos la "verdad"?

¿Es la esencia del lenguaje lo que persiguen los lingüistas? ¿Qué es el lenguaje, dónde se encuentra su esencia? ¿En el sonido? ¿En el aparato fonador? ¿En la mente? ¿En el cuerpo vivo? ¿Está el lenguaje escrito en nuestro ADN?

La escuela generativa adopta la hipótesis de la autonomía del lenguaje. Yo lo respeto. Pero lo considero una trivialización del problema, y si me apuran diré incluso que una frivolidad.


Lección de pragmática en un kinder sorpresa

Hace un par de años, un eminente colega lingüista presumió de no saber nada de "pragmática". Aprecio mucho a mi colega y voy a usarlo para el ejemplo sin animo de ofenderle, por lo que no daré muchas pistas sobre su identidad. En todo caso, debo decir que se trata de uno de los lingüistas mejor informados que conozco dentro de la llamada escuela generativa. Obviamente su alarde de ignorancia hacia la pragmática no era carente de intención; estaba repleta de aguda maldad y alevosía. Su desconocimiento acerca de la pragmática contenía una soterrada pero feroz crítica a los colegas lingüistas que o bien tratan de teorizar la pragmática en su globalidad o bien estudian en más detalle alguna de sus múltiples facetas, como puede ser la tipología textual, la estilística, el discurso, los actos de habla, las estrategias de diálogo, la retórica y por supuesto toda la sociolingüística. Los generativistas siempre han mirado por encima del hombro a los pobres sociolingüistas.

Sus palabras fueron más o menos como sigue: "No sé nada de pragmática, y no me preocupa el hecho. Si han transcurrido tantos y tan intensos años de estudio y todavía sabemos tan poco de morfología o de sintaxis, que son dos áreas relativamente acotadas y abordables -una ceñida a las reglas de formación de palabras y la otra a la de oraciones- ¿cómo vamos a entender mínimamente la pragmática?"

Un huevo kinder por cada alumno. Cada uno esconde un precioso hecho lingüístico, una maravillosa proporción de lenguaje humano que hace al producto único en el mercado.

¿Qué debe decir la pragmática acerca de ese hecho lingüístico?


Los límites del formalismo

Podemos hablar de uno de los inventos mejores en lo referente a formalismos lingüísticos: las gramáticas de rasgos, restricciones o de unificación (Martin Kay). Pero prefiero empezar por los defectos, o los límites. Quizá luego no queráis saber más sobre las ventajas o virtudes.

En primer lugar es importante tener clara la distinción que yo escuche a Shieber entre teoría y formalismo. El formalismo propone un método, una técnica. La teoría puede usar el formalismo, potenciándolo, restringiéndolo, subliminándolo, o puede prescindir de él.

El simbolismo, la lógica simbólica ha aportado bases sólidas para recurrir a formalismos adecuados.

Las gramáticas de unificación sirven para resolver con eficacia la mayor parte de los problemas conocidos y bien descritos de morfología, sintaxis y semántica. La semántica parece complicada, pero en la "práctica" es casi lo más sencillo. Prolog es pura semántica.

El problema es más de pragmática, de sentido común, de conociemiento del mundo (Sag).

Los problemas comienzan cuando el formalismo topa con sus limitaciones:

Gestalt

Extracts from Mosterín 1973:

"La filosofía -decía Galileo (en Il Saggitario, 1963)- está escrita en ese grandísimo libro que continuamete está abierto ante nuestros ojos (a saber, el universo), pero no puede entenderse si antes no se procura entender su lenguaje y conocer los caracteres en que está escrito. Este libro está escrito en lenguaje matemático, y sus caracteres son triángulos, círculos, ...".

Para Galileo, la naturaleza es un libro escrito en lenguaje matemático. Como él mismo dice, si los hombres no la habían entendido hasta entonces es que "no conocían los caracteres en que estaba escrita". Pero la naturaleza no es un libro ni está escrita en lenguaje alguno. Lo que sí es un "libro" es una teoría física y ésta es la que puede estar escrita en lenguaje matemático.

El éxito de la física moderna que Galileo inaugura se debe -al menos en parte- a que, para hablar de la naturaleza, los físicos modernos dejan de hablar en el lenguaje metafísico en que habían hablado los antiguos y se ponen a hablar en un nuevo lenguaje: el lenguaje matemático.

Lo nuevo no es aquí -como la cita de Galileo parecería implicar- el conocimiento pasivo del lenguaje matemático, sino la aplicación activa de ese lenguaje a la descripción de la naturaleza.

A partir de Galileo, la ciencia deja de hablar del mundo en el lenguaje ordinario para pasar a hablar en el lenguaje de la matemática.

La ciencia física progresó rápidamente durante los siglos XVII, XVIII y XIX y el lenguaje matemático de la época de Galileo muy pronto se le hubiera quedado pequeño. Pero la matemática fue creciendo junto con la física, creando nuevos lenguajes matemáticos en los que formular las nuevas teorías físicas.

Al llegar el siglo XIX, los físicos disponían de una amplia gama de lenguajes matemáticos en que formular sus teorías, pero la estructura de estos lenguajes no estaba nada clara. La gran labor que se propusieron y en gran parte realizaron los matemáticos del siglo XIX fue la clarificación de esos lenguajes.

:26 Y la gran obra de Cantor fue la creación de un nuevo y extraordinariamente expresivo lenguaje: el lenguaje de los conjuntos, la teoría de los conjuntos. Resultaba que todos los otros lenguajes matemáticos eran traducibles al lenguaje conjuntista y que todos los otros conceptos matemáticos eran fácilmente definibles en este lenguaje. Con ello, la tarea de clarificar la estructura de los diversos lenguajes matemáticos de que disponía el físico se había convertido en la tarea de clarificar el lenguaje de la teoría de conjuntos.

Cantor creía haber descubierto los conjuntos que ya desde siempre estaban en el mundo. Pero en realidad no era un descubridor, sino un inventor. Lo que había hecho es inventar un nuevo modo de hablar.

Es una concepción ingenua la de que el mundo está dado de antemano, estructurado en cosas determinadas relacionadas entre sí de modo únivoco, y que el lenguaje viene después, reflejando con mayor o menor perfección la estructura de ese mundo.

Podemos aproximarnos al mundo con distintos lenguajes y habrá tantas estructuraciones distintas del mundo como lenguajes diferentes usemos para describirlo.

:34 La matemática se basa en una gran ilusión: en la ilusión de suponer acabado lo inacabable, ya terminado lo que no se puede terminar. Así se forman totalidades ilusorias, infinitos actuales que a su vez sirven de punto de partida a nuevos procesos semejantes, cada vez más alejados de la realidad.

Sin embargo, estas clases infinitas de las que nos hacemos la ilusión de que hablamos no existen en ningún sentido fuerte de la palabra existir. No están dadas en este mundo, ni pueden estarlo nunca. Postular otro mundo en que estén dadas es hacer mitología.

Las teorías matemáticas -en la medida en que hablen de algo- hablan unas de otras y encuentran sus modelos unas en otras. Y la posición central de la teoría de conjuntos entre ellas se debe a que todas las demás son en ella interpretables. En efecto, la relación semántica de satisfacibilidad de una teoría (algo lingüístico) en un modelo (algo extralingüístico) fácilmente puede ser substituida por la de interpretabilidad de una teoría en otra, adoptando la siguiente definición, adaptada de Tarski y Sxhonfield: [...]

:35 Esta noción de interpretabilidad de una teoría en otra cubre tanto la satisfacibilidad en modelos internos como en modelos externos.

Conclusión

A principios de siglo decía Russell que las matemáticas es una disciplina en la que no sabemos sobre lo que hablamos ni si lo que decimos es verdadero.

Hoy podríamos decir que al menos la teoría de conjuntos es una disciplina en la que sabemos que no hablamos acerca de nada y que lo que decimos no es verdadero ni falso.

¿Es esto una razón para dejar de hacer teoría de conjuntos, o, en general, para abandonar la matemática clásica, como piensan los intuicionistas?

Si el único sentido de una teoría o un lenguaje consistiese en decir verdades acerca del mundo, entonces, evidentemente, habría que abandonar la teoría de conjuntos.

Si, como dice Quine, el uso de variables cuantificadas en la teoría de conjuntos nos comprometiese "ontológicamente" a aceptar la existencia de esos fantasmas que son las totalidades infinitas actuales, y no creemos en ellos, también entonces tendríamos que abandonar la teoría de conjuntos, so pena de inconsecuencia.

Pero ni la única posible función de un lenguaje consiste en hablar acerca del mundo real ni los cuantificadores son amuletos mágicos cuyo uso nos compromete a vivir entre fantasmas.

En definitiva, la teoría de conjuntos es el foco central de ese universo lingüístico en expansión que constituyen las teorías matemáticas. La teoría de conjuntos ofrece un lenguaje común al que traducir los diversos lenguajes matemáticos y un arsenal de nociones y principios indispensables para el desarrollo de múltiples teorías formales.

Muchos de estos lenguajes, muchas de estas teorías -y otras que están aún por surgir- no han tenido hasta hoy aplicación alguna en la ciencia empírica. Pero otras teorías han encontrado interpretaciones empíricas fecundas y han servido para formular y desarrollar las ciencias de la naturaleza y de la sociedad.

En la medida en que el conocimiento y dominio del mundo real en que vivimos nos interese, nos interesarán también las teorías matemáticas que a través de su contribución a la ciencia empírica posibiliten ese conocimiento y ese dominio, y, por tanto, al menos indirectamente, nos interesará la teoría de conjuntos.

Extracts from Wilks 1976:

Richard Montague and Ludwig Wittgenstein represent views which are diametrically opposed on the key issue of formalization: of whether, and in what ways, formalisms to express the content of natural language (NL) should be constructed. "I shall argue, too, that the influence of Wittgenstein has been largely beneficial while that of Montague has been largely malign." The contrast between their views comes down to two issues:

  • Is there a hidden structure to NL?
    • Montague: Yes; clearly he belives there is a simple logic as the hidden structure of NL.
    • Wittgenstein: Yes, but not one to be revealed by simple techniques, like logic. (He refers to "deep grammatical structures", but it is not clear what exactly he ment for them).
  • Is NL itself and its use the final source of judgment or evidence?
    • Montague: No; his choice of examples, far from the concern of ordianry speakers ("Every man loves some woman") suggests that he is more concerd with logic and formal semantics than with NL "properly".
    • Wittgenstein: Yes. The different structures of "Every man loves some woman" in Predicate Calculus interest the logician, but the ordinary speaker rarely, if ever, sees that there is a "second interpretation" of the sentence.

Two very broad trends in the philosophy of language, as regards the role and importance of formalization can be distinguished:

  • One group of philosophers has been for it, and for as much of it as possible. (? Leibniz, Russell'25, Tarski'35, Carnap'37, Montague'70)
  • While the other group has been uncompromisigly against it. (? Popper'45, Wittgenstein'53, Hanson'58, Quine'60, Cohen'62, Dreyfus'72)

The "?" indicates a tentative list of philosophers

Leibniz, in the 17th century, believed that the formalism he proposed was the real structure of ordinary language (and, indeed, of the physical world), though without its awkward ambiguities, vaguenesses, and fallacies. In his most fantastic moments he envisaged the replacement of ordinary language by this "Universal Characteristic", to the general improvement of clarity and precision.

Whitehead and Russell's 1925 Principia Mathematica was a decisive contribution to the definition of propositional and general logic and the investigation of their properties. They were applied to the formalization of the notion of mathematical proof, but already Russel at least was setting out the ways in which this approach to logic was also, for him, a formalization of natural language. Like Leibniz, he wished to clear away what he thought of as the confusions of ordinary language. He was much concerned with the grammatical similarity of sentences like "Tigers are existent" and "Tigers are fierce" and how, in this view, this similarity had led philosophers into the error of thinking that tigers therefore had a property of existence as well as one of fierceness.

Wittgenstein was closely associated with Russell during the period between 1910 and 1920, and was developing what is now thought of as his early philosophy. This was set out in a curious early work called the Tractatus Logico-Philosophicus (1922) where he proposed what is now called the "picture theory of truth", according to which sentences in ordinary language signify or mean because their structures reflect or exhibit the same relation as that which holds between the things mentioned by the sentences. His theory of meaning at this point was more obscure than that of Russell, or Russell's predecessor, Frege.

Frege, in the late 19th century, had proposed a "dualist" theory of meaning in which each word signified in two ways (his famous example of "the Morning Star" and "the Evening Star"):

  1. One way (Bedeutung), referred to some entity, or REFERENT (i.e. Venus)
  2. The other (Sinn) referred to the "sense" of the word. The two phrases of the example mean something different in that they have different SENSES.

These meaning theories are referential, even when they talk of "sense". For, whatever the status or nature of the thing that is "the meaning", it is an entity that is somehow pointed at by the word. In Frege's case the word points in two different ways to two quite different sorts of entity, whereas in Wittgenstein more obscure "picture theory" there was only one kind of pointing.

[The truth of expressions can be established by truth tables and is demostrated as semantic. This is different from the method referred as proof theoretic (that comes from the sequential relation of structures in a proof)]. The word "semantic" is so troublesome that it cannot be introduced into the discussion without a word of warning, because on its ambiguities rests much of the difficulty of our whole subject.[...] It will be written as "L-semantic" when used in connection with formal logic.

Formal logic of the Twenties rests in two fundamental ideas, namely:

  1. Significant combination
  2. L-semantic demostration

Montague and Wittgenstein represent respectively a reaction to, and a extension of that logic. In the hands of Tarski'35 and Carnap'37 the above concepts took on new names and properties:

  1. Significant combination
  2. Logical syntax (replacing "L-semantic demonstration")
  3. Meta-language

Carnap in his "Logical Syntax of Language" developed the notion of ill formed expression (as "Mortality is Socrates"). Carnap distinguished: (Chomsky was many years later a student of Carnap)

  • Rules of formation: determined what were, and were not, well formed expressions in the logical language. Thus, in the Propositional Calculus, (P IMPLIES (OR Q)) was not, while (P OR Q) was a well formed expression.
  • Rules of transformation: operated on those well formed expressions that were also thrue so as to produce theorems in logic.

Carnap was a formalizer in the Leibnizian sense since, to him, these distinctios applied equally well to proper formalization of natural language.

The distinction of language and meta-language was due to Tarski who proposed it to solve an apparently intractable problem of logic that he had inherited from Russell, who had discovered certain logical paradoxes. Tarski's statement of the problem of the paradoxes was usually in terms of the example:

The sentence in this rectangle is false

where any attempts to assign a truth-value to the sentence led to trouble. Tarski thought that this problem would be solved if we only used "true" in a meta-language and never in an object -language. Thus "That John is happy is true" would be a sentence with level confusion, for the proper name would be the meta-language sentence "'John is happy' is true", where the sentence "John is happy" is mentioned in the meta-language, but not used in it.

[Truth theory of meaning: 212]

Tarski's fundamental achievement was a theory of truth and logical consequence for formalized languages (a L-semantic theory).

Montague extended it to sentences in natural languages: a system in which the truth conditions of complex statements could be seen to be composed from the truth conditions of simple ones. Making even stronger claims than Tarski's, because Tarski did not think that such a theory could be constructed for a natural, non-formal, language. Otherwise the object-language and the meta-language would be the same, and Tarski thought that was bound to lead to trouble.

Wilks'76 and others in linguistics and AI do not share the assumption that the stating of truth conditions is explaining the meaning of a sentence. Those in the Tarskian tradition are highly critical of much work in linguistics and AI because meanings are not stated in that way, and it is an interesting open question whether AI work on NL could be so stated in general. Wilks does not criticize formal analysis of NL as such. What is being opposed is pointless formalizations of NL [such as Montague's], and it is suggested that Wittgenstein is on of the few philosophers who can provide insights into what a fruitful approach to NL migh be.

Logical positivists also had a thesis about the dependence of meaning on truth but should not be confused with the "truth-condition" approach followed by Tarski. Their principle was called the Principle of Verification, and it said "The meaning of a statement is the procedures we would carry out to establish its truth of falsehood". However wrong this principle might be (and it is wrong), it was at least serious, in a way that the modern truth condition approach is not.

Blackburn'9? (for one in a large school of logicians) holds general principles concerning the applicability of Tarski-like theories to NL. The thesis that they share is that of the "truth theory of meaning": namely that the meaning of a sentence is determined by its truth conditions, in the Tarskian sense of that phrase. It would be quite possible to reject Montague's detailed "Semantics for NL" and still accept the general tenents of the school about meaning and truth, namely that truth conditions determine the meaning of the senteces of NL in just the way they can be said to do so for the sentences of logic and methematics.

Dreyfus, a full-time opponent of the very possibility of AI, has made much use of Wittgenstein's arguments against formal logic in his own arguments against AI. However, the general structure of this chapter is that AI has real philosophical importance because it has completely changed the old debate between formalists and anti-formalists. For to handle language "formally" on a computer it is in no way necessary to accept the tenets of Tarski, Montague or any other approach based on formal logic. On the contrary, the most fruitful approaches to understanding natural language are precisely those not subservient to a powerful logical or L-semantic theory.

AI has provided a sense to the notion of the precise manipulation of language that is not necessarily open to the attacks of the anti-formalists like Wittgenstein. And a large part of the credit for breaking the old formalist/anti-formalist opposition in a new way must go to Chomsky.

Chomsky's theory of grammar is a precise theory of language: it has the form of a logic, but not the content. Chomsky took the structure of proof-theoretic (what Carnap called transformation rules), namely the repeated derivation of structures from other structures by means of rules of inference, but he let its content be no more than what Carnap had meant by Formation Rules, namely the separation of the well-formed from the ill-formed. Thus, in transformational grammar the inference (transformational) rules were to apply to axioms and theorems, but to produce not new theorems but well-formed English sentences.

Thus, Chomsky has a precise system of handling language, but with no semantic definition of truth, and not even a syntactic, proof-theoretic one either. Thus, Chomsky's was the first concrete proposal to breach the wall between formal and anti-formal approaches.

AI has gone further, and indeed Chomsky's paradigm still shares many of the drawbacks to formal approaches: in particular the rigid "derivational" structure common to logical proofs and to Chomskyan transformational derivations.

[ Wittgenstein'58 ]

  1. Reference. Thesis: words do not in general have meaning in virtue of pointing at objects in the real world (or "conceptual objects" either). We could have a language based on the referential notion, but it would be a language more primitive than what we call NL.
  2. Mini languages and language games. Thesis: we can construct mini-languages obeying any rules we like, and we can think of them as games. The important question is whether these games are sufficiently like the "whole game" of NL.
  3. Family resemblances and boundaries. Thesis: the conventional notion of concept is wrong: namely the view that a concept relates in some way to the qualities or characteristics that all things falling under the concept have. There are not firm boundaries to concepts, nor are there to linguistic usage, nor to the application of linguistic rules.
  4. The linguistic whole and confronting the world. Thesis: a language is a whole and does not confront the world sentence by sentence for the testing of the truth or falsity of each individual part.
  5. Logicians have a false picture of how language is. Thesis: logicians think that language is like their favorite calculus, but they are quite wrong. Moreover, it is language itself and its use that is the standard for testing disputes that arise, not what logicians dictate.
  6. Understanding is not a feeling. Thesis: we have the idea that "understanding" something involves, or is associated with, a special feeling of being right. But the tests of our being right are quite different from the feeling.
  7. Application justifies our structure. Thesis: the significance of a representational structure cannot be divorced from the process of its application to actual language.
  8. Real world knowledge and forms of life. Thesis: language understanding is not independent of very general inductive truths about our human experience

PATR-II

The feature constraints associated with phrase structure rules in PC-PATR consist of a set of unification expressions. Each expression has three parts, in this order:
  1. a feature path, the first element of which is one of the symbols from the phrase structure rule
  2. an equal sign (=)
  3. either a simple value, or another feature path that also starts with a symbol from the phrase structure rule
As an example, consider the following PC-PATR rules:
Rule  S -> NP VP (SubCl)
        <NP head agr>  = <VP head agr>
        <NP head case> = NOM
        <S subj> = <NP>
        <S pred> = <VP>

Rule  NP -> {(Det) (AdjP) N (PrepP)} / PR
        <Det head number> = <N head number>
        <NP head> = <N head>
        <NP head> = <PR head>

Rule  Det -> DT / PR
        <PR head case> = GEN
        <Det head> = <DT head>
        <Det head> = <PR head>

PC-PATR output with feature structure:

Rule  VP -> VerbalP (NP / AdjP) (AdvP)
        <NP head case>   = ACC
        <NP head verbal> = -
        <VP head> = <VerbalP head>

Rule  VerbalP -> V
        <V head finite> = +
        <VerbalP head>  = <V head>

Rule  VerbalP -> AuxP V
        <V head finite> = -
        <VerbalP head>  = <AuxP head>

Rule  AuxP -> AUX (AuxP_1)
        <AuxP head> = <AUX head>


Rule  PrepP -> PP NP
        <NP head case> = ACC
        <PrepP head> = <PP head>

Rule  AdjP -> (AV) AJ (AdjP_1)

Rule  AdvP -> {AV / PrepP} (AdvP_1)

Rule  SubCl -> CJ S
1:
                S 
      __________|__________
     NP                  VP 
   ___|____      _________|__________
  Det     N   VerbalP  NP         AdvP 
   |     man     |      |           |
  DT             V     PR         PrepP 
  the           saw    us      _____|______
                              PP         NP 

                             with     ____|_____
                                     Det       N 
                                      |    telescope 
                                     DT 
                                      a 

1 parse found
[ cat:   S
  pred:    [ cat:   VP
             head:    [ agr:   $1[ 3sg:   + ]
                        finite:+
                        pos:   V
                        tense: PAST
                        vform: ED ] ]
  subj:    [ cat:   NP
             head:    [ agr:   $1
                        case:  NOM
                        number:SG
                        pos:   N
                        proper:-
                        verbal:- ] ] ]