CITAS Y NOTAS EN DOCUMENTOS HTML:
UNA PROPUESTA DE ORGANIZACIÓN Y ACCESO(*)


Bonifacio Martín Galán
Eva Mª Méndez Rodríguez
Universidad Carlos III de Madrid


Resumen :

Abstract :

  1. Introducción.
  2. Publicaciones científicas en Internet y la estructura de su aparato crítico.
  3. Propuesta de una estructuración de la descripción bibliográfica en documentos web: el uso de frames.
  4. Conclusiones.


1. Introducción

Durante los últimos siglos, el documento impreso en papel fue el medio transmisor por excelencia de la información, de la cultura y del saber, para las civilizaciones que habían desarrollado la escritura. El lenguaje, oral y escrito, ha sido y es, por otra parte, el útil universal con el que la humanidad domina la realidad y transmite su experiencia. Hasta hace relativamente pocos años, las formas de difusión del conocimiento han sido puramente impresas o manuscritas -en el caso de ser escritas- u orales, y el trabajo científico se basaba en fuentes de este tipo, que se plasmaba igualmente, de forma impresa, en papel : en átomos. Pero en los últimos tiempos, estamos asistiendo a una cambio sustancial en la forma de difusión del conocimiento que afecta a la propia metodología de investigación y en la construcción de ciencia, lo que podríamos llamar, con una impronta un tanto futurista, una mutación de la Galaxia Gutemberg a la Galaxia Web, propiciada por el desarrollo de las nuevas tecnologías y de las telecomunicaciones. Internet, en este contexto, tiene un enorme potencial de difusión y desarrollo de la comunicación y del conocimiento humanos. Así como el libro fue la herramienta decisiva del Renacimiento, nos aventuramos a pronosticar que Internet lo será del cambio de era en que estamos inmersos.

De esta forma, y teniendo en cuenta que la Organización del Conocimiento, como disciplina integradora de todas las ciencias documentales, se ocupa, entre otras cosas, del estudio de los recursos e instrumentos que se utilizan para extraer y describir la información de los documentos, para facilitar una recuperación eficaz de dicha información, parece el contexto adecuado para reflexionar sobre las nuevas formas de producción de conocimiento y de la nueva estructuración de la información. Nos estamos refiriendo, sin duda, a los documentos electrónicos, concretamente a las, cada vez más numerosas, publicaciones en Internet, que suponen un nuevo reto para el documentalista comprometido con los modos de información de su tiempo, tanto desde el punto de vista de la organización de la información en estas publicaciones, como de su posterior recuperación y estudio.

La presente comunicación trata de analizar, no tanto el problema de la elaboración de referencias bibliográficas a documentos electrónicos, para la cual proliferan diversas recomendaciones, lejos de llegar a constituir una norma homogénea 1 , sino desde la perspectiva de su organización y estructuración en el caso de que dichas referencias formen parte del aparato crítico del artículo de una revista o libro electrónico en Internet. Se trata simplemente de profundizar con ello, en la labor del documentalista, quien no conforme con la ardua tarea de la recuperación de información, aspira a proponer modelos estructurales que faciliten la organización del conocimiento en las publicaciones científicas que proliferan en la Web, apostando así mismo por una normalización en la disposición formal de las mismas basada en las propias aptitudes del lenguaje HTML en el que se elaboran dichos documentos electrónicos.


2. Publicaciones científicas en Internet y la estructuración de su aparato crítico.

La elaboración de citas notas, es uno de los elementos que distingue una publicación especializada de una mera obra de divulgación o de opinión, y que ayuda, por otra parte, a poner de manifiesto el método científico, caracterizado por la ambición de exactitud y la formulación de hipótesis. El hecho de que el formato elegido para la transmisión del conocimiento científico, sea un documento hipertextual publicado en Internet, no es óbice para que se consigne un aparato crítico que emule a las posibilidades de estructuración adoptadas para el medio impreso. En este sentido se analiza aquí, desde la teoría más tradicional del hipertexto (Vannevar Bush 2), su triple dimensión que lo convierte en una herramienta perfecta para la expresión del conocimiento científico :

  1. Desde el punto de vista psico-cognitivo : en tanto que el hipertexto facilita la asociación de ideas a que tiende la mente humana y la posibilidad, no sólo de describir la fuente que se cita, sino de acceder directamente a ella, si se trata de un documento electrónico.
  2. Desde el punto de vista documental : teniendo en cuenta que atiende a los problemas de la organización y recuperación de la información. Como recoge Izquierdo3, Bush se pronuncia en este sentido, diciendo que la manipulación de ideas y su inserción en un registro "lleva consigo todo el proceso mediante el cual el hombre se beneficia de su herencia de conocimientos adquiridos", por ello las publicaciones científicas en formato hipertextual son especialmente adecuadas para consignar esa "herencia de conocimiento" a través de una red de hiperenlaces que permitan concatenar el discurso lógico-documental.
  3. La tercera dimensión del hipertexto, es la puramente tecnológica : en este caso, el desarrollo de hipertextos es posible, gracias al desarrollo de la tecnología de red, que permite mantener sistemas de conocimiento hipertextual distribuidos, y el propio lenguaje html, que son los alegatos técnicos que nos permiten, la tan manida ya, "navegación" por Internet.

De cualquier forma, el problema de cómo describir y organizar el aparato bibliográfico en documentos científicos se ve agravado en gran medida cuando lo que se está elaborando es un documento electrónico hipertextual. El conflicto aparece por la propia concepción y filosofía del hipertexto, ya que modifica ampliamente el modo de consulta y lectura de los documentos: en el propio documento se establecen relaciones o enlaces a otras partes del documento y, lo que es más importante, a otros documentos electrónicos que pueden ser consultados en ese mismo momento4. Este modo de consulta puede provocar, y de hecho provoca en muchas casos, una hipernavegación, que suele traer consigo una pérdida del hilo conductor del documento original y que el propio lector se convierta, en muchos casos en autor al contar con las fuentes que puede interpretar. Por otra parte, no podemos eludir que, como dice Landow 5"todavía seguimos leyendo de acuerdo con la tecnología de la impresión y seguimos orientando hacia la publicación impresa todo lo que escribimos", a lo que podemos añadir, que toda la estructuración de las páginas web respeta no sólo la metáfora del libro impreso, sino también su terminología : pensemos por ejemplo en conceptos como "página" "libro", "titulo", que suelen enriquecerse con matices propios del entorno de la Red, dando lugar a términos como : página "web", libro "electrónico", título "de la pagina web" ...etc. Siendo este enriquecimiento de matices a la terminología, lo que es el enriquecimiento del hipertexto al documento textual tradicional.

Por todo ello se puede debatir, y se debate, a la hora de estructurar publicaciones científicas en Internet, sobre la equiparación entre un enlace hipertextual y una referencia bibliográfica, y por tanto, la conveniencia de mantener la estructura formal habitual en los documentos hipertextuales que supla a las referencias bibliográficas per se, o por el contrario, tratar de mantener la estructura y el sistema tradicional de los documentos impresos, consignando citas, notas y referencias bibliográficas, también en los artículos científicos publicados en la Web.

En la actualidad nos encontramos con un gran número de casos, no pocas veces pintorescos, para solucionar este problema. Por ejemplo, si nos ceñimos al campo de las revistas electrónicas de carácter científico, podemos comprobar que existe una mayor homogeneidad a la hora de resolver este problema pero, en ningún caso se contempla en sus normas para la aceptación de originales, el nuevo medio en el que van a ser editados. La mayoría de ellas han optado por trasladar las pautas o directrices de redacción de originales aplicadas en las revistas impresas en papel a las nuevas revistas electrónicas sin hacer ningún tipo de adaptación al nuevo contexto en el que se editan (la web). Así, es normal encontrarse un apartado de Directrices para los autores (el correspondiente Author Guidelines6) en el que se establece la forma en la que se deben realizar las citas y cómo se han de redactar las correspondientes referencias bibliográficas. Unas apostarán por el sistema europeo de cita-nota y otras por el modelo Harvard de autor-fecha, con su correspondiente apartado bibliográfico final en el que se desarrollan todas las referencias bibliográficas de los documentos citados. probablemente, porque se siguen aceptando originales manuscritos, en los que para nada, se estiman las posibilidades del hipertexto

De este modo, el indicador de existencia de una cita (el superíndice numérico o la consignación entre paréntesis del autor, fecha y página en el sistema Harvard) queda reflejado como un enlace hipertextual que remite a la referencia bibliográfica correspondiente, situadas todas ellas al final del documento electrónico. Y es desde aquí desde donde se produce el salto al documento electrónico remoto nombrado (generalmente el enlace hipertextual se sitúa en el elemento que identifica el URL del documento). La cuestión se complica aún más si, en un alarde de aprovechamiento del hipertexto que protagoniza las páginas web, asociamos enlaces y referencias a páginas no consideradas como documentos científicos de autor, o con notas aclaratorias. Observamos, por tanto, que en estos documentos el salto al documento referenciado requiere de dos pasos : el primero iría del indicativo de cita al apartado de referencias bibliográficas, y el segundo de la referencia en cuestión al documento electrónico referenciado. Este hecho no parece muy sensato desde la lógica del hipertexto ; aunque bien es cierto que el concepto de edición tradicional hace que en algunos casos ni siquiera se realicen los enlaces a tales páginas de referencia, y se consignen, como si de una publicación impresa se tratara, en texto plano.

Existe una postura radicalmente contraria que establece que todo enlace hipertextual puede ser considerado como una referencia bibliográfica en sí misma. Por ello no existe una llamada de cita (aunque sí puede existir una llamada de nota explicativa con su correspondiente apartado de notas), sino que directamente se crea un enlace externo al recurso referenciado. Este hecho se argumenta con la idea de que en este nuevo modelo ya no es necesario crear una referencia bibliográfica al documento electrónico pues lo tenemos a nuestro alcance en cualquier momento. En este caso, aunque se hace un uso más coherente con la lógica del hipertexto, fuerza en cierto modo la redacción del artículo pues es necesario incorporar a la misma algún elemento o palabra que identifique al autor, institución, tipo de documento, etc., que sirva de término de enlace al documento citado.

Aclarar también un matiz que tiene una cierta importancia en este tema : la inexistencia del concepto de paginación en los documentos hipertextuales. Como ya dijimos anteriormente la idea de "página" propiamente dicha, deja de existir en estos nuevos documentos, por ello no podemos contar de forma directa con un pie de página en el cual situar nuestras notas y/o referencias bibliográficas. Todos estos datos deberán ir al final del documento o en una "página" distinta, pero relacionada con la de partida. Esto provoca inexorablemente que se interrumpa la lectura del documento de forma drástica si deseamos consultar dicha nota o referencia bibliográfica.

Un último aspecto a tener en cuenta en todo este asunto es la orientación que están tomando los nuevos trabajos bibliométricos al analizar las referencias bibliográficas de los artículos científicos existentes en la web. Si no se distingue claramente lo que son meros enlaces o punteros a páginas no consideradas como artículos (por ejemplo, que aparezca una institución en el texto a la cual el autor ha creído conveniente crear un enlace) de las consideradas como "documentos de autor", la labor de revisión bibliográfica, automática o manual, se verá seriamente dificultada o falseada.

3. Propuesta de una estructuración de la descripción bibliográfica en documentos web : el uso de frames.

Como ya se ha expuesto aquí, la lógica y el esquema de funcionamiento del hipertexto conlleva una serie de cambios en la redacción y consulta de documentos electrónicos. La gran aportación del lenguaje de marcas HTML viene dada por la transformación del concepto de "documento" por el de "metadocumento7", es decir, la transformación de un corpus textual único en un corpus compuesto por múltiples elementos (texto, sonido, imagen fija, imagen en movimiento, otros documentos, etc.) relacionados entre sí. Toda esta potencialidad debe ser aprovechada en beneficio del lector y de la generación de nuevo conocimiento por parte del mismo.

Si consideramos que la descripción bibliográfica es un elemento indispensable en todo documento científico al orientar al lector hacia nuevas lecturas -al margen de su función principal de remisión al autor o fuente de la cual se ha extraído parte del conocimiento contenido en ese documento-, es lógico suponer que este elemento debería resultar igualmente imprescindible en este tipo especial de documentos electrónicos, máxime si asumimos la percepción de la lectura desde los conceptos emanados del libro impreso. La dificultad para llevar a cabo esta idea en los documentos hipertextuales basados en el marcado del texto es debida a que las actuales versiones del lenguaje HTML no brindan los suficientes elementos para poder realizar de forma clara y precisa dicha labor de descripción bibliográfica por parte del autor. De hecho, el último estándar de este lenguaje (HTML 3.2) nos permite utilizar etiquetas como <BLOCKQUOTE> o <CITE> para inidicar que el texto contenido dentro ha de ser destacado debido a que ha sido recogido de otras fuentes. Pero estas indicaciones son meramente formales, esto es, el texto contenido dentro de ellos será visualizado e interpretado por el browser como elementos que han sido destacados por el autor (por ejemplo, el texto contenido dentro del elemento <CITE> será visualizado con letra cursiva). Y, dado que estos elementos no admiten ningún tipo de atributos, no nos es posible ajustar con mayor provecho dichas etiquetas a la necesidad de describir bibliográficamente las recursos utilizados para la elaboración del documento electrónico.

Consiederando todo lo anteriormente expuesto , el problema de la ubicación de las notas y las referencias bibliográficas al final del texto en los documentos electrónicos de carácter científico , podría resolverse de forma sencilla haciendo uso de ciertas capacidades que los programas visualizadores de este tipo de documentos vienen implementando desde hace ya algún tiempo: contamos con la posibilidad de dividir la pantalla de visualización del documento en diversas ventanas o marcos, conocidas como frames (Vid. figura 1). De este modo dispondríamos en la parte superior de la pantalla del visualizador de una ventana principal, en la cual se colocaría el corpus del documento con sus correspondientes llamadas de citas y notas, y en la parte inferior de la pantalla quedaría una ventana horizontal en la cual irían apareciendo las referencias bibliográficas (con sus enlaces hipertextuales al documento externo referenciado, si procede) o las notas correspondientes, según se las invocase desde el enlace creado en el corpus principal en cada una de las llamadas. De este modo tendríamos presente en todo momento el texto del documento junto a las notas y las referencias bibliográficas. Este método permite además desplazarnos por el contenido de cada uno de estos frames de forma independiente, siendo también posible variar el tamaño de cada uno de ellos al gusto o necesidad del usuario.

Fig. 1Fig.1

La generación de este tipo frames en documentos HTML obliga a definir previamente tres elementos imprescindibles:

  1. Documento de definición de los frames: en este documento se define en cuántas zonas se va a dividir la pantalla, las características, distribución y tamaño de las mismas, y el enlace correspondiente a los documentos que integrarán cada una de esos marcos (también se puede incluir una opción alternativa a la visualización del documento si el programa navegador no soporta el uso de frames).
  2. Documento del contenido del primer frame: en él se incluiría el corpus principal del documento en cuestion, con los distintos enlaces hipertextuales a los documentos externos y/o a las marcas que identificarán a cada una de las notas y referencias bibliográficas contenidas en el siguiente docuemento.
  3. Documento del contenido del segundo frame: es en este documento donde se insertarán cada una de las notas y/o referencias bibliográficas (con sus correspondientes marcas y enlaces externos) que han sido contempladas a la hora de redactar el documento en cuestión.

La representación gráfica del modelo propuesto sería la siguiente:

Fig.2Fig.2

Cierto es que en la actualidad el estándar en vigor para la creación de documentos hipertextuales (HTML versión 3.2) no establece el uso de frames en dichos documentos, aunque esta opción viene siendo soportada desde hace cierto tiempo, como decíamos anteriormente, por los principales programas visualizadores. De hecho el World Wide Web Consortium (W3C),organismo internacional encargado del establecimiento de los diversos estándares que rigen la WWW, está en la actualidad trabajando en la nueva versión de este lenguaje de marcas (HTML 4.0), el cual incluirá la implementación de este elemento.

Tal vez el aspecto más problemático de esta estructura sea la disminución del área de visualización del propio documento. Al hacer uso de los frames la zona designada por el programa navegador para la lectura del documento principal se ve notablemente reducida. Una posible solución estaría en la eliminación de ciertos elementos del programa; por ejemplo, en Netscape Navigator, al igual que en otros browsers, es posible configurar la aplicación para que no muestre barras poco significativas, como puede ser la Barra de Directorio.

El modelo aquí propuesto facilita la visualización de los recursos electrónicos externos referenciados en el área de notas en el propio frame creado a tal efecto. Este hecho permite la vieja aspiración de todo lector de documentos científicos a la hora de leer el documento original y al mismo tiempo consultar los documentos (electrónicos, en este caso) vitales para el discurso narrativo de dicho texto.

Además, el entorno gráfico en que se crean los documentos hipertextuales en la Web da cabida a la originalidad, siendo posible incluir dentro del texto como distintivo de la llamada algún símbolo descriptivo o pequeño dibujo que diferencie las referencias bibliográficas (por ejemplo, un pequeño libro : &) de las aclaraciones marginales que decidamos incluir en nota para no romper el discurso del texto (identificadas, por ejemplo, con una mano con el dedo índice extendido : F)

Como última recomendación de nuestra propuesta, creemos también que sólo se deben realizar referencias bibliográficas a documentos electrónicos de los cuales se ha extraído información o ideas básicas contenidas en el texto de los mismos. Otros elementos o lugares que se mencionen en el documento que se está elaborando (y que tengan ubicación directa en Internet), por el mero hecho de erudición o enriquecimiento del discurso narrativo, consideramos lógico que se cree un enlace externo o link directo a dicho recurso sin tener, consiguientemente, que ser descrito en el aparato crítico. Pero, y siguiendo la misma filosofía referente a la contextualización en la visualización del documento referenciado, la información contenida en dichos recursos deberían igualmente ser visibles en el frame inferior.

Somos conscientes,por otro lado, que esta propuesta de redacción de documentos electrónicos hipertextuales de contenido científico supone una cierta complejidad añadida (creación de tres documentos hipertextuales relacionados entre sí), pero este proceso de creación se simplifica notablemente al existir hoy en día un gran número de programas editores de páginas HTML capaces de trabajar cómodamente con frames8.

Con el establecimiento de esta organización del conocimiento científico en los documentos hipertextuales se lograría preseverar la estructura lógica y física de su homólogo en papel. Al crear un área de notas en un espacio independiente al de ubicación del texto principal del documento, pero íntimamente relacionado con éste a través de los hiperenlaces entre el símbolo de llamada y su correspondiente referencia, el lector podría elegir ahora entre : la "hiperlectura" (en que el recorrido y la selección de enlaces la determina el propio lector) que proporciona los últimos desarrollos del hipertexto, o bien la lectura lineal o secuencial que le facilitara antes la tecnología de la imprenta. Con todo ello es posible conseguir mantener de alguna forma lo que muchos ya vienen llamando "la metáfora del libro 9", facilitando el esfuerzo y adaptación que conlleva el impacto de la aparición de nuevas tecnologías.

4. Conclusiones


Con todo lo señalado en esta comunicación, podemos concluir que :

Esta sencilla propuesta estructural para la distribución de las citas y referencias en los documentos electrónicos de Internet plantea una alternativa interesante para la Organización del Conocimiento en la web, concretamente de las publicaciones científicas caracterizadas por un sólido aparato crítico y bibliográfico, cuya consignación en una estructura visual tradicional, se posibilita desde el propio lenguaje de marcas (HTML) en que están constituidos estos documentos. Según hemos explicado, se trata de una pequeña solución que juega con las posibilidades existentes en la actualidad en los principales programas navegadores (y en un futuro inmediato el propio estándar HTML). Pero, sin duda, y a tenor de los argumentos que se han ido exponiendo en toda la comunicación, podría plantearse la necesidad de definir nuevas etiquetas (tag) que simplifiquen la publicación de documentos científicos en Internet y la elaboración de sus correspondientes referencias.

El modelo propuesto para la descripción, responde a la necesidad que impera en los "nuevos medios" de establecer "nuevas soluciones". Y, como hemos expresado en el párrafo anterior, estas nuevas soluciones deberían ser proporcionadas por el "nuevo lenguaje" HTML (HiperText Make-up Language), ofreciéndonos la posibilidad de respetar la metáfora del documento impreso en cuanto a la presentación, junto con el aprovechamiento de la estructura hipertextual. Esta simbiosis permitiría, a través de los links y los frames, consultar la fuente original de los documentos electónicos citados de este modelo, sin perder el hilo conductor de la lectura.

A pesar de ser un modelo simple, la complejidad vendría, no por el lado de la estructuración visual y realización técnica, que como hemos señalado es hoy en día fácilmente superable con las nuevas herramientas de edición electrónica, sino de la propia redacción de las referencias a otros documentos electrónicos, al no existir un estándar universalmente válido. Existen consejos, recomendaciones... que alimentan el debate sobre este tema, pero aportan soluciones mínimas lejos de ser preceptivas. En la mayoría de los estilos consagrados internacionalmente se puede ver una tímida y forzada adaptación de los elementos utilizados para la referencia de documentos en papel. Sin embargo, opinamos que el papel, el documento impreso, y cómo se referencia, no es más que un punto de mira, una pista elocuente par adaptar el sistema a los documentos electrónicos, pero nunca un baluarte para la normalización. Éste es quizás un aspecto que exige una revisión más profunda y seria. Ya que toda propuesta de organización del conocimiento, por más que sea formal, no tiene demasiado sentido si no es soportada por estándares básicos que permitan homogeneizar, a posteriori, la recuperación.

En cualquier caso, con este trabajo no pretendemos pecar de futurismo, sino sumarnos a los cambios y propuestas de estilo en la edición electrónica ya asumidos en el presente. Por ello toda la reflexión planteada en esta comunicación, es fruto de un momento (1997) y de una necesidad surgida a tenor de la difusión de información científica en formato electrónico. Lo que es evidente que el devenir de los tiempos y el constante desarrollo que experimentan las tecnologías de la información y de la documentación, nos llevará a revisar y completar este trabajo, incluso a modificarlo, si la tecnología una vez más, continúa cambiando nuestros hábitos de investigación, y por ende( y siempre desde el punto de vista de la Documentación), los hábitos de la recuperación de información.