LENGUA INGLESA Y NUEVAS TECNOLOGIAS

REPORT  C

SISTEMAS DE BÚSQUEDA Y RECUPERACIÓN EN  INTERNET : Motores de búsqeda

 

1.Introducción

 

Con el gran desarrollo de Internet ha sido necesaria la creación de herramientas que ayuden a la recuperación organizada de la información. Sin embargo, en la actualidad son muchas las herramientas que han aparecido y por lo tanto se hace más difícil seleccionar cuales son aquellas que se adecuan mejor a las necesidades de recuperación de información de cada persona.Tanto los motores de búsqueda de primera y segunda generación, así como los directorios temáticos tienen todos su propio algoritmo de búsqueda y generan diferentes respuestas. No se dispone de procedimientos de búsqueda uniformes o normalizados, por lo cual es imposible brindar respuestas a una solicitud de búsqueda con las mismas estrategias. Así, la tarea de buscar implica también encontrar el motor de búsqueda más satisfactorio o combinar varios. Los sistemas de recuperación de información por Internet poseen una gran flexibilidad en el tratamiento de los datos y la multiplicidad de productores determinan una gran redundancia y a la vez una dispersión de la información distribuida; cada buscador indiza solo una parte del universo que contiene Internet. Además, existe una gran diversidad de soportes que causan una gran heterogeneidad en la estructura de los documentos (videos, gráficos, multimedia, etc.), mucha información en Internet está caracterizada por el dinamismo y la volatilidad. El dinamismo se refiere a los continuos cambios de contenido de muchos de los documentos de Internet y la volatilidad, a los cambios de destino de un mismo documento.

 

2. ¿Qué papel cumplen las herramientas de búsqueda?

 

         Lo primero es comprender lo que se entiende por Internet y lo que realmente es Internet. Hace solo 10 años apareció la Web, una Internet gráfica que es lo que las personas comúnmente consideran que es Internet. Existe otra parte en formato de texto, que parece que se ha dejado de lado. Sin embargo, los grandes bancos de datos existentes están enfocados al formato texto y no parece que se vayan a convertir a formato gráfico.

Si juntamos estos dos mundos, ellos componen todo Internet. Si solo se busca en la Web utilizando los diferentes buscadores, vamos a encontrar solo una parte de lo que podríamos utilizar. Además, debemos tener en cuenta que existe información de acceso público y de acceso privado. Por eso, cuando se realiza una búsqueda, hay que saber donde se va a buscar y a donde accede la herramienta de búsqueda que se va a utilizar. Como existen estos dos mundos, uno claramente disponible y el otro más bien oculto, la herramienta de búsqueda que uno utilice para entrar a ellos debe ser la apropiada.

Cuando nació Internet, la información se encontraba disponible en forma gratuita a disposición de todo el mundo. Pero con la necesidad de monetizar el uso de Internet, para conseguir recursos financieros por medio de la información que por este medio se provee, empezaron a surgir bloqueos al acceso de esta.

Incluso hay buscadores que exigen un pago para ingresar a los datos que producen como es el caso de Northern Light. Igualmente, hay que considerar la calidad de la que se consigue, existe mucha de manera gratuita de tipo comercial así como resultados de investigaciones sobre productos y tendencias de mercado (White Papers). Sin embargo, mucha y muy relevante como la necesaria para adelantar una investigación, requiere el pago de sumas altas que en ocasiones superan los 5.000 dólares, como es el caso de los estudios de mercado.

Tampoco podemos desconocer que cerca del 70% de los accesos que recibe un sitio en Internet se realizan por medio de motores de búsqueda y muchos de ellos exigen un pago para indexar un sitio en su base de datos. Afortunadamente existen lugares en la Web como dmoz que se han dado a la tarea de indexar sitios para ponerlos a disposición de los motores de búsqueda. Esta indexación la realizan personas que aplican los mejores criterios para que estos datos puedan ser localizados efectiva y pertinentemente.

 

3. ¿Cómo se puede reconocer la herramienta de búsqueda más conveniente?

 

         Hay básicamente dos tipos de herramientas de búsqueda en Internet. La primera son los directorios temáticos, que van de lo general a lo particular atendiendo la clasificación de quién armó el directorio. Por ejemplo, se puede encontrar una gran categoría que se llame "Tecnología", de allí bajar a una subcategoría "Software" y seguir bajando dentro de esa estructura de árbol, hasta llegar a lo que se está buscando. Esta herramienta es muy útil cuando se conoce muy poco del tema a investigar o cuando no se sabe como esta clasificada la información en Internet. Se empieza por indagar sobre un tema en un directorio, luego se analiza la información para descubrir en que forma esta almacenada la que necesita y de esta manera afinar mejor la búsqueda.La segunda, son los motores de búsqueda, herramientas que indagan dentro de unos índices, que arrojan con criterio arbitrario de clasificación, cuales son los sitios más relevantes o los que contienen un mayor numero de veces el termino que se busca. Para utilizar los motores, es necesario saber buscar. Asociados a los motores de búsqueda, también encontramos los metabuscadores que realizan la misma búsqueda simultáneamente en varios motores y presentan los resultados compendiados. Son importantes ya que se estima que existen actualmente entre 10 y 15 mil buscadores.

Google es un motor de búsqueda que se ha posicionado muy bien en los últimos 18 meses. Tiene una interfaz muy limpia que ofrece la opción de búsqueda avanzada que permite utilizarlo muy fácilmente.

 

 

   4. ¿Cómo buscar inteligiblemente en la web?


        
Como sabemos, la Web contiene millones de páginas con casi cualquier cosa que necesitemos. El único problema que tenemos como usuarios es encontrar la información que buscamos. Po suerte, gracias a algunos consejos para utilizar los buscadores en internet y nuevas herramientas especializadas, será cuestión de práctica para que nos convirtamos en excelentes detectives dentro de la Red. A pesar de que la mayoría iría al motor de búsqueda del momento, no hay mejor forma de empezar con el ".com".
Así, por ejemplo, si necesitamos información sobre salud, podríamos encontrar una excelente alternativa dirigiéndonos a salud.com. Ello es debido a que los sitios especializados en todo tipo de ramos, han buscado comprar los dominios que más relación tuvieran. Según estudios recientes, un 97% de las palabras del diccionario en inglés ya tienen como apellido el ".com". En el caso del español, el porcentaje es bastante menor, pero muchos portales están buscando la forma de llamar la atención a causa de un buen dominio.
Como la alternativa del ".com" no siempre nos traerá el sitio que buscábamos, existen otras opciones.
Una propuesta interesante es Domainsurfer, un motor de búsqueda que contiene la base de datos de dominios .com, org y net inscriptos y activos.
Regresando a la búsqueda de salud, se encontraron alrededor de 1700 resultados con dominios como buscasalud.com y buenasalud.com. Dos sitios completos sobre el tema.
La desventaja de Domainsurfer es que al tener indexados todos lo dominios activos, no nos asegura que todos nos llevarán a la página real y muchos de los dominios que pulsemos serán páginas de "este dominio está a la venta" o "reservado por...".
Continuando con nuestra búsqueda, vamos a pasar a los populares buscadores, aunque antes de realizar este paso hay que aclarar bien la diferencia entre un motor de búsqueda y un directorio de sitios web.
En primer término, es importante señalar que estamos mal informados si creemos que Yahoo es igual a Altavista, ya que son dos medios de búsqueda completamente diferentes.
Los Directorios de Sitios Web son aplicaciones controladas por humanos que manejan grandes bases de datos con direcciones de páginas, títulos, descripciones, etc.
Estas bases de datos son alimentadas, cuando los administradores revisan las direcciones que les son enviadas para luego ir clasificándolas en subdirectorios de forma temática.
Los directorios más amplios del mundo cuentan con cientos de navegantes revisando nuevas páginas para ir ingresándolas en sus directorios. Así que si nuevamente voy a un Directorio a buscar "salud" probablemente encuentre varias subcategorías con sitios relacionados.
Entre los directorios más grandes y que pueden ayudarnos se encuentra Yahoo (En nuestro idioma existe Yahoo Español), Dmoz (Un directorio alimentado por miles de colaboradores), Looksmart, Infospace y Yupi. Para ejemplificar su uso digamos que ingresamos el termino "salud" en Yahoo Español, siendo mi primer resultado la subcategoría espanol.yahoo.com/salud existirá una gran cantidad de enlaces sobre el tema con buenos contenidos e incluso varias subcategorías del tema.
Por otro lado, los motores de búsqueda son aplicaciones que manejan grandes bases de datos de manera automatizada. Un motor de búsqueda es una máquina que va guardando en su memoria copias de millones de páginas de Internet y asignándoles criterios que luego servirán para su búsqueda.
Dicho motor de búsqueda no cuenta con subcategorías como los directorios, sino con avanzados algoritmos de búsqueda que analizan las páginas que tienen en su memoria y con ello proporcionarnos el resultado más adecuado a nuestra búsqueda.
Entre los motores de búsqueda más populares existen Altavista (el más popular con búsqueda también de gráficos, música, idiomas, etc.), Lycos, Excite, Go, Hotbot, Google (una nueva opción que destaca en facilidad de carga, buenos resultados y tiene incluso una versión para dispositivos inalámbricos.), entre otros.
Como podemos ver, en un Motor de búsqueda tenemos donde buscar, por lo que al ingresar nuevamente "salud" en Altavista hallaremos tantos resultados que resulta a veces imposible contarlos.
Por esta razón, cuando ya hablamos de un motor de búsqueda hay que empezar a realizar búsquedas con mayores criterios aprovechando sus ventajas.

A continuación se presentan algunas recomendaciones que podemos aplicar a nuestras búsquedas:

            ·Utilice varios motores de búsqueda para obtener distintos criterios y resultados.

            ·Delimite su búsqueda por idiomas (Los buenos buscadores tendrán estos criterios).

            ·Los Nombres propios pueden ser indicados al utilizar Mayúsculas y minúsculas

Es importante revisar la ayuda de los motores de búsqueda pues podrían tener muchas opciones que nos ayudarán a facilitar la búsqueda
Ahora que hemos entendido las diferencias entre los directorios de sitios web, encontramos algo fuera de lugar: En Altavista por ejemplo, nos da entre los resultados algunas categorías y en Yahoo muestra resultados de la misma forma que un motor de búsqueda.
Esta situación se debe a que, buscando la comodidad del usuario, muchos servicios se han ido unificando. Yahoo! es un directorio, que en caso de no encontrar nada relacionado dentro de sus subcategorías nos mostrará los resultados del popular motor de búsqueda Inktomi. Altavista por su cuenta también tiene alianzas con el Open Directory Proyect para mostrar dentro de sus resultados, los contenidos de este directorio.
Entre nuestras recomendaciones incluíamos el buscar en diferentes sitios, así que ya varios proyectos nos han facilitado este proceso, realizando nuestra búsqueda en diferentes motores de búsqueda y proporcionándonos los primeros resultados de cada uno. Sitios como Goto, Dogpile y Search tienen esta base. Son una buena opción para comparar criterios de búsqueda o ver cuales son los sitios más relevantes en diferentes motores.
Askjeeves fue un sitio pionero en la tecnología de consultas. Desde este sitio, utilizar búsquedas en inglés puede darnos resultados bastante claros y efectivos.
Cabe señalar que los grandes no se han quedado atrás y por ejemplo Altavista y Google por ejemplo ya han desarrollado su propia tecnología de consulta con interesantes formas de proveernos resultados.
Como hemos visto, la información en Internet ha sido de alguna forma clasificada. Aprendiendo a utilizar las herramientas que tenemos a nuestra disposición podemos encontrar sitios especializados en un tema determinado, o documentos individuales.
Así, cuando queramos encontrar un sitio de deportes, un directorio sería una buena opción, mientras que para encontrar información sobre los medicamentos que se aplicaron en la lesión de algún jugador específico, será mejor recurrir a un motor de búsqueda o ir simplemente a preguntar.
Nadie nos garantiza que esta información no esta disponible y podríamos obtener algunas sorpresas.

5. Cuatro claves para una mejor búsqueda

La página perfecta con seguridad está en alguna parte. Es la página que tiene la información precisa que usted está necesitando y para usted es deseable e inalcanzable como una estrella lejana. Si solamente contará usted con una malla (Red) inmensa que le permitiera capturarla.

La mayoría de la gente hace uso de los motores de búsqueda simplemente escribiendo unos pocos términos en el campo de palabras claves del motor para dedicarse luego a mirar con detenimiento los resultados obtenidos. En algunos casos las palabras que se escogen dan por resultado una reducción indebida de la búsqueda que impide encontrar lo que se están buscando. Con mayor frecuencia el resultado es una pila de páginas web que no tienen mucha relación con lo que se busca y que deben ser filtradas por el usuario para encontrar algo.
El motor de búsqueda más comprehensivo que existe en el momento es Google y en este nos vamos a enfocar. El primer paso para convertirse en "hábil pescador" de páginas de Internet consiste en dominar la opción de Búsqueda Avanzada que ofrece Google, información que se encuentra en http://www.google.com/advanced_search?hl=es.
Le sugerimos adicionar esta dirección a sus sitios Favoritos.



Si usted convierte en hábito el uso de las cuatro claves que a continuación describimos, usted se volverá mejor investigador que el 90% de los usuarios que utilizan Internet. Se trata solamente de recordar cuatro elementos, cada uno de los cuáles le suministrará una mejor "Red" para capturar información.


PRIMERA CLAVE : Comience a ESTRECHAR

Talvez el mayor problema que tiene la gente con los motores de búsqueda es que son ¡muy buenos! Usted puede escribir una palabra y en una fracción de segundo puede tener 20.000 páginas para revisar. Pero la mayoría de ellas no corresponderán exactamente a lo que está buscando y usted tendrá que gastar un montón de tiempo " buceando" entre ellas, para desechar las 19.993 respuestas inadecuadas.

Si usted sabe lo que necesita, por que no empieza por preguntar con la mayor precisión posible?

Piense en todas las palabras que deben aparecer siempre en la página "precisa". Póngalas en la casilla que indica : CON TODAS LAS PALABRAS. (With All the Words).

Piense también en todas las páginas distractoras que pueden aparecer porque uno o más de los términos utilizados en la búsqueda, tiene varios significados. ¿En que palabras puede usted pensar que le ayuden a eliminar esas páginas? Escríbalas en la casilla que indica SIN LAS PALABRAS (Without the words).

Si existen sinónimos del término que está buscando y estos pueden aparecer en la página que se desea encontrar, escríbalos en la casilla que indica : CON ALGUNA DE LAS PALABRAS (With Any of the Words).

Ensaye ahora cada una de las formas de búsqueda anteriores y registre cuantos sitios encontró.

PREGUNTA

RESULTADOS

Imagine que usted está interesado en conocer acerca del legendario continente perdido de Atlántida. Hay varias películas con la palabra Atlántida en el título, pero usted no desea esa información. Además, usted no está interesado en agencias de viajes que se llamen Atlántida.

Escriba en número de “aciertos para cada opción de búsqueda.

Esta es una forma inadecuada para buscar:

CON TODAS LAS PALABRAS:Atlántida

 

Puede afinar la búsqueda intentando esta opción:

CON TODAS LAS PALABRAS:Atlántida continente perdido

SIN LAS PALABRAS:película cine filmes entretenimiento viajes

 

Ahora intente lo siguiente:

CON TODAS LAS PALABRAS:Atlántida continente perdido

CON ALGUNA DE LAS PALABRAS:Atlantes

SIN LAS PALABRAS:película cine filmes entretenimiento viajes

 



Cuando ensaye cada una de las formas de búsqueda, anote que clase de registros encuentra. Observe que mientras más específicos sean los términos que usted incluye o excluye, más enfocada es su búsqueda.

SEGUNDA CLAVE : Encuentre las Frases, PRECISAR

Las palabras se unen en forma predecible. Si usted escribe un frase en la casilla de la opción de Búsqueda Avanzada de Google que dice CON LA FRASE EXACTA (with the exact phrase), usted podrá encontrar páginas en las que las palabras escritas aparezcan juntas y en el orden en que se escribieron. Resulta obvio que esto facilita la búsqueda de cosas que tienen nombre propio compuesto por varias palabras (eje: lugares, títulos de libros, personas)

También es útil cuando usted puede recordar una frase particular de algo que usted ha leído y que ahora debe localizar. Cómo es el resto del cuento que empieza "Simón el Bobito llamó al pastelero".

La habilidad de hacer búsquedas por frases puede resultar sorprendentemente útil. Sospecha usted que un trabajo que entregó uno de sus estudiantes puede ser plagiado si no en su totalidad, si en forma parcial, sin que éste diera los créditos al autor original? Escriba una o dos frases del trabajo y observe que aparece. Así mismo puede usted darse cuenta si su trabajo se está copiando sin su autorización.

Otro uso de esta característica: descubrir la veracidad de cierto tipo de información. La próxima vez que reciba notificación respecto a la aprobación de una ley muy controversial o sobre un nuevo y peligroso virus de computador, compruébela antes de trasmitirla a otros. Para esto escriba cualquier frase poco usual o singular que vea en el correo electrónico y fíjese si existen otros comentarios sobre este rumor en particular.

PREGUNTA

RESULTADOS

Imagine que usted está interesado en conocer acerca del legendario continente perdido de Atlántida. Hay varias películas con la palabra Atlántida en el título, pero usted no desea esa información. Además, usted no está interesado en agencias de viajes que se llamen Atlántida.

Escriba en número de “aciertos para cada opción de búsqueda.

Esta es una forma inadecuada para buscar:

CON TODAS LAS PALABRAS:Atlántida

 

Puede afinar la búsqueda intentando esta opción:

CON TODAS LAS PALABRAS:Atlántida

CON LA FRASE EXACTA:patria de los atlantes

 

Ahora intente lo siguiente:

CON TODAS LAS PALABRAS:Pombo

 

Afine la búsqueda de la siguiente manera:

CON TODAS LAS PALABRAS:Rafael Pombo

CON LA FRASE EXACTA:Simón el Bobito llamó al pastelero

 



TERCERA CLAVE : RECORTAR en Forma Gradual la Dirección de un Sitio en Internet (URL)

Esta opción no es específica de Google, aunque usted va a utilizarla con frecuencia cuando este usando más eficazmente ese buscador. Con frecuencia usted encuentra una página excelente incrustada en una carpeta que está contenida en otra carpeta que a su vez está metida en otra carpeta. Usted sospecha que existen otras páginas interesantes cerca de ella, pero ¿cómo se pueden encontrar? Una forma sencilla es ir recortando paso a paso la dirección del sitio.

Al hacer esto, en ocasiones usted encuentra un mensaje que dice PROHIBIDO! Otras veces accede usted a una lista de archivos y directorios, y algunas veces llega a una página que tiene más enlaces. Es importante saber que cada paso en retroceso le indica a usted con mayor claridad cuál es el origen de la página.

Además es una buena estrategia a utilizar cuando no se puede localizar una página (esto es cuando usted recibe como respuesta de la búsqueda un mensaje 404). En estos casos es posible que el encargado del sitio haya movido la página, la haya llevado a una carpeta nueva o haya cambiado el nombre de la carpeta. Recorra el camino retrocediendo hasta el inicio de la dirección y vuélvalo a recorrer hacia delante a ver si de ésta manera puede encontrar la página perdida.

Usted ha encontrado un Web Quest realmente bueno y desea saber que más hay es ese sitio Web puede empezar a recortar la dirección.

Empiece aquí:

http://www.richmond.edu/academics/a&s/education/projects/webquests/shakespeare/

Ahora recorte la última parte:

http://www.richmond.edu/academics/a&s/education/projects/webquests/

¿Qué pudo notar?

Continué recortando y observe que sucede:

http://www.richmond.edu/academics/a&s/education/projects/
http://www.richmond.edu/academics/a&s/education/
http://www.richmond.edu/academics/a&s/
http://www.richmond.edu/academics/
http://www.richmond.edu/



CUARTA CLAVE : Busque Páginas que se ASEMEJEN

Una vez que usted haya encontrado algo que le gusta o requiere utilizando a Google, es muy fácil y además útil encontrar páginas semejantes o similares. ¿Cómo? Debajo del campo destinado a la Búsqueda Avanzada que usted ha estado utilizando hasta ahora, existen dos campos nuevos. Estos le permiten encontrar páginas que Google cree son similares a la que usted ya encontró o que tienen enlaces con la dirección que usted escribió: Encontrar páginas similares a la página y Encontrar páginas con enlaces a la página.

¿Cómo sabe Google que dos páginas se asemejan? Los detalles del funcionamiento interno de los motores de búsqueda son secretos del oficio, pero podemos asumir con cierto grado de certeza, que los motores se basan en la semejanza de las palabras y los enlaces externos, existentes en las páginas. Lo que si es cierto es que esta opción funciona admirablemente bien, especialmente cuando usted no sabe que palabras claves debe buscar.

Use esta herramienta para encontrar más información sobre algo que para usted es bueno. Úselo para encontrar páginas que están enlazadas a la página que usted encontró y le es útil. Es muy probable que las nuevas páginas también le sirvan.

También sáquele brillo a su Ego: si usted ha puesto una página hecha por usted en un servidor público y en el ha estado durante un tiempo prudencial, entérese de quién más ha puesto enlaces en sus paginas a su sitio.

PREGUNTA

RESULTADOS

Suponga que usted ha encontrado un sitio como Eduteka que le proporciona contenido para los docentes que desean integrar la tecnología a la educación y desea que otras páginas similares puede encontrar.

Escriba en número de “aciertos para cada opción de búsqueda.

Use la característica que tiene Google para encontrar páginas que se asemejen a una que a usted le guste mucho:

ENCONTRAR PÁGINAS SIMILARES A LA PÁGINA: www.maseducativa.com

 

Otra forma de explorar un sitio Web es encontrar quién tiene enlaces a ese sitio.

ENCONTRAR PÁGINAS CON ENLACES A LA PÁGINA:www.maseducativa.com

 

Pruebe lo siguiente:

SIMILARES:kids.msfc.nasa.gov

 

ENLACES:kids.msfc.nasa.gov

 

 

Finalmente para recapitular, recuerde las cuatro claves:
ESTRECHAR
PRECISAR
RECORTAR
ASEMEJAR

que le permitirán realizar una búsqueda no solo mejor sino más efectivamente.

 

 

6. Principales motores de busqueda

 

         Los motores de búsqueda ó search engines se basan en un robot o software que recorre la red automáticamente para localizar documentos, los indiza y los introduce en una base de datos. Esta base de datos será interrogada por los usuarios a través de un formulario o interface web, que lanza la búsqueda, la compara con los recursos indizados en la base de datos y devuelve como resultado un conjunto de links.

La forma de búsqueda en estos sistemas es a través de palabras clave introducidas en el formulario de consulta, permitiendo la mayoría de ellos realizar búsquedas simples y avanzadas. Las búsquedas suelen ser más exhaustivas que en los directorios, pero por el contrario devuelven entre los resultados mucho "ruido". Son útiles para responder a necesidades concretas de información.

A pesar de sus limitaciones, los motores actuales cuentan con un excelente rendimiento en general y proporcionan excelentes resultados en la mayor parte de necesidades. Sin embargo, en los últimos años, se advierte una "portalización" de los motores de búsqueda, esto es, que se han añadido otros servicios además del formulario de búsqueda. Son pocos los que podríamos denominar motores de búsqueda "puros", es decir, que no tengan otro tipo de servicios añadidos. Los principales motores de búsqueda son:

a. GOOGLE <http://www.google.com/> Google es, en sólo un año, pues funciona desde 1999,  uno de los motores de búsqueda más rápidos y más utilizados en la actualidad. Tiene una forma muy particular para establecer la relevancia de los resultados: utiliza el número de enlaces de una página concreta como medida para evaluar su calidad informativa. De este modo, cada vínculo de una página a otra funciona como un voto a favor de la página receptora. Además el Google no valora todos los votos por igual: valen más aquellos vínculos, o votos, que provengan de páginas que a su vez reciban más enlaces de otras páginas. El análisis mediante vínculos permite además que Google remita a 500 millones de páginas no registradas en su base de datos, a las cuales remiten los 560 millones de páginas que sí tiene registradas. Estos 1.060 millones de páginas hacen de Google el buscador de mayor tamaño, según los análisis de la publicación especializada Search Engine Watch. Esta cifra se encuentra muy próxima al total de webs que se calcula están registradas hoy día. La popularidad de Google (disponible en 10 idiomas, entre ellos español, italiano, inglés, francés, japonés, chino y coreano) se ha extendido por la red en un tiempo récord. Las buenas noticias no han cesado en los últimos meses. Google constituye un buscador puro, sin otros servicios añadidos. Su sistema de rastreo sólo ofrece aquellas webs que contengan todas las palabras incluidas en la ventana de búsqueda. Para concretar más, deberá añadirse una nueva palabra en la ventana. El buscador se concentrará en aquellas páginas que contengan la nueva palabra dentro de las ya encontradas. Google, además, evita repeticiones en su lista de resultados. En la presentación de los resultados, Google incluye una función ( "caché" en español) que ofrece la página guardada por el buscador lo que supone un acceso más rápido, aunque existe el peligro de que no esté actualizada. La función Me siento afortunado lleva a la página que más se ajusta a su búsqueda, sin listados ni nuevas selecciones. Permite además búsquedas simples y avanzadas, la búsqueda por frase entre comillas y el operador booleano por defecto es AND.

      b.  ALTA VISTA : AltaVista fue desarrollado por Digital Equipment Corporation en 1995 en laboratorios de investigación de Palo Alto, es un motor de búsqueda para buscar todos los documentos publicados en la WWW. Usando AltaVista, se puede encontrar cualquier palabra en cualquier documento publicado en el World Wide Web o en grupos de discusión del USENET, que hace que AltaVista sea una herramienta inestimable para encontrar información. Actualmente tiene indizadas 200 millones de páginas. Su característica fundamental es la entrega de plataformas múltiples de búsqueda, programación en tiempo real, compras y portal de servicios locales. Otras características del motor son las primeras búsquedas multilingües en Internet, que se hicieron desde su creación. Alta Vista desarrolla también el Babel Fish, el primer servicio de Internet del Web que traduce palabras, frases, y sitios enteros del Web en línea, en diversos idiomas como el español, francés, alemán, portugués e italiano. Recientemente, lanzó un buscador de fotografías, tecnología de búsqueda de la imagen, y el filtro que reduce el ruido de los resultados de las búsquedas. Otras mejoras incluyen la detección de la frase, revisión de palabras del lenguaje natural. También permite capacidades de búsqueda de elementos multimedia.

 

      c.  FAST SEARCH: Fast Search & Transfer ASA (FAST) se estableció el 16 de julio de 1997 en Noruega y abrió una subsidiaria americana en 1998.La investigación y desarrollo es realizada en Oslo y Trondheim en Noruega. FAST tiene como meta de su tecnología de búsqueda, construir un motor de búsqueda más grande del mundo y por eso la frase que la caracteriza “All the web, All the Time” (toda la red, todo el tiempo). Actualmente FAST clasifica 575 millones de sitios y posee servidores Dell Power Edge y subsistemas de almacenamiento Power Vaullt, estos servidores son ejecutados con el sistema operativo BSD.

     

       d.  NORTHERN LIGHT: Northern Light Technology, Incorporated fue premiado como el primer motor de búsqueda en agosto de 1997 y desde ese momento ha crecido considerablemente. Se trata de un motor de búsqueda de segunda generación que permite buscar información en la World Wide Web en más de 5400 fuentes distintas. Los resultados de la Web se combinan con información sacada de otras fuentes dando acceso a monografías, revistas, bases de datos y otras fuentes que no son accesibles desde otros motores de búsqueda (es lo que se denomina como “Internet Invisible”). Además los resultados de las búsquedas aparecen distribuidos en carpetas que facilitan la búsqueda. En la actualidad tiene indizadas 220 millones de páginas.

 

      e. YAHOO: Yahoo! significa “Yat Another Hierarchical Officious Oracle”, fue creada por David Filo y Jerry Yang, estudiantes de doctorado de Ingeniería Eléctrica de la Universidad de Stanford, comenzaron con la guía de Yahoo en 1994, como un modo de hacer un seguimiento de intereses personales y luego las listas se hicieron difíciles de manejar, crearon una base de datos y crearon un software personalizado para identificar y editar de forma eficaz el material almacenado en Internet. Tiene una cobertura internacional con nodos locales que sirven a sus respectivos ámbitos geográficos que incluye a ocho países europeos y a otros continentes (por ejemplo la versión para Japón). Para Íbero América existen una versión española, una mexicana y una brasileña.

Yahoo no es un motor de búsqueda. Si no que es una importante fuente de información de Web. Trabaja como un indexado jerárquico de temas, permitiendo la penetración desde lo general a lo específico. Yahoo es un intento de organizar y catalogar la Web.

La recogida de páginas o sites son sugeridos por los propios usuarios, por lo tanto no es un directorio muy selectivo, mas tarde son visitados y evaluados por Yahoo, existe un formulario de sugerencias donde se solicita la URL, el título y descripción del recurso a incluir, muchos sitios son proporcionados por las mismas compañías, debido a que Yahoo es muy conocido en la Web, su cobertura de sitios comerciales es especialmente buena. Yahoo esta organizado por categorías temáticas e incluye selecciones de la semana, novedades, noticias y el famoso “cool” seleccionado de las categorías especificas dentro de Yahoo, que tiene un contenido divertido, extraordinario y especialmente útil.

Yahoo dispone de un sistema de puntuación, los sitios que disponen de una etiqueta en la que aparece la imagen de las gafas son las que se consideran de un contenido de calidad. Y deben realizarse en primer orden. La etiqueta ¡NEW! indica que la entrada fue añadida la semana anterior, si aparece junto a la entrada de un directorio, significa que en las entradas de la jerarquía de ese directorio se han modificado en los últimos tres días. Cuando la etiqueta ”@” aparece al final de una categoría significa que ese titular está mencionado en otros lugares dentro de la jerarquía de Yahoo!, si se selecciona ese titular, nos llevará a su ubicación principal. Los números que aparecen entre paréntesis junto a las categorías de Yahoo indican el número de entradas clasificadas bajo ese encabezamiento de entrada.Actualmente tiene indizadas unos 60 millones de páginas.

 

7. Motores de búsqueda en Español.

·               Podemos hablar de una gran disparidad, en términos de calidad, entre los buscadores españoles ya que existen algunos buenos y otros muy mediocres.

·               A diferencia de los grandes buscadores internacionales que siempre presentan información sobre aspectos propios del buscador, los servicios de búsqueda del ámbito español suelen ofrecer muy poca información sobre aspectos fundamentales para los usuarios (su cobertura temática, geográfica y lingüística; nº de registros incorporados a la base de datos, opciones de búsqueda; criterios de selección de los recursos;  etc.)

·               La cobertura y alcance es, en la mayoría de los casos, bastante escasa ya que recoge sólo páginas web, desestimando otro tipo de información y recursos de gran interés.

·               Suelen ser bastante limitados en cuanto a su capacidad para realizar búsquedas complejas (es decir, por campos o incluyendo búsquedas booleanas)

·               Existe una gran proliferación de buscadores temáticos en castellano y cada día es más habitual que aparezcan buscadores de un ámbito geográfico o lingüístico reducido, o de una temática muy concreta o especializada.
En general, la cobertura y las opciones de búsqueda y filtrado de estos sistemas son muy limitadas, aunque en algunas ocasiones (para información muy local relativa a nuestro país) pueden ser de utilidad.

Algunos ejemplos son:

o                                      Sol (http://www.sol.es/)

o                                      BIWE (http://biwe.cesat.es/)

o                                      Ugabula (http://www.ugabula.com/)

Algunos de los servicios de búsqueda más portalizados, aunque conservan su motor de búsqueda por palabra-clave son:

Trovator (http://www.trovator.com/): Es el primer robot desarrollado en España utilizando una tecnología propia. Su base de datos incluye más de 400.000 URLs, sobre los que se puede buscar a través de la navegación por grupos temáticos y por palabras clave. Operadores booleanos y tipos de búsqueda: Permite la utilización de AND, OR, AND NOT, NEAR, paréntesis y asteriscos; tiene la opción de búsqueda precisa realizada sólo en las partes más significativas del contenido del documento (etiquetas META, encabezamientos y títulos). Incluye varios servicios y opciones de búsqueda y navegación, pero destaca un servicio de reseñas y noticias y la publicación "Señas", dedicada a la cultura y el ocio en América latina.

Ven y Busca (antes TodoEspaña): (http://buscador.todoesp.es/): Es un portal que tiene un directorio de categorías desarrollado en con Flash. Como buscador sólo perminte los operadores booleanos (Y, todas las palabras, y O, algunas palabras) y tienes las opciones de búsqueda "exacta" (por frase) e "inteligente".  Dentro de sus servicios destaca el espacio que se le concede a los media, ya que incluye un buscador específico de radio (buscador de streams), un directorio de prensa con enlaces a los periódicos más importantes, así como un directorio de buscadores que denominan "buscador de buscadores"por países. Operadores booleanos y tipo de búsqueda: En la opciones avanzadas (ojo, en el menú flash) permite realizar búsquedas cualificadas por campos además de los operadores Y/O.

El Cano (http://elcano.com/): Aunque también es un directorio temático general permite realizar búsquedas por palabras clave. Destaca su buena estructuración del contenido de la base de datos según dos esquemas: por grandes áreas de interés  y por colectivos o profesiones incluyendo la categoría de periodistas y publicistas ; además cada enlace está documentado y clasificado con información adicional sobre su origen y calidad. Operadores booleanos y tipo de búsqueda: El operador por defecto es Y, pero también permite la "busqueda por frase", truncamientos (*) y operadores O (+) y NO (-)

El índice (http://elindice.com/): Es un directorio temático especializado que relaciona más de 30.000 webs de empresas e instituciones españolas, estructurado jerárquicamente por campos de actividad, permite además realizar búsquedas por palabras clave. Operadores booleanos y tipo de búsqueda: Tiene implicitos los operadores AND y OR (coloca en primer lugar las páginas que incluyen todas las  palabras, y más abajo en el ranking de relevancia, las que incluyen sólo una de ellas); permite truncamientos (a través de la raiz de una palabra); obvia las palabras acentuadas o no.

 

8. Metabuscadores

Además de índices y motores de búsqueda, existen también los denominados metabuscadores, buscadores en paralelo, megamotores o metaservidores de información en Internet. Estos sistemas van más allá de los buscadores: admiten una consulta y se encargan de lanzarla a diferentes sitemas de búsquedas públicos que hay en Internet.

· Concepto

Los metabuscadores ofrecen detalles de las respuestas de cada uno de los servicios, o bien el listado completo de coincidencias que constituyen (al menos en teoría) las mejores respuestas a la pregunta formulada. Generalmente no se obtiene toda la potencia de cada uno de ellos (dado que los formatos de consulta varían) pero pueden ser útiles cuando no se han tenido suerte en la búsqueda en otros servicios, para buscar por una materia poco común, o para realizar búsquedas exhaustivas.
 

· MetaCrawler

El paradigma de estos sistemas de búsqueda sería Metacrawler <http://www.metacrawler.com/>, que busca en 14 buscadores distintos: AltaVista, DirectHit, Excite, FindWhat, Google, GoTo.com, Infoseek, Kanoodle, LookSmart, Lycos, RealNames, Sprinks, Thunderstone y WebCrawler. Metacrawler puede buscar en páginas Web, News, etc. Metacrawler es uno de los más destacados servicios de metabúsqueda de la WWW. Cuando se plantea una búsqueda, la envía a estos buscadores, reúne los resultados, elimina duplicados, hace un control de la relevancia y ofrece una lista exhaustiva de recursos. Como la mayoría de los sistemas de búsqueda de este tipo, tiene dos formas de interrogació o usos posibles:

·               Sencillo: se formulan las búsquedas desde una única ventana. El usuario puede decidir, al incluir los términos, si en las páginas encontradas deben aparecer todos los términos (all), al menos alguno de ellos (any), o toda una frase (phrase), así como la parte de la Web en la que realiza la búsqueda (toda la Web o solo el idioma usado por el usuario), además del tipo de recurso buscado (páginas Web, ficheros de sonido, imágenes…). Los resultados los presenta listados, por defecto, por relevancia (calculando cual se ajusta más a la búsqueda), aunque también permite ordenarlos por sitio web al que pertenecen (site) o por buscador en el que se encontraron (source)

·               Avanzado (power search): Además de las opciones anteriores, permite seleccionar otros parámetros: los buscadores sobre los que realizará la consulta, el dominio al que pertenecen los sitios encontrados, el tiempo que dedicará a hacer la consulta (si se elige "rápido", dedicará menos tiempo a hacer la búsqueda), el número máximo de resultados obtenidos…

Además, en Tools and Tips, ofrece otras opciones de búsqueda como:

·               La búsqueda a través de directorio (Metacrawler Open Directory <http://www.metacrawler.com/index_od.html> que no es más que la versión de MetaCrawler de ODP

·               La posibilidad de ver otras preguntas que están planteando otros usuarios: MetaSpy <http://www.metaspy.com/>

·               Una versión reducida del metabuscador: Minicrawler <http://www.metacrawler.com/tools/minicrawler> que se activa en el escritorio del usuario como un pequeño "agente de búsqueda" que puede asistir al usuario en cualquier momento

· Otros metabuscadores internacionales (en inglés)

·               Kostenloses: http://www.kostenloses.com/ (permite la metabúsqueda regionalizada por países).

·               Search.com: http://www.search.com/ (realiza una metabúsqueda seccionada por tipos de información)

·               ProFusion: http://www.profusion.com/ (en la opción de búsqueda avanzada permite seleccionar los buscadores a los que lanzar las páginas así como acotar la búsqueda sólo a documentos .pdf).

·               MeteEngine: http://www.metengine.com/ (no permite seleccionar los motores de búsqueda aunque sí los referencia en los resultados, pero tienen interesantes opciones de ordenación de resultados)

·               Botbot (search one find twice): http://www.botbot.com/

·               Dogpile (All the search, no mess): http://www.dogpile.com/(presenta los resultados en un listado ordenado por buscadores). Es un servicio muy interesante para evaluar la exhaustividad temática individual de distintos buscadores.

·               Ithaki: http://www.ithaki.net/indexu.htm; (Ver: http://www.todalanet.com)

· Metabúsqueda en España/español.

Aunque hasta hace un año existían metabuscadores españoles que trabajaban con buscadores españoles, como era el caso de http://www.metabusca.com, este metabuscador ha sido absorbido, como otros servicios, por el portal hispano MSN http://busqueda.yupimsn.com/. En la actualidad, lo más normal es que los metabuscadores en nuestro idioma tenga una interfaz en español pero que trabajen con buscadores internacionales, como es el caso de:

·               Buscamundo <http://buscamundo.com/> (metabuscador en español que, aunque utiliza algunos buscadores hispanos como Hispavista, los resultados provienen mayoritariamente de buscadores internacionales.

·               El metabuscador de Biwe <http://multibuscador.biwe.es/>, aunque se autodenomina multibuscador es un buscador en paralelo de páginas en español <http://www.islasol.com/buscador/indexbusca.htm>

·               PyDot <http://www.pydot.com/> (metabuscador paraguayo con interfaz en español que lanza las búsquedas a los 14 principales buscadores internacionales):

Merece sin embargo, mención especial la versión en español del metabuscador Toda la Net <http://es.todalanet.com/> que entre las múltiples opciones de metabúsqueda que tiene incluye:

·               Búsqueda en español, en cuyo caso, lanza la sentencia a: Proyecto Directorio Abierto, Terra, Starmedia, Telepolis-Google, Altavista en español, y Yahoo español.

·               Búsqueda en España, en cuyo caso busca en: Ozú, Sol, Apalí, Euroseek, El Cano, TodoWeb, Voilá España, Dmoz.org, Direct Hit España y Yahoo España.

 

9. Evaluación de los resultados de las búsquedas

 

Los cálculos de exhaustividad, relevancia y pertinencia están hechos a partir de las búsquedas con operadores booleanos. Para poder calcular la Exhaustividad se tiene en cuenta el número total de páginas que indiza cada buscador y se hace un cálculo aproximado para cada uno de ellos :Alta Vista 200 millones, Fast Search 300 millones, Northern Light 220 millones y Yahoo 60 millones. Para la Relevancia se analizan los 20 primeros resultados de cada búsqueda tomando en consideración los duplicados e inactivos. En el caso de la Pertinencia se tiene en cuenta el contenido de cada uno de los resultados. Se han tenido en cuenta tres posibilidades:

         direcciones que tratan el tema puntualmente (sólo estos datos aparecen

                     en el cuadro),

         direcciones que tratan el tema juntamente con otros,

         direcciones que para nada lo tratan.

Para cada uno de los resultados se ha calculado el porcentaje respectivo para establecer más claramente la eficiencia de los buscadores analizados.

En la búsqueda en lenguaje natural o texto libre algunas veces aparecen dos resultados debido a que la búsqueda se ha realizado de dos formas diferentes, se han omitido las búsquedas en inglés, considerando que los resultados de las búsquedas en español son suficientemente significativas.

 

Análisis de las preguntas propuestas

 

Analizando los resultados de todas las preguntas podemos afirmar que FAST SEARCH es el buscador que mayor número de páginas muestra en lenguaje natural (4 de 5 preguntas), esto se debe a que el motor lee la frase completa o parte/ s de ella alternativamente, seguido por NORTHERN LIGHT que muestra mayor número de registros en una sola pregunta. Estas variables cambian cuando se realizan las búsquedas con operadores booleanos donde ALTA

VISTA es el que mayor número de registros recupera (2 de 5 preguntas), seguido de los otros buscadores con una pregunta cada uno. Las diferencias entre las búsquedas por lenguaje natural y operadores booleanos muestran diferencias significativas. Mientras que en algunas

preguntas las búsquedas en lenguaje natural representan un porcentaje inferior a los obtenidos con los operadores booleanos, en otras es muy superior. Esto viene a corroborar las características de cada uno de los buscadores, ya que en el caso de FAST SEARCH a pesar de tener más desarrollada la opción de búsqueda por texto libre, muestra resultados muy amplios en dos preguntas  en el que muestra cifras entre 21 y 183 millones para la primera pregunta y 26 y 32 millones para la segunda. Comparándolo con los resultados en la búsqueda con operadores booleanos son sólo el 0,05% y 0,005% para el primer caso y 2,4% y 1,9 % para el segundo. El caso contrario a esto lo demuestra ALTA VISTA que en las búsquedas por texto libre sobre Revistas electrónicas, Atapuerca y Libertad intelectual muestran porcentajes muy pequeños, 0% para la primera pregunta, 0,4% para la segunda y 2,38 % para la tercera.

En cuanto a la relevancia de los buscadores los que mayor número de registros inactivos muestra son ALTA VISTA  y NORTHERN LIGHT , seguidos de YAHOO y FAST SEARCH con 7. El buscador que más duplicados muestra es FAST SEARCH  seguidos de NORTHERN LIGHT  y ALTA VISTA . YAHOO no tiene registros duplicados debido a que sus mejores posibilidades de búsqueda se realizan por browsing y por lo tanto los resultados se ofrecen agrupados por categorías. La pertinencia de los primeros 20 resultados muestra que NORTHERN LIGHT y YAHOO obtienen mejores resultados en todas las preguntas, aunque este último ha realizado sus búsquedas a través de browsing. Es necesario resaltar que FAST SEARCH obtiene en algunos casos resultados relevantes (Libertad intelectual 100%). Teniendo en cuenta los resultados de registros que tratan el tema juntamente con otros, se puede ver que YAHOO y NORTHERN LIGHT obtienen porcentajes que fluctúan entre el 60% (Libertad intelectual) y 30% (Revistas electrónicas e I+D público) respectivamente. El buscador que muestra la peor pertinencia es ALTA VISTA que en el mejor de los casos obtiene un 20% (Libertad intelectual) y en otras tres preguntas sólo obtiene el 0% de pertinencia. A medida que se han ido realizando las búsquedas se  comprobó que si se emplean operadores booleanos con “preguntas científicas” los resultados no son pertinentes, por lo que todos los casos es necesario fraccionar las búsquedas de varias formas para obtener una mayor pertinencia. Para mejorar las búsquedas se pueden emplear las distintas opciones de búsqueda avanzada como “Sort by” en Alta Vista, “Must include” en Fast Search y “Subject”, “Type of Document” y “Sort” en Northern Light.

 

 

10. Motores de Búsqueda y Álgebra Booleana

 

Internet es una inmensa base de datos. Como tal, sus contenidos deben buscarse de acuerdo con las reglas establecidas para realizar búsquedas en bases de datos. Gran parte de la búsqueda en las bases de datos, se apoya en los principios de la lógica Booleana. Estos principios hacen referencia a las relaciones lógicas existentes entre los términos de búsqueda a las cuales se les dio el nombre del matemático británico George Boole.
En los motores de búsqueda por Internet, las opciones para construir relaciones lógicas entre los términos de búsqueda se extienden más allá de la práctica tradicional de la búsqueda Booleana.

La lógica Booleana consiste en tres operadores lógicos:

O (or) Y (and) NO (not)

Cada uno de estos operadores se puede describir visualmente usando un diagrama de Venn, como se muestra a continuación

 



PREGUNTA: Deseo Información sobre colegios.

·               En esta búsqueda, vamos a recuperar registros en los cuáles POR LO MENOS UNO de los términos de búsqueda esté presente. Estamos buscando los términos Colegio y también Universidad porque los documentos que contienen una de estas dos palabras pueden ser relevantes.

·               Esto se ilustra por:

o                                      El círculo sombreado con la palabra colegio representa todos los registros que contienen la palabra "colegio".

o                                      El círculo sombreado con la palabra universidad representa todos los registros que tiene la palabra "universidad".

o                                      El área sombreada en la que se entrelazan los dos círculos representa todos los registros que contienen las dos palabras "colegio" y "universidad"


El operador lógico O (OR) se usa más comúnmente para buscar términos sinónimos o conceptos.

A continuación presentamos un ejemplo de cómo funciona el operador lógico O (OR)

TERMINO BUSCADO

RESULTADOS ALTAVISTA

RESULTADOS GOOGLE

Colegio

378.678

289.000

Universidad

1’140.371

3’250.000

Colegio OR Universidad

1’220.917

425.000







El operador lógico O (OR) ayuda a tamizar los resultados para recuperar todos los registros únicos que contienen uno de los términos, el otro o ambos.
En la medida en que se combinen más términos o conceptos en una búsqueda con el operador lógico O, mayor será la cantidad de registros que se van a encontrar.

 

TERMINO BUSCADO

RESULTADOS ALTAVISTA

RESULTADOS GOOGLE

Colegio

378.678

289.000

Universidad

1’140.371

3’250.000

Colegio OR Universidad

1’220.917

425.000

Colegio OR Universidad OR (Ciudad AND Universitaria)

1’245.846

155.000

 



Pobreza Y Crimen



PREGUNTA: ¿Qué relación existe entre Crimen y Pobreza?

·               En esta búsqueda se recuperan registros en los cuáles AMBOS términos están presentes.

·               Lo anterior se ilustra por el área sombreada en la que se entrelazan los dos círculos que representan a todos los registros que contienen tanto la palabra "Pobreza" como la palabra "Crimen"

·               Es necesario anotar que no se recuperó ningún registro que contuviera únicamente la palabra "Pobreza" o únicamente la palabra "Crimen"



A continuación presentamos un ejemplo de cómo funciona el operador lógico Y (AND)

TERMINO BUSCADO

RESULTADOS ALTAVISTA

RESULTADOS GOOGLE

Pobreza

178.387

584.000

Crimen

179.369

73.400

Pobreza AND Crimen

120

21.100


En la medida en que se combinen una mayor cantidad de términos y conceptos con el operador lógico Y (AND), se van a recuperar una menor cantidad de registros.



Por Ejemplo:

TERMINO BUSCADO

RESULTADOS ALTAVISTA

RESULTADOS GOOGLE

Pobreza

178.387

584.000

Crimen

179.369

73.400

Pobreza AND Crimen

120

21.100

Pobreza AND Crimen AND Genero

14

4.770


Solamente algunos de los motores de búsqueda hacen uso del operador de Proximidad (cercania) en temas relacionados CERCA (Near). El operador de proximidad determina la cercanía en la que están situados los términos al interior de un documento fuente. Cerca (Near) es un Y (AND) restrictivo. La proximidad de los términos de búsqueda se determina de manera particular para cada uno de los motores de búsqueda. Por ejemplo Cerca en Alta Vista (Búsqueda Poderosa) es 10 palabras. Google tiene esta función en forma predeterminada.



Perros NOT gatos

PREGUNTA: Se requiere información sobre gatos pero se desea evitar cualquier información sobre perros.

·               En esta búsqueda, se recuperan registros en los cuáles SOLAMENTE UNA de estas palabras está presente.

·               Lo anterior está ilustrado por el área sombreada con la palabra Gatos que representa todos los registros que contienen la palabra "gatos"

·               No se recuperan registros en los que aparece la palabra "perros" aún cuando la palabra "gatos" aparezca en ellos también.



A continuación presentamos un ejemplo del funcionamiento del operador lógico NO (NOT).

TERMINO BUSCADO

RESULTADOS ALTAVISTA

RESULTADOS GOOGLE

Gato

132.806

370.000

Perro

184.674

307.000

Gato NOT Perro

10.605

1.610


El operador lógico NO (NOT) excluye registros o registros de los resultados de búsqueda. Tenga cuidado al usar NO, ya que el término que se quiere buscar puede estar presente de manera importante en documentos que también contienen el término que se desea excluir.

N. del T: la mayoría de los motores de búsqueda requieren que se ingresen los términos lógicos en ingles (AND, OR, NOT), así esté buscando con palabras claves en español.

11. Conclusiones.

 

Como principal conclusión de este estudio recopilatorio aportamos la certeza de que no existe una metodología de análisis de los motores de inferencia en la web que se imponga claramente sobre las demás, es decir, no se ha llegado a establecer un método de análisis estándar de estos ingenios, ya que los estudios realizados presentan sustanciales diferencias en su método y, por tanto, sus conclusiones también resultan dispares. También es importante recordar que en algunos de los trabajos analizados ni siquiera se lleva a cabo un proceso de análisis mínimamente riguroso, sino que las recomendaciones de esos trabajos se basan en criterios excesivamente subjetivos. En segundo lugar, cabe resaltar la dificultad de encontrar estudios amplios y detallados, con base en experimentaciones científicas en este campo, de hecho, la mayoría de los trabajos , simplemente analizan a tres motores de búsqueda, con lo cual el análisis no llega a representar exactamente la realidad.

En esta misma línea, también llama la atención el hecho de que, en la mayor parte de los casos, los autores analizados no repiten sus experimentaciones al cabo del tiempo sino que suelen abandonar esta línea de trabajo, no contribuyendo por tanto, a profundizarla. Muy relacionado con esta presencia esporádica de investigadores está el problema de la obsolescencia de los informes (especialmente de aquellos publicados en revistas científicas), los cuales difícilmente recogen las novedades que se vienen produciendo de forma paulatina y dejan fuera de su análisis a algunos motores de búsqueda en pleno auge.

Por último, concluimos que se hace preciso proceder a desarrollos de metodologías de análisis de la calidad de estos motores de búsqueda, rigurosas y alejadas de cualquier tipo de subjetividad, métodos que, de otra parte, tampoco resulten excesivamente complicados y permitan la actualización periódica de los estudios con mucha frecuencia y que, al mismo tiempo abarquen al mayor número de motores posible, incorporando las novedades que se vienen produciendo con gran profusión en este campo.



 

                                                                                              DANIEL RODRIGUEZ GASCA

                                                                                                    18596017-B …. ESIDE

                                                                                                 rodriguezdani@hotmail.com