specbar.GIF
Menu3.gif (26077 bytes)
impresion.gif (1152 bytes) specbar.GIF

 

11. BUSQUEDA EN EL WEB

 

11.1 INTRODUCCION

11.2 LOS MOTORES DE BUSQUEDA

11.3 PRINCIPALES MOTORES DE BUSQUEDA

11.4 VISITAS RECOMENDADAS

 

 

11. BUSQUEDA EN EL WEB

 

11.1 INTRODUCCION

 

Cuando se visita una Biblioteca y se necesita encontrar una información específica, lo primero que se hace es ir al catálogo de Fichas Bibliográficas y realizar la búsqueda dentro del mismo, ó últimamente se realizaría la misma búsqueda a través de una pantalla conectada a un computador en el cual se encuentra la información y ubicación de todos los libros disponibles en esa biblioteca. Esta sería la mejor forma si queremos tener certeza del sitio en el que se encuentra ubicada la información que se está buscando, una situación similar se tiene cuando se realiza una conexión a Internet, y no se está seguro de en que sitio se puede encontrar la información que se está requiriendo. En capítulos anteriores se ha hablado de algunas formas de accesar información tales como: Gopher, Veronica, Wais y Archie, recursos que hoy están disponibles, pero que precedieron históricamente al World Wide Web, y aunque continuan teniendo utilidad, definitivamente no son la herramienta adecuada, a la hora de enfrentarnos a una búsqueda en el Web.

Es por esto, que se han desarrollado los Motores de Búsqueda, que al igual que cuando se visita una biblioteca el primer sitio visitado es el catálogo de fichas, los sitios de los motores se búsqueda  se han convertido en el primer sitio visitado por muchos de los navegantes de Internet. A muchos de estos sitios se les denomina Portales, por ser precisamente la puerta de entrada al web para muchos de los usuarios, radicando entonces su importancia en que será un sitio con un alto tráfico, y la publicidad que en este sitio se coloque puede tener un alto impacto.

En este capítulo se hablará entonces sobre los motores de búsqueda disponibles, la forma de accesarlos, la forma de hacer búsquedas efectivas y también se hablará sobre su funcionamiento, lo cual puede contribuir a que al momento de colocar una página en el Web, esta pueda ser reconocida por los Motores de Búsqueda y lograr una buena ubicación al momento de que alguien realice una búsqueda sobre el tema de dicha página.

 

11.2 LOS MOTORES DE BUSQUEDA

 

11.2.1 Cómo trabajan los Motores de Búsqueda.

El término Motores de Búsqueda, se ha convertido en la forma genérica para referise a los Servicios de Búsqueda en Internet, sin embargo en el Web se pueden distinguir los Motores de Búsqueda verdaderos y los directorios, y se podría hablar de un tercer tipo de servicio conformado por los Motores de Búsqueda híbridos. La diferencia entre ellos radica en la forma en que la información sobre los diferentes sitios es obtenida.

Los Motores de Búsqueda operan haciendo un barrido del Web, y luego personas se encargan de revisar lo que se ha encontrado. De tal forma que si las páginas son cambiadas, estos cambios eventualmente pueden influenciar la forma en que aparecen listado el sitio por los Motores de Búsqueda. Juegan aquí un papel importante los encabezamientos de las páginas y el contenido en sí mismo.

Los Directorios dependen básicamente de personas para obtener sus listados. La forma en que operan es  se les envía información con una descripción corta del contenido del sitio ó en muchos de los casos tienen personas que se encargan de revisar sitios y de incluirlos dentro de sus listados. En estos la información entregada por el sitio dependerá entonces de la descripción que se le suministre sobre el sitio.

En el caso de los directorios cambios que se realicen en las páginas no tendrán ninguna influencia sobre la forma en que el sitio aparece listado por los Directorios.

Los Motores de Búsqueda Híbridos utilizan un Directorio asociado, en estos casos además de hacer un barrido por los diferentes sitios del Web, tienen personas que se encargan de revisar sitios y de hacer su propia descripción del mismo.

 

11.2.2 Estructura de los Motores de Búsqueda

Los Motores de Búsqueda están compuestos por tres elementos principales (Figura 1): La Araña (Spider), a veces también denominado Crawler. La Araña se encarga de visitar los diferentes sitios del Web, en su proceso accesa una página, la lee, y luego accesa los sitios a los cuales se tengan enlaces dentro de dicha página. El proceso de la Araña se repite en forma regular cada treinta a sesenta días dependiendo del Motor de Búsqueda.

El segundo componente del Motor de Búsqueda es el índice. A veces también se le denomina el catálogo, y este recibe toda la información obtenida por la Araña, de tal forma que el ïndice ó catálogo se puede asimilar a un gran libro en el que se va almacenando toda la información recolectada en sus visita a la Web (Telaraña) por la Araña (Spider).

Finalmente el tercer componente del Motor de Búsqueda es el Software, cuya función es extraer la información cuando se realiza una búsqueda, y para ello hace un recorrido por todas las páginas buscando la información solicitada, y posteriormente entregándola en orden de relevancia.

 

c11f1compmb.gif (53962 bytes)

Figura 11.1 Estructura de los Motores de Búsqueda

 

11.3 PRINCIPALES MOTORES DE BUSQUEDA

 

A continuación se encontrará un resumen de los principales Motores de Búsqueda en Internet, y para su inclusión se tuvo en cuenta su importancia desde el punto de vista de desarrollo de Alianzas estratégicas con compañías como Microsoft ó Netscape, Portales de entrada importantes a Internet, así mismo como el trabajo que vienen desarrollando desde el punto de vista de actualización de su información y el tamaño mismo de la base de datos que actualmente mantienen sobre los diferentes sitios disponibles en Internet.

 

11.3.1 Altavista

Altavista fué desarrollado por Digital e inició sus servicios en Diciembre de 1995. Actualmente luego de la fusión de Compaq y Digital ha pasado a pertenecer a esta última compañía. Es uno de los motores de búsqueda que ha venido ganando reconocimiento y tiene amplia aceptación. Se puede considerar el motor de búsqueda más grande Internet, por el número de páginas indexadas.

 

Su página se puede visitar en: http://www.altavista.com. Su dirección durante mucho tiempo fué: http://altavista.digital.com, debido a que la primera dirección se encontraba registrada por otra empresa.

 

c11f02altavista.gif (28294 bytes)

Figura 11.2 Página de Altavista en el Web

 

11.3.2 Excite

Excite ha venido creciendo desde su inicio a finales de 1995. A mediados de 1996 compró Magellan otro de los servicios de búsqueda en Internet, y posteriormente en Noviembre del mismo año adquirió WebCrawler. Am bos servicios continuan prestando servicios de búsqueda  en Internet.

Excite presenta en su sitio tres modalidades de búsqueda: Excite Search (Búsqueda), la cual realiza búsquedas sobre los listados generados por su motor de búsqueda en la forma tradicional de recorrer el Web y obtener información de las páginas visitadas.  Channels (Canales), el cual se oriente a entregar información por temas y finalmente Excite News Tracker (Noticias), que permite generar listados sobre sitios dedicados especialmente a entregar información de noticias.

La página de Excite se puede visitar en la siguiente dirección: http://www.excite.com/

 

c11f03excite.gif (21388 bytes)

Figura 11.3 Página de Excite en el Web

 

11.3.3 HotBot

Inició sus operaciones en Mayo de 1996. El sitio es alimentado por el motor de búsqueda de Inktomi, y sobre el cual se encuentra mayor información más adelante. Tiene una alianza con LookSmart para sus listados de Directorios. Su Base de Datos es la segunda más grande después de la de Altavista.  Se estima que HotBot recibe más de once millones (11.000.000) de visitantes por mes. HotBot fué adquirida por Lycos en Octubre de 1998, pero continua operando como una empresa independiente.

Siguiendo la tendencia de muchos de los Motores de Búsqueda, HotBot también ha incorporado una serie de servicios adicionales en su página tales como:

  • Páginas Gratis. HotBot ofrece 5 MB de espacio y asigna una dirección (URL) única la página de tal forma que puede ser visitada por otras personas con acceso a Internet.
  • Correo Electrónico. HotBot asigna una casilla de correo electrónico a las personas que se registran con HotBot.
  • Noticias. La página ofrece acceso a una sección de Noticias sobre diferentes temas: Política, negocios, tecnología, igualmente dedica secciones a Deportes y entretenimiento.
  • Administrando su Dinero. Esta sección, incluye información sobre Finanzas, Sitios para búsqueda de empleo, Negocios y Educación.
  • Comercio Electrónico. Aquí se encuentra información sobre sitios en Internet que ofrecen venta de vehículos, Casas y propiedades, Viajes y finalmente un Directorio de sitios en Internet dedicados al Comercio Electrónico.
  • Uso de Tecnología. Información sobre computadores, Desarrollo de Sitios Web y Programas para ser bajados a través de Internet.

Para accesar HotBot se puede ir a la siguiente dirección: http://www.hotbot.com

 

c11f4hotbot.gif (38037 bytes)

Figura 11.4 Página de Hotbot en el Web

 

11.3.4 Inktomi

Inktomi nació como un motor de búsqueda en la Universidad de California Berkeley. Los creadores de dicho motor, posteriormente fundaron su propia compañía bajo el mismo nombre y dieron origen al Indice Inktomi, el cual fué utilizado por HotBot.

Inktomi no está disponible directamente como un servicio de búsqueda en el Web, pero existen varios de los Motores de Búsqueda que utilizan sus servicios. Aunque el índice es el mismo para todos los que lo utilizan, cada uno se los servicios busca diferenciarse y esto hace que los resultados de una búsqueda puedan ser ligeramentes diferentes.

Inktomi posee una página en Internet, en la cual se anuncia su Motor de Búsqueda, y la cual puede ser visitada en: http://inktomi.com/. En la Figura 11.5 se puede observar la página de Inktomi dedicada a su Solución de Motores de Búsqueda.

 

c11f5inktomi.gif (41337 bytes)

Figura 11.5 Página de Inktomi en el Web

 

11.3.5 Infoseek

Infoseek Corporation fué funda en Enero de 1994 por Steven Kirsch, fundador de  Frame Technology y Mouse Systems, y un grupo adicional de Socios pertenecientes a la Industria de Alta Tecnología. Inició sus sercicios de Búsqueda a comienzos de 1995. La base de Datos de Infoseek actualmente incluye cerca de treinta Millones de URLs, lo cual lo coloca dentro de los Motores de Búsqueda pequeños, si se le compara con Altavista ó HotBot.

 

Otros Servicios Ofrecidos por Infoseek son: infoseek en Español, el cual Permite la búsqueda en el Web ó solo en la parte de Internet España de páginas en Español, Chat, Servicio de Páginas gratuitas en Internet, Mapas, Información financiera en combinación con Microsoft Network Investor, adicionalmente inluye otros servicios los cuales se pueden apreciar en la Figura 11.6

 

c11f6infoseek.gif (27938 bytes)

Figura 11.6 Página de Infoseek en el Web

 

Infoseek ofrece la posibilidad de colocar dentro de una página Web una opción de Búsqueda como la que se encuentra a continuación, y la cual permite realizar la búsqueda en Internet sobre el Web, ó en cada una de las opciones de búsqueda ofrecidas por Infoseek. 

 

Infoseek

Entre frases ó palabras claves     SUGERENCIAS


buscar en  

Figura 11.7 Búsqueda a Través de Infoseek

 

11.3.6 Looksmart

LookSmart inició operaciones en Octubre de 1996, y es un motor de búsqueda basados en Directorios. El número de Sitios web listados en su base de datos incluye más de trescientos mil (300.000), y tiene una alianza con Altavista que le permite utilizar los servicios de esta cuando la búsqueda sobre su base de datos no ofrece ningún resultado.  Así mismo provee de listados a Altavista y HotBot basados sobre sus Directorios.

LookSmart  en su inició se diferenció por utilizar una interface basada en Java, que permitía navegar por menús, sin embargo esta fué totalmente eliminada en Junio de 1997 buscando mejorar los tiempos de acceso para sus usuarios.

La Figura 11.8 muestra la Interface actual de LookSmart, la cual se puede accesar visitando su página en: http://www.looksmart.com.

 

c11f7looksmart.gif (26254 bytes)

Figura 11.8 Página de Looksmart en el Web

 

11.3. 7 Lycos

Lycos se inició como un Proyecto de Investigación en la Universidad de Carnegie mellon, y posteriormente fué creada como empresa en Junio de 1995. Su nombre proviene del Latín "araña lobo". Lycos es un motor de búsqueda híbrido pués cuenta con listados provenientes de Motores de Búsqueda, y adicionalmente cuenta con un directorio asociado llamado "Guías de Comunidades". Lycos ha tenido una gran expansión y de acuerdo con su información a través de su red de empresas en Internet tienen un cubrimiento de un cuarenta por ciento (40%) de los visitantes de Internet.

A la Red Lycos se han adicionado una serie de sitios a través de la adquisición de estas compañías: Tripod (Comunidad, ofrece páginas Web y correo electrónico), Angelfire (Comunidad, ofrece páginas Web y correo electrónico), WhoWhere (servicios de Directorio de Internet), MailCity, HotBot, HotWired, Wired News, Webmonkey and Suck.com.

Lycos también adquirió Point un servicio dedicado a clasificar lo que ellos consideran son el 5% de los mejores sitios del Web. Este servicio permite listar estos sitios por orden alfabético, temas, etc.

Lycos utiliza su motor de búsqueda en muchos de los sitios que pertenecen a su red, y adicionalmente Netscape, lo ofrece como una de las opciones de búsqueda en su página.

La Figura 11.9 muestra la página principal de Lycos en la que se pueden observar sus principales servicios. Para realizar búsquedas utilizando Lycos, puede visitar: http://www.lycos.com

 

c11f8lycos.gif (31555 bytes)

Figura 11.9 Página de Lycos en el Web

 

11.3.8 Microsoft

Microsoft ofrece un servicio de búsqueda del Web en su página de acceso de Microsoft Network. Actualmente ofrece cinco (5) opciones de búsqueda las cuales usan diferente motores de búsqueda. La primera de ellas: MSN Web Search, utiliza los servicios de Inktomi a través de una alianza anunciada en Octubre de 1997. Además ofrece acceso a búsquedas utilizando los servicios de Altavista, Infoseek, Lycos y Snap.

La página de acceso a Microsoft Network, en donde se encuentra el Servicio de Búsqueda se puede accesar en: http://www.msn.com.

 

c11f8microsoft.gif (20529 bytes)

Figura 11.10 Página de Microsoft en el Web

 

11.3.9 Netscape

Netscape ha reforzado su estrategia para competir como un Portal de Internet, gracias al alto número de visitas que alcanza su sitio. Por esta razón desde comienzos del presente año de 1998, Netscape ha incorporado servicios de búsqueda en una alianza con Excite. Además de los servicios de Excite que alimentan el motor de búsqueda de Netscape, también ofrece al igual que Microsoft, acceso a otros motores de búsqueda como: Infoseek, Lycos, Altavista, Looksmart y Excite.

Netscape puede visitarse en su página ubicada en: http://www.netscape.com

 

c11f9netscape.gif (28959 bytes)

Figura 11.11 Página de Netscape en el Web

 

11.3.10 Northern Light

Northern Light quien inició sus operaciones en Agosto 12 de 1997, no es actualmente uno de los motores de búsqueda más populares, pero su trabajo de barrer la Web en forma seria y consistente lo colocan dentro de los principales motores de búsqueda.

Su estrategia se basa en lograr una diferenciación gracias a que hace una clasificación de la información por tópicos. Adicionalmente ofrece acceso a información de más de cuatro mil quinientos (4,500) fuentes diferentes que incluyen: revistas, bases de datos, agencias de noticias, y en general material disponible únicamente bajo suscripción. Este material clasificado bajo el nombre de "Special Collection" permite accesarse para búsqueda pero si se desea accesar se tiene un cargo de hasta US$4 por documento.

Lá página de Northern Light se puede visitar en: http://www.northernlight.com

 

c11f10northlight.gif (39604 bytes)

Figura 11.12 Página de Northern Light en el Web

 

11.3.11 Search.com

Search.com se inició en marzo de 1996, como un servicio de Cnet, el cual ofrecía acceso a diferentes motores de búsqueda, en forma similar a como lo hacen hoy Microsoft y Nestscape. A partir de Mayo de 1997, se alió con Infoseek, y actualmente su búsqueda se lleva a cabo utilizando los servicios de Infoseek, aunque logra diferenciarse, usando la base de datos de Infoseek para búsquedas generales, pero usa su propia base de datos de listados para búsquedas por temas. En la Figura 11.13 se puede observar la página de acceso a Search.com

La página de Search,com se puede visitar en: http://www.search.com

 

c11f10search.gif (32714 bytes)

Figura 11.13 Página de Search.com en el Web

 

11.3.12 Snap

Snap es uno de los últimos servicios en aparecer en el web ofreciendo los servicios de búsqueda en el Web. Perteneciente también a Cnet, Snap ha tomado fuerza últimamente logrando además una buena popularidad por el servicio de casilla de correo electrónico ofrecido a través de su página. Este servicio de correo, ofrecido a través de email.com, tiene características que permiten transferir los mensajes a otro servicio, además puede ser accesado desde un programa cliente como Outlook ó Eudora. 

La página de Snap puede ser visitada en: http://www.snap.com.

 

c11f12snap.gif (29366 bytes)

Figura 11.13 Página de Snap en el Web

 

11.3.13 WebCrawler

WebCrawler inició su servicio de búsqueda en Internet en Abril 20 de 1994. se inició como un proyecto de investigación en la Universidad de Washington. America Online adquirió el Servicio en Marzo de 1995 y se convirtió en su motor de búsqueda preferido hasta Noviembre de 1996.

Posteriormente fué adquirido por Excite, que ha mantenido el servicio en forma independiente.

WebCrawler cuenta con un directorio asociado de sitios clasificados denominado WebCrawler Select.

Visite la página de WebCrawler en: http://www.webcrawler.com

 

c11f13webcrawler.gif (28130 bytes)

Figura 11.14 Página de WebCrawler en el Web

 

11.3.14 Yahoo

Yahoo es quizá uno de los motores de búsqueda que mayor popularidad ha tenido en Internet, y es además uno de los más antiguos, pués opera desde finales de 1994. Su estructura de Directorio, es la más grande y a Diciembre del 97 contaba con más de 750.000 sitios  indexados. 

Yahoo está basado en la remisión de los usuarios por su estructura de Directorios, a diferencia de los Motores de Búsqueda, que hacen un barrido del Web en forma sistemática y van añadiendo nuevos sitios a medida que estos son creados. esto hace que muchos sitios sencillamente no estén incluidos dentro de su catálogo, y es por esto que dependiendo del tipo de búsqueda puede ser preferible intentarla en un Motor de Búsqueda.

Yahoo facilita el utilizar los motores de búsqueda, pués la búsqueda originalmente realizada sobre Yahoo puede ser enviada a uno de los Motores de Búsqueda que Yahoo ofrece como opciones en la parte inferior de de cada página de resultados.

Yahoo también incorpora dentro de sus resultados, resultados tomados de Inktomi. Estos se muestran luego de desplegados los resultados de la búsqueda correspondientes a Yahoo.

La página de Yahoo puede ser visitada en: http://www.yahoo.com

 

c11f14yahoo.gif (28741 bytes)

Figura 11.15 Página de Yahoo en el Web

 

11.4 VISITAS RECOMENDADAS

Beaucoup.com. Ofrece una página en la cual se encuentra una buena recopilación de Sitios de Búsqueda en Internet. A la fecha registra un listado de más de mil doscientos (1.200) sitios relacionados con Motores de Búsqueda, Directorios e Indices. Su página puede ser visitada accesando:  http://www.beaucoup.com/

 

El Detective de Internet. Este es un sitio en el que se encuentra un tutorial en línea sobre los problemas de calidad de la información que se encuentra en Internet.  Se enseñan habilidades para evaluar la calidad de los diferentes recursos accesibles a través del Web.  Es un sitio de interés que se puede visitar en: http://www.netskills.ac.uk/TonicNG/cgi/sesame?detective.

 

 

 

specbar.GIF
Menu2.gif (3690 bytes)
GUIA A LA INTERNET
UNIVERSIDAD PONTIFICIA BOLIVARIANA.
Para comentarios ó preguntas contacte a: Autor Revisado: Diciembre 03, 1998
specbar.GIF