Web+Invisible


 * __INTERNET__ :** Es un conjunto de redes interconectadas entre si

La WWW es un servicio que presta Internet que ha ido evolucionando: -Web 1.0, -Web 2.0 -Web 3.0.

Web visible 20 %, Web invisible 80 %.


 * __Web visible__ es un conjunto de Web estática que los usuarios no pueden modificar. NO TIENE RSS, La información no es muy confiable

JavaScript, Flash y Adobe son aplicaciones, No un programa, Debemos tener alguna de estos 3 para que nuestro navegador sea dinámico
 * __Web invisible__ es conjunto de páginas dinámicas, no tienen vínculos entrantes desde otras páginas, SI tiene RSS. Para llegar a la información de este tipo de información necesitamos REGISTRARNOS. (Cuando nosotros nos registramos y colocamos alguna clave, le ponemos HTTPS)

= CLASIFICACIÓN DE LA WEB PROFUNDA: =

La Web es PRIVADA, OPACA, PROPIETARIA Y REALMENTE INVISIBLE

Incluyen formatos como PDF, PostScript, Flash, Shockwave, programas ejecutables y archivos comprimidos. Se generar dinámicamente, a partir de datos que introduce el usuario. Almacenan la información en bases de datos, que no puede ser extraída a menos que se realice una petición específica.
 * Opaca**: Esta compuesta por distintas paginas que están excluidas (por ejemplo cuando entramos a Google las primas paginas son las mas visitadas, en cambio en estas son al azar). Los buscadores indexan en forma periódica. Se limitan a los 200 y 1000 documentos, si bien el número de resultados es mayor. La Web opaca Tiene los URL’s desconectados, los buscadores presentan los resultados en base a la cantidad de referencias o enlaces a los sitios, caso contrario la pagina no será indizada.
 * Privada:** siempre están protegidos con contraseñas, contienen un archivo “robots.txt” para evitar ser indizadas. Contienen un campo “noindex” para evitar que el buscador índice la parte correspondiente al cuerpo de la página.
 * Propietaria**: incluye aquellas páginas en las que es necesario registrarse para tener acceso al contenido, ya sea de forma gratuita o pagada. Se dice que al menos 95% de la Web profunda contiene información de acceso público y gratuito.
 * Realmente invisible**: las páginas no son indizadas por las sig. Razones:

= ¿Cómo buscar en la Web invisible? =
 * Los buscadores tradicionales han añadido funcionalidades adicionales para la búsqueda en la llamada Web profunda.
 * También existen buscadores especializados en ese segmento de la Web, que no solo busca en la Web superficial, sino también en la Web Invisible.

__Forman parte de la Web profunda:__ -Las bibliotecas: digitales, catálogos de bibliotecas, bases de datos de bibliotecas, bases de datos bibliograficas. -Bases de datos. -Revistas electrónicas y archivos de documentos. -Documentos en formatos no indizables, (pdf, ppt, doc, mp3, wav, avi, mpeg, etc.) -Catálogos de editoriales, Directorios de Publicaciones periódicas. -Archivos. -Repositorios de artículos de revistas, tesis y literatura gris. -Directorios de bases de datos. -Guías de sitios, Revistas electrónicas, Obras de referencia: enciclopedias, Diccionarios, tesauros, etc. -Foro, blogs, noticias (diarios). -Sitios de remates, Páginas blancas/amarillas, Directorios. -Revistas electrónicas, en las que es necesario un registro previo y las que solo se puede recuperar la información mediante búsquedas en su base de daros. -Organismos públicos de gobierno, ONGs, etc., que en sus sitios de Web disponen de consultas a sus bases de datos.

__El Archivo de Internet__
 * Asume el reto de preservar al pasado de Internet.
 * La mayor parte de la información que contiene es estadounidense.
 * Se ingresa a través del sitio: www.archive.org/index.php
 * De sus secciones se destaca Wayback MAchine, que contiene miles de millones de páginas, grabadas desde 1996