La Deep Web o Internet Profunda es la parte de la web que no es indexada por los motores de búsqueda convencionales y representa alrededor del 80% del contenido total de Internet. Incluye bases de datos, directorios, sitios con contenido dinámico requiriendo una búsqueda, y páginas protegidas con contraseña a las que los motores de búsqueda no pueden acceder. La Deep Web contiene una gran cantidad de información valiosa pero inaccesible para la mayoría de usuarios.
2. DEFINICIÓN DE DEEP WEB
El Web es una entidad compleja que contiene información de diferentes tipo. Es
mucho más que las páginas estáticas, la parte del web no fija, la que está soportada
en server, es decir lo que se suele denominar web dinámico es en realidad la parte
más grande del web. Algunos llaman a esta parte Web invisible, web oculto, o deep
web.
Esta definición es una definición centrada en los buscadores, o mejor dicho en lo
que los buscadores no pueden hacer ya que entran en esta categoría materiales que
no se acceden directamente y que los buscadores no pueden atrapar con los
métodos usuales, porque no son páquinas editadas en HTML.
3. QUE HAY EN LA DEEP WEB
- Guías y listas de teléfonos, e-mail, y todo tipo de directorios;
- "People finders" es decir listas de profesionales de todas la disciplinas;
- Leyes, decretos, en general
información legal, aunque alguna se puede encontrar en web estático;
- Patentes;
- Diccionarios, aunque muchos glosarios se encuentran disponibles, y no nos olvidemos que la Wikipedia tiene un
poco de todo;
- Productos de venta a través de e-commerce;
- Archivos multimedia y gráfico que no tengan la metadata de palabras claves que la identifique en forma clara;
- Sitios de empresas;
- Publicaciones digitales
4. QUE ES LA DEEP WEB
Primero, debemos decir que deep web
significa "Internet profunda" literalmente
traducido al español. Aunque es mucho mas
profundo que eso.
5. D E E P W E B O L A R E D P RO F U N DA
La Deep Web o la Red Profunda, es toda aquella información en sitios web y otros formatos que
no está indexada por los motores de búsquedas convencionales y en ella se esconde el 80% del contenido
real de internet, donde habita información clasificada, páginas olvidadas y hasta actividades delictivas.
Es posible que quienes utilizaron por primera vez el término "navegar" para describir los
desplazamientos que uno hace por Internet, no supieran lo exactos que estaban siendo. Se navega por la
superficie, no por el fondo. Y los motores de búsqueda –encabezados indiscutiblemente por Google - lo
que hacen es eso: barrer la superficie de las aguas, y no el fondo oscuro del mar.
Pero hay algo que se llama Internet profunda, que multiplica astronómicamente a la ya de por sí
astronómica cantidad de páginas a las que se accede mediante los buscadores tradicionales (más de mil
millones y en aumento), haciendo que éstos se vean como la punta de un iceberg insignificante que nunca
habría hecho hundir al Titanic.
6. CAUSAS DE LA DEEP WEB
La principal causa de la existencia de la Internet Profunda es la imposibilidad de los motores
de búsqueda de encontrar o indexar el 100% de la información existente en Internet. Si los
buscadores pudieran acceder a toda la información entonces la “Internet profunda”
desaparecería, pero esto es imposible porque siempre existirán páginas privadas. Los siguiente
son algunos de los motivos por los que los buscadores son incapaces de indexar la Internet
Profunda:
>Páginas protegidas con contraseña
>Bases de datos de bibliotecas y universidades
>Documentos en formatos no indexables (Por ejemplo Pdf, Word)
>Enciclopedias, diccionarios, revistas en las que para acceder a la información hay que interrogar
a la base de datos (Por ejemplo RAE)
7. LA DEEP WEB
"La red rastreable es la punta del iceberg", decía Anand Rajaraman, cofundador de
Kosmix, compañía de motores de búsqueda en la Deep Web (DW), cuyos inversores incluyen nada
menos que a Jeff Bezos, CEO de Amazon.com. Rajaraman parece saber lo que dice, su ejemplo del
iceberg es muy gráfico, elocuente y no menos llamativo. ¿Cómo será posible que todo lo que conocemos
hoy en día en la World Wide Web representa sólo una mínima porción del total de internet?
La Deep Web es la porción no visible de internet, o dicho de una forma simple, son los lugares en
internet donde los motores de búsqueda no pueden indexar: donde Google no llega ni llegará. Por lo
tanto, son "oscuros", de acceso muy limitado.