SlideShare uma empresa Scribd logo
INVISIBLE WEB



                Noilson Caio T. de Araújo
                    caiogore@gmail.com
CONSIDERAÇÕES INICIAIS




            SEGURANÇA


           PRIVACIDADE


            APOLOGIA
INTRODUÇÃO




Existem vários repositórios de informações que
os motores de buscas não conseguem enxergar,
ou seja, diferente das páginas convencionais e
visíveis, a invisible web, termo dado a este tipo
de prática, tem sua base de dados inacessível
aos softwares que criam os índices dos motores
de busca.
A PAISAGEM DE DADOS
ESTRUTURADOS


Unstructured queries precisas para o motor de busca.
      Consultas mais


                 Estas tarefas são mais
           ambiciosas que o conjunto anterior.
                 Single-page structured queries


Os usuários colocam consultas (palavra-chave) e obtem uma
      lista de URLs de páginas web como resultado.
                                            Multi-page structured queries
EXEMPLOS
PARA DEEP WEB




     Os dados são claramente úteis para
unstructured queries e single-page structured
queries, que retornam URL's como resultados.
ORGANIZAÇÃO




 O conteúdo dessa zona se caracteriza por não
    ser indexado, não existem ligações/links
externos, protegido por senha ou criptografado,
          scripts e conteúdo não HTML.
ORGANIZAÇÃO




Quando estes sites são consultados, o retorno é
 de forma de páginas web dinâmicas que tem
  um endereço único que permitem que eles
sejam recuperados mais tarde, porém não são
                 persistentes.
The Onion Routing




              Onion Router

              Onion Proxy
CASOS
.onion


 pseudo-top-level
  domain
 anonymous hidden
  service
 onion TLD is not in
  the Internet DNS
  root
 tor2web
OpDarknet Official Release -- 10/30/2011 -
Pedo hunt trophies, Bear Rugs for Mike Perry


    Lolita City and Freedom Hosting;
    30 hours;
    To our shock, the community of pedos
     were able to quickly regroup and rebuild
     Lolita City and Freedom Hosting within a
     week;
    True identity of the builder and architect
     of Freedom Hosting;
     What we found was truly shocking, it
     was the deeds to a California, USA
     'shell' company for 12 Tor Exit Nodes
     named Formless Networking LLC.
WTF?
"Mike Perry"


   Freedom Networking LLC has the Apache
    backend.
   Freedom Hosting server has ngnix front cache
    to proxy a backend Apache with PHP safemode
    on...
   Tor Security expert who fixed hidden service IP
    enumeration bugs
   Freedom Server has as business IP internal NAT
    of 10.0.1.X
   Mike Perry run's 12 Tor exit nodes under a shell
    company under Formless Networking LLC
Demonstração com o Free Net Project
Links

   http://www.onion-router.net/
   http://freenetproject.org
   http://ncaio.ithub.com.br/2011/07/18/introducao-a-invisible-web/
   http://pastebin.com/u/opdarknet
   http://www.fscked.org
   http://www.taxninja.com/


Mais conteúdo relacionado

Destaque

Sesion 4
Sesion 4Sesion 4
Sesion 4
vegaramirez
 
Tablas y graficos estadisticos
Tablas y graficos estadisticosTablas y graficos estadisticos
Tablas y graficos estadisticos
karimruth
 
Presentation1
Presentation1Presentation1
Presentation1
Varuni Sankaran Nair
 
Expectativas-H203
Expectativas-H203Expectativas-H203
Expectativas-H203
Vane Cinthya
 
El agua
El aguaEl agua
Tecno Mundos S.A.
Tecno Mundos S.A.Tecno Mundos S.A.
Tecno Mundos S.A.
Camila_Yaya99
 
Guia de pronunciación
Guia de pronunciaciónGuia de pronunciación
Guia de pronunciación
Bobby_mattes3
 
Cuidados del agua
Cuidados del aguaCuidados del agua
Cuidados del agua
Angela Mogollón
 
Ronaldo FicherBozza P01295
Ronaldo FicherBozza P01295Ronaldo FicherBozza P01295
Ronaldo FicherBozza P01295
ronibozza
 
Constancias y certificados.
Constancias y certificados.Constancias y certificados.
Constancias y certificados.
Camila_Yaya99
 
Aprendizaje colaborativo
Aprendizaje colaborativoAprendizaje colaborativo
Aprendizaje colaborativo
Annya07
 
Curso la web 2 presentación power point
Curso la web 2 presentación power pointCurso la web 2 presentación power point
Curso la web 2 presentación power point
leticiasaezcurso20
 
Bloc notas -carpeta con contraseña
Bloc notas -carpeta con contraseñaBloc notas -carpeta con contraseña
Bloc notas -carpeta con contraseña
liseth8
 
Class Exercise1-Image size
Class Exercise1-Image sizeClass Exercise1-Image size
Class Exercise1-Image sizeSlushieNyappy
 
Uma etica crista_para_a_vida_pos_moderna
Uma etica crista_para_a_vida_pos_modernaUma etica crista_para_a_vida_pos_moderna
Uma etica crista_para_a_vida_pos_moderna
Franciéllen de Barros
 
Qué es excel
Qué es excelQué es excel
Qué es excel
lokomoniaco
 
SEMINÁRIO ABMES - Avaliação dos cursos de Direito no Brasil: atual conjuntura...
SEMINÁRIO ABMES - Avaliação dos cursos de Direito no Brasil: atual conjuntura...SEMINÁRIO ABMES - Avaliação dos cursos de Direito no Brasil: atual conjuntura...
SEMINÁRIO ABMES - Avaliação dos cursos de Direito no Brasil: atual conjuntura...
Associação Brasileira de Mantenedoras de Ensino Superior
 
Canal Lanza Yomvi Play, Un Aspirante A Convertirse En El Netflix De España
Canal Lanza Yomvi Play, Un Aspirante A Convertirse En El Netflix De España
Canal Lanza Yomvi Play, Un Aspirante A Convertirse En El Netflix De España
Canal Lanza Yomvi Play, Un Aspirante A Convertirse En El Netflix De España
functionalhitch28
 
2016 Intro Deck
2016 Intro Deck2016 Intro Deck
2016 Intro Deck
Roxanna Leonardo
 
Genoma Humano.
Genoma Humano.Genoma Humano.
Genoma Humano.
19951217
 

Destaque (20)

Sesion 4
Sesion 4Sesion 4
Sesion 4
 
Tablas y graficos estadisticos
Tablas y graficos estadisticosTablas y graficos estadisticos
Tablas y graficos estadisticos
 
Presentation1
Presentation1Presentation1
Presentation1
 
Expectativas-H203
Expectativas-H203Expectativas-H203
Expectativas-H203
 
El agua
El aguaEl agua
El agua
 
Tecno Mundos S.A.
Tecno Mundos S.A.Tecno Mundos S.A.
Tecno Mundos S.A.
 
Guia de pronunciación
Guia de pronunciaciónGuia de pronunciación
Guia de pronunciación
 
Cuidados del agua
Cuidados del aguaCuidados del agua
Cuidados del agua
 
Ronaldo FicherBozza P01295
Ronaldo FicherBozza P01295Ronaldo FicherBozza P01295
Ronaldo FicherBozza P01295
 
Constancias y certificados.
Constancias y certificados.Constancias y certificados.
Constancias y certificados.
 
Aprendizaje colaborativo
Aprendizaje colaborativoAprendizaje colaborativo
Aprendizaje colaborativo
 
Curso la web 2 presentación power point
Curso la web 2 presentación power pointCurso la web 2 presentación power point
Curso la web 2 presentación power point
 
Bloc notas -carpeta con contraseña
Bloc notas -carpeta con contraseñaBloc notas -carpeta con contraseña
Bloc notas -carpeta con contraseña
 
Class Exercise1-Image size
Class Exercise1-Image sizeClass Exercise1-Image size
Class Exercise1-Image size
 
Uma etica crista_para_a_vida_pos_moderna
Uma etica crista_para_a_vida_pos_modernaUma etica crista_para_a_vida_pos_moderna
Uma etica crista_para_a_vida_pos_moderna
 
Qué es excel
Qué es excelQué es excel
Qué es excel
 
SEMINÁRIO ABMES - Avaliação dos cursos de Direito no Brasil: atual conjuntura...
SEMINÁRIO ABMES - Avaliação dos cursos de Direito no Brasil: atual conjuntura...SEMINÁRIO ABMES - Avaliação dos cursos de Direito no Brasil: atual conjuntura...
SEMINÁRIO ABMES - Avaliação dos cursos de Direito no Brasil: atual conjuntura...
 
Canal Lanza Yomvi Play, Un Aspirante A Convertirse En El Netflix De España
Canal Lanza Yomvi Play, Un Aspirante A Convertirse En El Netflix De España
Canal Lanza Yomvi Play, Un Aspirante A Convertirse En El Netflix De España
Canal Lanza Yomvi Play, Un Aspirante A Convertirse En El Netflix De España
 
2016 Intro Deck
2016 Intro Deck2016 Intro Deck
2016 Intro Deck
 
Genoma Humano.
Genoma Humano.Genoma Humano.
Genoma Humano.
 

Semelhante a Introduction to the invisible web

Do Gopher, Web Crawler, Google, pagerank, sitemaps, ontologia, ao Big Data, W...
Do Gopher, Web Crawler, Google, pagerank, sitemaps, ontologia, ao Big Data, W...Do Gopher, Web Crawler, Google, pagerank, sitemaps, ontologia, ao Big Data, W...
Do Gopher, Web Crawler, Google, pagerank, sitemaps, ontologia, ao Big Data, W...
Leandro Borges
 
Como um grande sistema REST funciona - arquitetura e desempenho
Como um grande sistema REST funciona - arquitetura e desempenhoComo um grande sistema REST funciona - arquitetura e desempenho
Como um grande sistema REST funciona - arquitetura e desempenho
David Robert Camargo de Campos
 
Como um verdadeiro sistema REST funciona: arquitetura e performance na Abril
Como um verdadeiro sistema REST funciona: arquitetura e performance na AbrilComo um verdadeiro sistema REST funciona: arquitetura e performance na Abril
Como um verdadeiro sistema REST funciona: arquitetura e performance na Abril
Luis Cipriani
 
Alexandria: um Sistema de Sistemas para Publicação de Conteúdo Digital utiliz...
Alexandria: um Sistema de Sistemas para Publicação de Conteúdo Digital utiliz...Alexandria: um Sistema de Sistemas para Publicação de Conteúdo Digital utiliz...
Alexandria: um Sistema de Sistemas para Publicação de Conteúdo Digital utiliz...
Luis Cipriani
 
Web_2.0 Web Standards Web Semântica
Web_2.0 Web Standards Web SemânticaWeb_2.0 Web Standards Web Semântica
Web_2.0 Web Standards Web Semântica
Crystiam Pereira E Silva
 
Copy of trabalho de redes
Copy of trabalho de redesCopy of trabalho de redes
Copy of trabalho de redes
ticinformaticauff
 
Web 1.0 x 2.0
Web 1.0 x 2.0Web 1.0 x 2.0
Web 1.0 x 2.0
guest2ededb
 
A Internet E Os Motores De Busca
A Internet E Os Motores De BuscaA Internet E Os Motores De Busca
A Internet E Os Motores De Busca
Police Force - GNR
 
ficha de trabalho Tatiana.pptx
ficha de trabalho Tatiana.pptxficha de trabalho Tatiana.pptx
ficha de trabalho Tatiana.pptx
Filipe Mendonça
 
Internet e Web NÃO SÃO as mesmas coisas
Internet e Web NÃO SÃO as mesmas coisasInternet e Web NÃO SÃO as mesmas coisas
Internet e Web NÃO SÃO as mesmas coisas
Escola de Governança da Internet no Brasil
 
Road Show TI SENAC - Web Semântica - Pessoas e Máquinas Pensando Juntas - SEN...
Road Show TI SENAC - Web Semântica - Pessoas e Máquinas Pensando Juntas - SEN...Road Show TI SENAC - Web Semântica - Pessoas e Máquinas Pensando Juntas - SEN...
Road Show TI SENAC - Web Semântica - Pessoas e Máquinas Pensando Juntas - SEN...
Renato Bongiorno Bonfanti
 
Apresentação Mario Costa
Apresentação Mario CostaApresentação Mario Costa
Apresentação Mario Costa
lossio
 
Web Crawlers
Web CrawlersWeb Crawlers
Web Crawlers
Alberto Trindade
 
Arquitetura de Informação - Aulas 04 e 05
Arquitetura de Informação - Aulas 04 e 05Arquitetura de Informação - Aulas 04 e 05
Arquitetura de Informação - Aulas 04 e 05
vincevader
 
Seo
SeoSeo
Seo
Bya5
 
Ebook Apache Server: Guia Introdutório
Ebook Apache Server: Guia IntrodutórioEbook Apache Server: Guia Introdutório
Ebook Apache Server: Guia Introdutório
Fernando Palma
 
Tudo que Você Precisa Saber para Hackear o Google
Tudo que Você Precisa Saber para Hackear o GoogleTudo que Você Precisa Saber para Hackear o Google
Tudo que Você Precisa Saber para Hackear o Google
Felipe Bazon
 
Apresentando web 1.0
Apresentando web 1.0Apresentando web 1.0
Apresentando web 1.0
Sarah Menezes
 
Monografia Web 2.0
Monografia Web 2.0Monografia Web 2.0
Monografia Web 2.0
Crystiam Pereira E Silva
 
WordPress: De blogs pessoais a grandes portais - Parte 1
WordPress: De blogs pessoais a grandes portais - Parte 1WordPress: De blogs pessoais a grandes portais - Parte 1
WordPress: De blogs pessoais a grandes portais - Parte 1
Giancarlo Silva
 

Semelhante a Introduction to the invisible web (20)

Do Gopher, Web Crawler, Google, pagerank, sitemaps, ontologia, ao Big Data, W...
Do Gopher, Web Crawler, Google, pagerank, sitemaps, ontologia, ao Big Data, W...Do Gopher, Web Crawler, Google, pagerank, sitemaps, ontologia, ao Big Data, W...
Do Gopher, Web Crawler, Google, pagerank, sitemaps, ontologia, ao Big Data, W...
 
Como um grande sistema REST funciona - arquitetura e desempenho
Como um grande sistema REST funciona - arquitetura e desempenhoComo um grande sistema REST funciona - arquitetura e desempenho
Como um grande sistema REST funciona - arquitetura e desempenho
 
Como um verdadeiro sistema REST funciona: arquitetura e performance na Abril
Como um verdadeiro sistema REST funciona: arquitetura e performance na AbrilComo um verdadeiro sistema REST funciona: arquitetura e performance na Abril
Como um verdadeiro sistema REST funciona: arquitetura e performance na Abril
 
Alexandria: um Sistema de Sistemas para Publicação de Conteúdo Digital utiliz...
Alexandria: um Sistema de Sistemas para Publicação de Conteúdo Digital utiliz...Alexandria: um Sistema de Sistemas para Publicação de Conteúdo Digital utiliz...
Alexandria: um Sistema de Sistemas para Publicação de Conteúdo Digital utiliz...
 
Web_2.0 Web Standards Web Semântica
Web_2.0 Web Standards Web SemânticaWeb_2.0 Web Standards Web Semântica
Web_2.0 Web Standards Web Semântica
 
Copy of trabalho de redes
Copy of trabalho de redesCopy of trabalho de redes
Copy of trabalho de redes
 
Web 1.0 x 2.0
Web 1.0 x 2.0Web 1.0 x 2.0
Web 1.0 x 2.0
 
A Internet E Os Motores De Busca
A Internet E Os Motores De BuscaA Internet E Os Motores De Busca
A Internet E Os Motores De Busca
 
ficha de trabalho Tatiana.pptx
ficha de trabalho Tatiana.pptxficha de trabalho Tatiana.pptx
ficha de trabalho Tatiana.pptx
 
Internet e Web NÃO SÃO as mesmas coisas
Internet e Web NÃO SÃO as mesmas coisasInternet e Web NÃO SÃO as mesmas coisas
Internet e Web NÃO SÃO as mesmas coisas
 
Road Show TI SENAC - Web Semântica - Pessoas e Máquinas Pensando Juntas - SEN...
Road Show TI SENAC - Web Semântica - Pessoas e Máquinas Pensando Juntas - SEN...Road Show TI SENAC - Web Semântica - Pessoas e Máquinas Pensando Juntas - SEN...
Road Show TI SENAC - Web Semântica - Pessoas e Máquinas Pensando Juntas - SEN...
 
Apresentação Mario Costa
Apresentação Mario CostaApresentação Mario Costa
Apresentação Mario Costa
 
Web Crawlers
Web CrawlersWeb Crawlers
Web Crawlers
 
Arquitetura de Informação - Aulas 04 e 05
Arquitetura de Informação - Aulas 04 e 05Arquitetura de Informação - Aulas 04 e 05
Arquitetura de Informação - Aulas 04 e 05
 
Seo
SeoSeo
Seo
 
Ebook Apache Server: Guia Introdutório
Ebook Apache Server: Guia IntrodutórioEbook Apache Server: Guia Introdutório
Ebook Apache Server: Guia Introdutório
 
Tudo que Você Precisa Saber para Hackear o Google
Tudo que Você Precisa Saber para Hackear o GoogleTudo que Você Precisa Saber para Hackear o Google
Tudo que Você Precisa Saber para Hackear o Google
 
Apresentando web 1.0
Apresentando web 1.0Apresentando web 1.0
Apresentando web 1.0
 
Monografia Web 2.0
Monografia Web 2.0Monografia Web 2.0
Monografia Web 2.0
 
WordPress: De blogs pessoais a grandes portais - Parte 1
WordPress: De blogs pessoais a grandes portais - Parte 1WordPress: De blogs pessoais a grandes portais - Parte 1
WordPress: De blogs pessoais a grandes portais - Parte 1
 

Introduction to the invisible web

  • 1. INVISIBLE WEB Noilson Caio T. de Araújo caiogore@gmail.com
  • 2. CONSIDERAÇÕES INICIAIS SEGURANÇA PRIVACIDADE APOLOGIA
  • 3. INTRODUÇÃO Existem vários repositórios de informações que os motores de buscas não conseguem enxergar, ou seja, diferente das páginas convencionais e visíveis, a invisible web, termo dado a este tipo de prática, tem sua base de dados inacessível aos softwares que criam os índices dos motores de busca.
  • 4. A PAISAGEM DE DADOS ESTRUTURADOS Unstructured queries precisas para o motor de busca. Consultas mais Estas tarefas são mais ambiciosas que o conjunto anterior. Single-page structured queries Os usuários colocam consultas (palavra-chave) e obtem uma lista de URLs de páginas web como resultado. Multi-page structured queries
  • 6. PARA DEEP WEB Os dados são claramente úteis para unstructured queries e single-page structured queries, que retornam URL's como resultados.
  • 7. ORGANIZAÇÃO O conteúdo dessa zona se caracteriza por não ser indexado, não existem ligações/links externos, protegido por senha ou criptografado, scripts e conteúdo não HTML.
  • 8. ORGANIZAÇÃO Quando estes sites são consultados, o retorno é de forma de páginas web dinâmicas que tem um endereço único que permitem que eles sejam recuperados mais tarde, porém não são persistentes.
  • 9. The Onion Routing Onion Router Onion Proxy
  • 10. CASOS
  • 11. .onion  pseudo-top-level domain  anonymous hidden service  onion TLD is not in the Internet DNS root  tor2web
  • 12. OpDarknet Official Release -- 10/30/2011 - Pedo hunt trophies, Bear Rugs for Mike Perry  Lolita City and Freedom Hosting;  30 hours;  To our shock, the community of pedos were able to quickly regroup and rebuild Lolita City and Freedom Hosting within a week;  True identity of the builder and architect of Freedom Hosting;  What we found was truly shocking, it was the deeds to a California, USA 'shell' company for 12 Tor Exit Nodes named Formless Networking LLC.
  • 13. WTF?
  • 14. "Mike Perry"  Freedom Networking LLC has the Apache backend.  Freedom Hosting server has ngnix front cache to proxy a backend Apache with PHP safemode on...  Tor Security expert who fixed hidden service IP enumeration bugs  Freedom Server has as business IP internal NAT of 10.0.1.X  Mike Perry run's 12 Tor exit nodes under a shell company under Formless Networking LLC
  • 15. Demonstração com o Free Net Project
  • 16. Links  http://www.onion-router.net/  http://freenetproject.org  http://ncaio.ithub.com.br/2011/07/18/introducao-a-invisible-web/  http://pastebin.com/u/opdarknet  http://www.fscked.org  http://www.taxninja.com/ 

Notas do Editor

  1. Consultas não estruturadas: Estas tarefas são idênticos aos modo atual popular de busca de informações sobre o Web. Os usuários colocam consultas palavra-chave e obter uma lista de URLs para páginas web como o resultado. O objetivo aqui é garantir que páginas web que contêm dados estruturados obter classificação ade- priately alta na lista de resultados. Uma variante desta tarefa é a busca de coleções de dados estruturados (ie, páginas retorno que contêm tabelas HTML ou mashups). Essa busca pode ser invocado quando se está a recolher dados para um mashup ou realizar um estudo mais detalhado de um fenômeno. Uma única página consultas estruturadas: Nestas tarefas que colocam consultas mais precisas para o motor de busca. Podemos representar -los usando uma interface que permite que os usuários enviem mais consultas estruturadas (por exemplo, em busca de empregos, carros ou casas), ou esperar que o mecanismo subjacente para analisar uma consulta palavra-chave e reconhecer a sua estrutura (por exemplo, identificar na consulta "france população "que a França é um país e da população é um propriedade dos países). Existem dois tipos de respostas que pode esperar. A primeira é a resposta precisa (por exemplo, o real número para a população da França). A segunda é uma página que contém a resposta precisa (por exemplo, a página da Wikipedia na França), mas o usuário precisa ler a página de encontrar a resposta. Multi-page consultas estruturadas: Estas tarefas são mais ambicioso do que o conjunto anterior. Aqui esperamos que a pesquisa motor para encontrar respostas que são obtidas por combinação (por exemplo, dados através de uma associação ou sindicato) de múltiplos estruturados (ou un- estruturados) fontes na web. Por exemplo, gostaríamos para combinar dados de Internet Movie Database e web sites com filme jogando vezes para encontrar locais de vezes jogar filmes dirigidos por Woody Allen [10]. Note que o usuário não precisa estar ciente de que as respostas foram obtidas por com- nando os dados de várias páginas.
  2. * Estado morto
  3. Onion Router c Onion router é um nó da rede sobreposta que aceita conexões de usuários, criptografa e redireciona o tráfego para outros nós ou para o destino original. Cada onion router mantém uma conexão TLS [5] para todos os outros e duas chaves, uma usada para assinar os certificados da conexão TLS e outra para decriptar pedidos de comunicação dos onion proxies. O último nó do túnel é chamado de nó de saída, é este que decripta a mensagem em seu conteúdo original e a envia para o destino final. Onion Proxy O onion proxy é o software executado pelo usuário que deseja utilizar a rede Tor. Este sistema é capaz de construir os circuitos virtuais, gerenciar as conexões com os onion routers e multiplexar as conexões TCP que ele recebe dos aplicativos pelos circuitos.
  4. Canibal de Rotenburg
  5. What we found was troublesome, a "tax" lawyer with no CPA and a degree in "Social History and Japanese Language" from Carnegie Mellon? So we decided to do a little call to this "tax" lawyer.
  6. 1) Freedom Networking LLC has the Apache backend. 2) Freedom Hosting server has ngnix front cache to proxy a backend Apache with PHP safemode on... 3) Tor Security expert who fixed hidden service IP enumeration bugs 4) Freedom Server has as business IP internal NAT of 10.0.1.X 5) Mike Perry quit Riverbed Technology for Tor in 2008 and Freedom Hosting has a copyright of 2008. (Src: http://fscked.org/blog/farewell-riverbed-so-long-and-thanks-all-bits) and (http://s1.postimage.org/k8gmi740d/freedom.png) 6) Mike Perry run's 12 Tor exit nodes under a shell company under Formless Networking LLC 7) Formless Networking LLC has a "tax" attorney with no CPA 8) Mike Perry designed Tor Button and is a major contributor to Tor Hidden Node design: https://www.blackhat.com/presentations/bh-usa-07/Perry/Whitepaper/bh-usa-07-perry-WP.pdf 9) Mike Perry has stated on his personal website "For the past three or four years now I've led something of a double life"