WEB SCRAPING WITH C#
Erick Wendel Gomes da Silva
Software Developer
O QUE É WEB SCRAPING ?
SÓ OS HACKERZÃO !!!!111
DE ACORDO COM O WIKIPEDIA:
É UMA TÉCNICA DE EXTRAÇÃO DE INFORMAÇÕES DE SITE...
ANTES DE COMEÇAR, ALGUMAS VERDADES !!!
WEB SCRAPING É ILEGAL ?
DESDE QUE AS INFORMAÇÕES SEJAM PÚBLICAS, É TOTALMENTE
LEGAL...
DIFICULDADES
Dificilmente um site contém exatamente a mesma estrutura em tudo
(listas, tabelas, etc). Boa parte das vezes,...
E CHEGA DE FALAR !!11
REFERENCIAS
WEB SITE (NADA DE WEB SCRAPING NELE EM !!)
http://erickwendel.com.br
CODIGO FONTE
http://bit.ly/WebScraping-Er...
FIM !!111
Próximos SlideShares
Carregando em…5
×

Mini Curso - WebScraping com C# - Erick Wendel

919 visualizações

Publicada em

Apresentação do curso na Editora Novatec

Publicada em: Tecnologia
0 comentários
0 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

  • Seja a primeira pessoa a gostar disto

Sem downloads
Visualizações
Visualizações totais
919
No SlideShare
0
A partir de incorporações
0
Número de incorporações
238
Ações
Compartilhamentos
0
Downloads
3
Comentários
0
Gostaram
0
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Mini Curso - WebScraping com C# - Erick Wendel

  1. 1. WEB SCRAPING WITH C# Erick Wendel Gomes da Silva Software Developer
  2. 2. O QUE É WEB SCRAPING ? SÓ OS HACKERZÃO !!!!111 DE ACORDO COM O WIKIPEDIA: É UMA TÉCNICA DE EXTRAÇÃO DE INFORMAÇÕES DE SITES A PARTIR DE UM SOFTWARE DE COMPUTADOR. COMO FUNCIONA ? O SOFTWARE SE PASSA POR UM USUÁRIO COMUM, PARA OBTER INFORMAÇÕES MALICIOSAS (OU NÃO) DE FORMA AUTOMATIZADA.
  3. 3. ANTES DE COMEÇAR, ALGUMAS VERDADES !!! WEB SCRAPING É ILEGAL ? DESDE QUE AS INFORMAÇÕES SEJAM PÚBLICAS, É TOTALMENTE LEGAL !! NÃO É EXCLUSIVO DA PLATAFORMA .NET É UMA TÉCNICA ANTIGA, UTILIZADA POR DIVERSAS TECNOLOGIAS. UMA TÉCNICA DE EXTRAÇÃO DE DADOS, MUITO CUIDADO!
  4. 4. DIFICULDADES Dificilmente um site contém exatamente a mesma estrutura em tudo (listas, tabelas, etc). Boa parte das vezes, precisamos de validações para tratar excessões que possam ocorrer no caminho. 2 O desenvolvimento é realizado seguindo como base uma (ou várias) páginas HTML, caso a estrutura do site mudar, você precisará refazer todo o trabalho. 1
  5. 5. E CHEGA DE FALAR !!11
  6. 6. REFERENCIAS WEB SITE (NADA DE WEB SCRAPING NELE EM !!) http://erickwendel.com.br CODIGO FONTE http://bit.ly/WebScraping-Erick HTML AGILITY PACK https://htmlagilitypack.codeplex.com/ LINKEDIN http://linkedin.com/in/erickwendel EMAIL erick.workspace@gmail.com 13/06/2015.
  7. 7. FIM !!111

×