CRISP-DM: Data Mining e Modelos Preditivos

871 visualizações

Publicada em

CRISP-DM: Data Mining e Modelos Preditivos. Seguimos a metodologia do CRISP-DM para desenvolver uma árvore de decisão aplicada à um problema do website Kaggle.

Publicada em: Dados e análise
0 comentários
1 gostou
Estatísticas
Notas
  • Seja o primeiro a comentar

Sem downloads
Visualizações
Visualizações totais
871
No SlideShare
0
A partir de incorporações
0
Número de incorporações
100
Ações
Compartilhamentos
0
Downloads
0
Comentários
0
Gostaram
1
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

CRISP-DM: Data Mining e Modelos Preditivos

  1. 1. Business Intelligence Prof. Leandro Guerra E-mail: leandro.guerra@artedosdados.com.br @leandro_war artedosdados.com.br CRISP-DM: Data Mining e Modelos Preditivos
  2. 2. 2 R – Visualização de Dados Gephi
  3. 3. 3 Business Intelligence Nível de Maturidade MATURIDADE I N T E L L I G E N C E O que aconteceu? Por quê aconteceu? O que acontecerá? Dashboards Scorecards Relatórios OLAP Queries Ad Hoc Predição Data Mining Relembrar é viver...
  4. 4. 4 Relembrar é viver...Business Intelligence Outputs
  5. 5. 5 Business Intelligence CRISP-DM Ele é constituído de seis etapas • Entendimento do Negócio • Entendimento dos Dados • Preparação dos Dados • Modelagem • Avaliação • Entrega Relembrar é viver...
  6. 6. 6 Kaggle
  7. 7. 7 Kaggle Titanic – Entendimento do Negócio Somos os gerentes da empresa que construiu o Titanic!!!
  8. 8. 8 Kaggle Titanic – Entendimento do Negócio
  9. 9. 9 Kaggle Titanic – Entendimento dos dados
  10. 10. 10 Kaggle Titanic – Preparação dos dados e Modelagem
  11. 11. 11 Kaggle Titanic – Árvore de Decisão 1
  12. 12. 12 Kaggle Titanic – Avaliação 1
  13. 13. 13 É a única forma de fazer? E se nossa etapa de preparação fosse melhor? Kaggle Titanic – Avaliação 1
  14. 14. 14 Kaggle Titanic – Lembrando do Ciclo Repare nas setas duplas ao longo de todo o fluxo!
  15. 15. 15 Kaggle Titanic – Preparação dos dados e Modelagem Loop 2 Será que o tamanho de uma família é um problema? Gephi em ação! E o local de embarque?
  16. 16. 16 Kaggle Titanic – Árvore de Decisão 2 Tamanho da Família Local de Embarque
  17. 17. 17 Conseguimos melhorar? Subimos 2 posições! Kaggle Titanic – Avaliação 2
  18. 18. 18 Kaggle Titanic – Preparação dos dados e Modelagem Loop 3 Será que onde a pessoa estava no navio era importante?
  19. 19. 19 Kaggle Titanic – Árvore de Decisão 3 Localização no navio
  20. 20. 20 Subimos 230 posições! Kaggle Titanic – Avaliação 3
  21. 21. 21 Kaggle Titanic – Preparação dos dados e Modelagem Loop 4 E a forma como uma variável é classificada?
  22. 22. 22 Kaggle Titanic – Árvore de Decisão 4 Nossa variável como categórica
  23. 23. 23 Subimos mais 105 posições! Kaggle Titanic – Avaliação 4 No total, subimos 338 posições!
  24. 24. 24 Business Intelligence

×