Business Intelligence
Prof. Leandro Guerra
E-mail: leandro.guerra@artedosdados.com.br
@leandro_war
artedosdados.com.br
CRI...
2
R – Visualização de
Dados
Gephi
3
Business Intelligence
Nível de Maturidade
MATURIDADE
I
N
T
E
L
L
I
G
E
N
C
E
O que
aconteceu?
Por quê
aconteceu?
O que
a...
4
Relembrar é viver...Business Intelligence
Outputs
5
Business Intelligence
CRISP-DM
Ele é constituído de seis etapas
• Entendimento do Negócio
• Entendimento dos Dados
• Pre...
6
Kaggle
7
Kaggle
Titanic – Entendimento do Negócio
Somos os gerentes da empresa que construiu o Titanic!!!
8
Kaggle
Titanic – Entendimento do Negócio
9
Kaggle
Titanic – Entendimento dos dados
10
Kaggle
Titanic – Preparação dos dados e Modelagem
11
Kaggle
Titanic – Árvore de Decisão 1
12
Kaggle
Titanic – Avaliação 1
13
É a única forma de fazer?
E se nossa etapa de preparação fosse melhor?
Kaggle
Titanic – Avaliação 1
14
Kaggle
Titanic – Lembrando do Ciclo
Repare nas setas duplas ao
longo de todo o fluxo!
15
Kaggle
Titanic – Preparação dos dados e Modelagem
Loop 2
Será que o tamanho de uma
família é um problema?
Gephi em ação...
16
Kaggle
Titanic – Árvore de Decisão 2
Tamanho da Família
Local de Embarque
17
Conseguimos melhorar?
Subimos
2
posições!
Kaggle
Titanic – Avaliação 2
18
Kaggle
Titanic – Preparação dos dados e Modelagem
Loop 3
Será que onde a pessoa estava
no navio era importante?
19
Kaggle
Titanic – Árvore de Decisão 3
Localização no navio
20
Subimos 230 posições!
Kaggle
Titanic – Avaliação 3
21
Kaggle
Titanic – Preparação dos dados e Modelagem
Loop 4
E a forma como uma variável é
classificada?
22
Kaggle
Titanic – Árvore de Decisão 4
Nossa variável
como categórica
23
Subimos mais 105 posições!
Kaggle
Titanic – Avaliação 4
No total, subimos 338 posições!
24
Business Intelligence
Próximos SlideShares
Carregando em…5
×

CRISP-DM: Data Mining e Modelos Preditivos

815 visualizações

Publicada em

CRISP-DM: Data Mining e Modelos Preditivos. Seguimos a metodologia do CRISP-DM para desenvolver uma árvore de decisão aplicada à um problema do website Kaggle.

Publicada em: Dados e análise
0 comentários
1 gostou
Estatísticas
Notas
  • Seja o primeiro a comentar

Sem downloads
Visualizações
Visualizações totais
815
No SlideShare
0
A partir de incorporações
0
Número de incorporações
100
Ações
Compartilhamentos
0
Downloads
0
Comentários
0
Gostaram
1
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

CRISP-DM: Data Mining e Modelos Preditivos

  1. 1. Business Intelligence Prof. Leandro Guerra E-mail: leandro.guerra@artedosdados.com.br @leandro_war artedosdados.com.br CRISP-DM: Data Mining e Modelos Preditivos
  2. 2. 2 R – Visualização de Dados Gephi
  3. 3. 3 Business Intelligence Nível de Maturidade MATURIDADE I N T E L L I G E N C E O que aconteceu? Por quê aconteceu? O que acontecerá? Dashboards Scorecards Relatórios OLAP Queries Ad Hoc Predição Data Mining Relembrar é viver...
  4. 4. 4 Relembrar é viver...Business Intelligence Outputs
  5. 5. 5 Business Intelligence CRISP-DM Ele é constituído de seis etapas • Entendimento do Negócio • Entendimento dos Dados • Preparação dos Dados • Modelagem • Avaliação • Entrega Relembrar é viver...
  6. 6. 6 Kaggle
  7. 7. 7 Kaggle Titanic – Entendimento do Negócio Somos os gerentes da empresa que construiu o Titanic!!!
  8. 8. 8 Kaggle Titanic – Entendimento do Negócio
  9. 9. 9 Kaggle Titanic – Entendimento dos dados
  10. 10. 10 Kaggle Titanic – Preparação dos dados e Modelagem
  11. 11. 11 Kaggle Titanic – Árvore de Decisão 1
  12. 12. 12 Kaggle Titanic – Avaliação 1
  13. 13. 13 É a única forma de fazer? E se nossa etapa de preparação fosse melhor? Kaggle Titanic – Avaliação 1
  14. 14. 14 Kaggle Titanic – Lembrando do Ciclo Repare nas setas duplas ao longo de todo o fluxo!
  15. 15. 15 Kaggle Titanic – Preparação dos dados e Modelagem Loop 2 Será que o tamanho de uma família é um problema? Gephi em ação! E o local de embarque?
  16. 16. 16 Kaggle Titanic – Árvore de Decisão 2 Tamanho da Família Local de Embarque
  17. 17. 17 Conseguimos melhorar? Subimos 2 posições! Kaggle Titanic – Avaliação 2
  18. 18. 18 Kaggle Titanic – Preparação dos dados e Modelagem Loop 3 Será que onde a pessoa estava no navio era importante?
  19. 19. 19 Kaggle Titanic – Árvore de Decisão 3 Localização no navio
  20. 20. 20 Subimos 230 posições! Kaggle Titanic – Avaliação 3
  21. 21. 21 Kaggle Titanic – Preparação dos dados e Modelagem Loop 4 E a forma como uma variável é classificada?
  22. 22. 22 Kaggle Titanic – Árvore de Decisão 4 Nossa variável como categórica
  23. 23. 23 Subimos mais 105 posições! Kaggle Titanic – Avaliação 4 No total, subimos 338 posições!
  24. 24. 24 Business Intelligence

×