Page  1
Luis Paulo Vieira Braga
lpbraga@geologia.ufrj.br
Page  2
Conceitos
Técnicas
Casos
Recursos
Page  3
Page  4
Daniel Souza da Silva
João Gabriel Domingues
Julia Vidal Ribeiro
Paloma da Silva Borba
Rafael Celestino dos Santos
Page  5
Page  6
Data Mining Cookbook, Rud O.P. , Wiley
Page  7
INTRODUÇÃO
Page  8
INTRODUÇÃO
Page  9
INTRODUÇÃO
Page  10
INTRODUÇÃO
Page  11
INTRODUÇÃO
Page  12
INTRODUÇÃO
Page  13
DESCOBERTA DE CONHECIMENTO EM BANCOS
DE DADOS (KDD) E MINERAÇÃO DE DADOS (DM)
Page  14
DESCOBERTA DE CONHECIMENTO EM BANCOS DE
DADOS (KDD) E MINERAÇÃO DE DADOS (DM)
Dados Dados Dados
Pré- Transformados
Processados
Previsão
Classificação
Page  15
DESCOBERTA DE CONHECIMENTO EM BANCOS
DE DADOS (KDD) E MINERAÇÃO DE DADOS (DM)
Page  16
DESCOBERTA DE CONHECIMENTO EM BANCOS
DE DADOS (KDD) E MINERAÇÃO DE DADOS (DM)
Exemplo das
sete etapas em
uma aplicação
destinada a
uma campanha
de vendas de
CDB´s de um
Banco que tem
1.400.000
clientes
pessoas
físicas.
Page  17
BANCOS DE DADOS PARA DM, DATA WARE HOUSE(
Page  18
BANCOS DE DADOS PARA DM, DATA WARE HOUSE
www.jeunesse.com.br
Page  19
BANCOS DE DADOS PARA DM, DATA WARE HOUSE
Page  20
BANCOS DE DADOS PARA DM, DATA WARE HOUSE
Page  21
BANCOS DE DADOS PARA DM, DATA WARE HOUSE
Introducción a la minería de datos, Orallo;
Quintana e Ramirez, Prentice Hall
Page  22
BANCOS DE DADOS PARA DM, DATA WARE HOUSE
Introducción a la minería de datos, Orallo;
Quintana e Ramirez, Prentice Hall
Page  23
BANCOS DE DADOS PARA DM, DATA WARE HOUSE
Introducción a la minería de datos, Orallo;
Quintana e Ramirez, Prentice Hall
Page  24
BANCOS DE DADOS PARA DM, DATA WARE HOUSE
Introducción a la minería de datos, Orallo;
Quintana e Ramirez, Prentice Hall
Page  25
BANCOS DE DADOS PARA DM, DATA WARE HOUSE
Introducción a la minería de datos, Orallo;
Quintana e Ramirez, Prentice Hall
Page  26
BANCOS DE DADOS PARA DM, DATA WARE HOUSE
Page  27
BANCOS DE DADOS PARA DM, DATA WARE HOUSE
Big
Data
Page  28
TRATAMENTO DE DADOS PARA DM
Page  29
TRATAMENTO DE DADOS PARA DM
Page  30
TRATAMENTO DE DADOS PARA DM
Page  31
TRATAMENTO DE DADOS PARA DM
Page  32
TRATAMENTO DE DADOS PARA DM
Page  33
(ALGUMAS) TÉCNICAS PARA DM
Introducción a la Mineria de Datos, Orallo ; Quintana; Ramirez
Prentice Hall
Denominação Preditivo Descritivo
Classificação Predição Agrupamento Associação
Regressão x
Regressão Logística x
Função Discriminante x
Árvores de classificação x
Análise de associação x
Naive Bayes x
Kmeans x
Redes Neurais (MLP) x x
Page  34
TÉCNICAS PARA DM
Introdução à Mineração de Dados
Braga e-papers
Page  35
TÉCNICAS PARA DM
Introdução à Mineração de Dados
Braga e-papers
Page  36
TÉCNICAS PARA DM
X2
A B
xx
xxxxxx +++
x xxxx++++
xxxx ++++
A´
X1
B´
Função discriminante Y
Page  37
TÉCNICAS PARA DM
Page  38
TÉCNICAS PARA DM
Page  39
TÉCNICAS PARA DM
Page  40
TÉCNICAS PARA DM
NAIVE BAYES
A solução mais comum é através do
método de máxima verossimilhança
Page  41
TÉCNICAS PARA DM
REDES BAYESIANAS E CLASSIFICADORES BAYESIANOS
Page  42
TÉCNICAS PARA DM
Page  43
TÉCNICAS PARA DM
Page  44
TÉCNICAS PARA DM
Page  45
TÉCNICAS PARA DM
Page  46
TÉCNICAS PARA DM
OBTENÇÃO DE SUPORTES POR DIMENSÃO
Page  47
TÉCNICAS PARA DM
Page  48
TÉCNICAS PARA DM
Page  49
TÉCNICAS PARA DM
CÁLCULO DA CONFIANÇA DE UMA REGRA p(B|A)
Page  50
TÉCNICAS PARA DM
Page  51
TÉCNICAS PARA DM
Page  52
TÉCNICAS PARA DM
Page  53
TÉCNICAS PARA DM
Page  54
TÉCNICAS PARA DM
Page  55
TÉCNICAS PARA DM
Page  56
TÉCNICAS PARA DM
Page  57
TÉCNICAS PARA DM
Page  58
TÉCNICAS PARA DM
Page  59
TÉCNICAS PARA DM
Page  60
TÉCNICAS PARA DM
Multilayer Perceptron
Feed-forward
Supervisionada
Page  61
TÉCNICAS PARA DM
Page  62
TÉCNICAS PARA DM
Page  63
TÉCNICAS PARA DM
Page  64
TÉCNICAS PARA DM
Page  65
TÉCNICAS PARA DM
Page  66
TÉCNICAS PARA DM
Page  67
TÉCNICAS PARA DM
Page  68
VALIDAÇÃO DO MODELO
Page  69
VALIDAÇÃO DO MODELO
Page  70
VALIDAÇÃO DO MODELO
Page  71
VALIDAÇÃO DO MODELO
Page  72
VALIDAÇÃO DO MODELO
Page  73
VALIDAÇÃO DO MODELO
Page  74
VALIDAÇÃO DO MODELO
Page  75
VALIDAÇÃO DO MODELO
Page  76
VALIDAÇÃO DO MODELO
L if t C h a r t - R e s p o n s e %
C u m u la t iv e
S e le c t e d c a t e g o r y o f ID _ D G _ N O T : 1
M o d e l
T r e e M o d e l
0 1 0 2 0 3 0 4 0 5 0 6 0 7 0 8 0 9 0 1 0 0 1 1 0
P e r c e n t ile
6 0
6 5
7 0
7 5
8 0
8 5
Response%
Page  77
VALIDAÇÃO DO MODELO
Page  78
VALIDAÇÃO DO MODELO
Predição Frequência
Verdade
Porcentual
Classificação
Correta
Verdade 1 2
1 22 3 25 88%
2 5 20 25 80%
Frequência
Predição
27 23 50 84%*
*Número de classificação de corretas/ Número total de observações
Caso seja necessário, pode-se estabelecer pesos diferentes para as
freqüências obtidas em cada uma das células.
Page  79
VALIDAÇÃO
Page  80
FIM DA PRIMEIRA PARTE

IEncontroMinDados