Este documento apresenta os conceitos de descoberta de conhecimento em bancos de dados e mineração de dados, incluindo as etapas do processo e várias técnicas comuns como classificação, regressão, árvores de decisão e redes neurais. Também discute tópicos como pré-processamento e validação de dados, bancos de dados para mineração e o uso de mineração para aplicações como marketing.
13. Page 13
DESCOBERTA DE CONHECIMENTO EM BANCOS
DE DADOS (KDD) E MINERAÇÃO DE DADOS (DM)
14. Page 14
DESCOBERTA DE CONHECIMENTO EM BANCOS DE
DADOS (KDD) E MINERAÇÃO DE DADOS (DM)
Dados Dados Dados
Pré- Transformados
Processados
Previsão
Classificação
15. Page 15
DESCOBERTA DE CONHECIMENTO EM BANCOS
DE DADOS (KDD) E MINERAÇÃO DE DADOS (DM)
16. Page 16
DESCOBERTA DE CONHECIMENTO EM BANCOS
DE DADOS (KDD) E MINERAÇÃO DE DADOS (DM)
Exemplo das
sete etapas em
uma aplicação
destinada a
uma campanha
de vendas de
CDB´s de um
Banco que tem
1.400.000
clientes
pessoas
físicas.
33. Page 33
(ALGUMAS) TÉCNICAS PARA DM
Introducción a la Mineria de Datos, Orallo ; Quintana; Ramirez
Prentice Hall
Denominação Preditivo Descritivo
Classificação Predição Agrupamento Associação
Regressão x
Regressão Logística x
Função Discriminante x
Árvores de classificação x
Análise de associação x
Naive Bayes x
Kmeans x
Redes Neurais (MLP) x x
34. Page 34
TÉCNICAS PARA DM
Introdução à Mineração de Dados
Braga e-papers
35. Page 35
TÉCNICAS PARA DM
Introdução à Mineração de Dados
Braga e-papers
36. Page 36
TÉCNICAS PARA DM
X2
A B
xx
xxxxxx +++
x xxxx++++
xxxx ++++
A´
X1
B´
Função discriminante Y
76. Page 76
VALIDAÇÃO DO MODELO
L if t C h a r t - R e s p o n s e %
C u m u la t iv e
S e le c t e d c a t e g o r y o f ID _ D G _ N O T : 1
M o d e l
T r e e M o d e l
0 1 0 2 0 3 0 4 0 5 0 6 0 7 0 8 0 9 0 1 0 0 1 1 0
P e r c e n t ile
6 0
6 5
7 0
7 5
8 0
8 5
Response%
78. Page 78
VALIDAÇÃO DO MODELO
Predição Frequência
Verdade
Porcentual
Classificação
Correta
Verdade 1 2
1 22 3 25 88%
2 5 20 25 80%
Frequência
Predição
27 23 50 84%*
*Número de classificação de corretas/ Número total de observações
Caso seja necessário, pode-se estabelecer pesos diferentes para as
freqüências obtidas em cada uma das células.