SlideShare uma empresa Scribd logo
1 de 80
Page  1
Luis Paulo Vieira Braga
lpbraga@geologia.ufrj.br
Page  2
Conceitos
Técnicas
Casos
Recursos
Page  3
Page  4
Daniel Souza da Silva
João Gabriel Domingues
Julia Vidal Ribeiro
Paloma da Silva Borba
Rafael Celestino dos Santos
Page  5
Page  6
Data Mining Cookbook, Rud O.P. , Wiley
Page  7
INTRODUÇÃO
Page  8
INTRODUÇÃO
Page  9
INTRODUÇÃO
Page  10
INTRODUÇÃO
Page  11
INTRODUÇÃO
Page  12
INTRODUÇÃO
Page  13
DESCOBERTA DE CONHECIMENTO EM BANCOS
DE DADOS (KDD) E MINERAÇÃO DE DADOS (DM)
Page  14
DESCOBERTA DE CONHECIMENTO EM BANCOS DE
DADOS (KDD) E MINERAÇÃO DE DADOS (DM)
Dados Dados Dados
Pré- Transformados
Processados
Previsão
Classificação
Page  15
DESCOBERTA DE CONHECIMENTO EM BANCOS
DE DADOS (KDD) E MINERAÇÃO DE DADOS (DM)
Page  16
DESCOBERTA DE CONHECIMENTO EM BANCOS
DE DADOS (KDD) E MINERAÇÃO DE DADOS (DM)
Exemplo das
sete etapas em
uma aplicação
destinada a
uma campanha
de vendas de
CDB´s de um
Banco que tem
1.400.000
clientes
pessoas
físicas.
Page  17
BANCOS DE DADOS PARA DM, DATA WARE HOUSE(
Page  18
BANCOS DE DADOS PARA DM, DATA WARE HOUSE
www.jeunesse.com.br
Page  19
BANCOS DE DADOS PARA DM, DATA WARE HOUSE
Page  20
BANCOS DE DADOS PARA DM, DATA WARE HOUSE
Page  21
BANCOS DE DADOS PARA DM, DATA WARE HOUSE
Introducción a la minería de datos, Orallo;
Quintana e Ramirez, Prentice Hall
Page  22
BANCOS DE DADOS PARA DM, DATA WARE HOUSE
Introducción a la minería de datos, Orallo;
Quintana e Ramirez, Prentice Hall
Page  23
BANCOS DE DADOS PARA DM, DATA WARE HOUSE
Introducción a la minería de datos, Orallo;
Quintana e Ramirez, Prentice Hall
Page  24
BANCOS DE DADOS PARA DM, DATA WARE HOUSE
Introducción a la minería de datos, Orallo;
Quintana e Ramirez, Prentice Hall
Page  25
BANCOS DE DADOS PARA DM, DATA WARE HOUSE
Introducción a la minería de datos, Orallo;
Quintana e Ramirez, Prentice Hall
Page  26
BANCOS DE DADOS PARA DM, DATA WARE HOUSE
Page  27
BANCOS DE DADOS PARA DM, DATA WARE HOUSE
Big
Data
Page  28
TRATAMENTO DE DADOS PARA DM
Page  29
TRATAMENTO DE DADOS PARA DM
Page  30
TRATAMENTO DE DADOS PARA DM
Page  31
TRATAMENTO DE DADOS PARA DM
Page  32
TRATAMENTO DE DADOS PARA DM
Page  33
(ALGUMAS) TÉCNICAS PARA DM
Introducción a la Mineria de Datos, Orallo ; Quintana; Ramirez
Prentice Hall
Denominação Preditivo Descritivo
Classificação Predição Agrupamento Associação
Regressão x
Regressão Logística x
Função Discriminante x
Árvores de classificação x
Análise de associação x
Naive Bayes x
Kmeans x
Redes Neurais (MLP) x x
Page  34
TÉCNICAS PARA DM
Introdução à Mineração de Dados
Braga e-papers
Page  35
TÉCNICAS PARA DM
Introdução à Mineração de Dados
Braga e-papers
Page  36
TÉCNICAS PARA DM
X2
A B
xx
xxxxxx +++
x xxxx++++
xxxx ++++
A´
X1
B´
Função discriminante Y
Page  37
TÉCNICAS PARA DM
Page  38
TÉCNICAS PARA DM
Page  39
TÉCNICAS PARA DM
Page  40
TÉCNICAS PARA DM
NAIVE BAYES
A solução mais comum é através do
método de máxima verossimilhança
Page  41
TÉCNICAS PARA DM
REDES BAYESIANAS E CLASSIFICADORES BAYESIANOS
Page  42
TÉCNICAS PARA DM
Page  43
TÉCNICAS PARA DM
Page  44
TÉCNICAS PARA DM
Page  45
TÉCNICAS PARA DM
Page  46
TÉCNICAS PARA DM
OBTENÇÃO DE SUPORTES POR DIMENSÃO
Page  47
TÉCNICAS PARA DM
Page  48
TÉCNICAS PARA DM
Page  49
TÉCNICAS PARA DM
CÁLCULO DA CONFIANÇA DE UMA REGRA p(B|A)
Page  50
TÉCNICAS PARA DM
Page  51
TÉCNICAS PARA DM
Page  52
TÉCNICAS PARA DM
Page  53
TÉCNICAS PARA DM
Page  54
TÉCNICAS PARA DM
Page  55
TÉCNICAS PARA DM
Page  56
TÉCNICAS PARA DM
Page  57
TÉCNICAS PARA DM
Page  58
TÉCNICAS PARA DM
Page  59
TÉCNICAS PARA DM
Page  60
TÉCNICAS PARA DM
Multilayer Perceptron
Feed-forward
Supervisionada
Page  61
TÉCNICAS PARA DM
Page  62
TÉCNICAS PARA DM
Page  63
TÉCNICAS PARA DM
Page  64
TÉCNICAS PARA DM
Page  65
TÉCNICAS PARA DM
Page  66
TÉCNICAS PARA DM
Page  67
TÉCNICAS PARA DM
Page  68
VALIDAÇÃO DO MODELO
Page  69
VALIDAÇÃO DO MODELO
Page  70
VALIDAÇÃO DO MODELO
Page  71
VALIDAÇÃO DO MODELO
Page  72
VALIDAÇÃO DO MODELO
Page  73
VALIDAÇÃO DO MODELO
Page  74
VALIDAÇÃO DO MODELO
Page  75
VALIDAÇÃO DO MODELO
Page  76
VALIDAÇÃO DO MODELO
L if t C h a r t - R e s p o n s e %
C u m u la t iv e
S e le c t e d c a t e g o r y o f ID _ D G _ N O T : 1
M o d e l
T r e e M o d e l
0 1 0 2 0 3 0 4 0 5 0 6 0 7 0 8 0 9 0 1 0 0 1 1 0
P e r c e n t ile
6 0
6 5
7 0
7 5
8 0
8 5
Response%
Page  77
VALIDAÇÃO DO MODELO
Page  78
VALIDAÇÃO DO MODELO
Predição Frequência
Verdade
Porcentual
Classificação
Correta
Verdade 1 2
1 22 3 25 88%
2 5 20 25 80%
Frequência
Predição
27 23 50 84%*
*Número de classificação de corretas/ Número total de observações
Caso seja necessário, pode-se estabelecer pesos diferentes para as
freqüências obtidas em cada uma das células.
Page  79
VALIDAÇÃO
Page  80
FIM DA PRIMEIRA PARTE

Mais conteúdo relacionado

Semelhante a Introdução à Mineração de Dados

Business Intelligence & Data Mining - Knowledge Discovery in Databases
Business Intelligence & Data Mining - Knowledge Discovery in DatabasesBusiness Intelligence & Data Mining - Knowledge Discovery in Databases
Business Intelligence & Data Mining - Knowledge Discovery in DatabasesLeandro Guerra
 
24HoP 2012 - E você, está preparado para a era BigData?
24HoP 2012 - E você, está preparado para a era BigData?24HoP 2012 - E você, está preparado para a era BigData?
24HoP 2012 - E você, está preparado para a era BigData?Diego Nogare
 
Introdução a Ciência de Dados
Introdução a Ciência de DadosIntrodução a Ciência de Dados
Introdução a Ciência de DadosNauber Gois
 
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014 Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014 Marcos Vinicius Fidelis
 
Impulsionando a conectividade na indústria_Marilia_parte 1.pdf
Impulsionando a conectividade na indústria_Marilia_parte 1.pdfImpulsionando a conectividade na indústria_Marilia_parte 1.pdf
Impulsionando a conectividade na indústria_Marilia_parte 1.pdfEdnilsonBoni
 
Big Data e Governança de Dados, via DMM-Data Management Maturiy Model
Big Data e Governança de Dados, via DMM-Data Management Maturiy ModelBig Data e Governança de Dados, via DMM-Data Management Maturiy Model
Big Data e Governança de Dados, via DMM-Data Management Maturiy ModelCarlos Barbieri
 
Palestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine Learning
Palestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine LearningPalestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine Learning
Palestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine LearningJosias Oliveira
 
Ciência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisõesCiência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisõesMarlesson Santana
 
Biweek Mineração de Dados com SQL Server
Biweek   Mineração de Dados com SQL ServerBiweek   Mineração de Dados com SQL Server
Biweek Mineração de Dados com SQL ServerRodrigo Dornel
 
Data Science - Big Data - Data Driven
Data Science - Big Data - Data DrivenData Science - Big Data - Data Driven
Data Science - Big Data - Data DrivenDaniela Brauner
 
Brasilia - Tecnologias Emergentes de BPM: Processos mais Inteligentes
Brasilia - Tecnologias Emergentes de BPM: Processos mais InteligentesBrasilia - Tecnologias Emergentes de BPM: Processos mais Inteligentes
Brasilia - Tecnologias Emergentes de BPM: Processos mais InteligentesSandy Kemsley
 

Semelhante a Introdução à Mineração de Dados (20)

Clustering
ClusteringClustering
Clustering
 
SBRC2013
SBRC2013SBRC2013
SBRC2013
 
Big Data x Data Mining - Hadoop
Big Data x Data Mining - HadoopBig Data x Data Mining - Hadoop
Big Data x Data Mining - Hadoop
 
Business Intelligence & Data Mining - Knowledge Discovery in Databases
Business Intelligence & Data Mining - Knowledge Discovery in DatabasesBusiness Intelligence & Data Mining - Knowledge Discovery in Databases
Business Intelligence & Data Mining - Knowledge Discovery in Databases
 
24HoP 2012 - E você, está preparado para a era BigData?
24HoP 2012 - E você, está preparado para a era BigData?24HoP 2012 - E você, está preparado para a era BigData?
24HoP 2012 - E você, está preparado para a era BigData?
 
RWD
RWDRWD
RWD
 
Introdução a Ciência de Dados
Introdução a Ciência de DadosIntrodução a Ciência de Dados
Introdução a Ciência de Dados
 
Data science
Data scienceData science
Data science
 
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014 Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014
 
Impulsionando a conectividade na indústria_Marilia_parte 1.pdf
Impulsionando a conectividade na indústria_Marilia_parte 1.pdfImpulsionando a conectividade na indústria_Marilia_parte 1.pdf
Impulsionando a conectividade na indústria_Marilia_parte 1.pdf
 
Big Data e Governança de Dados, via DMM-Data Management Maturiy Model
Big Data e Governança de Dados, via DMM-Data Management Maturiy ModelBig Data e Governança de Dados, via DMM-Data Management Maturiy Model
Big Data e Governança de Dados, via DMM-Data Management Maturiy Model
 
Palestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine Learning
Palestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine LearningPalestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine Learning
Palestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine Learning
 
BigData
BigDataBigData
BigData
 
BIG data
BIG dataBIG data
BIG data
 
Ciência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisõesCiência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisões
 
Biweek Mineração de Dados com SQL Server
Biweek   Mineração de Dados com SQL ServerBiweek   Mineração de Dados com SQL Server
Biweek Mineração de Dados com SQL Server
 
Ementa curso de dados
Ementa curso de dadosEmenta curso de dados
Ementa curso de dados
 
Data Science - Big Data - Data Driven
Data Science - Big Data - Data DrivenData Science - Big Data - Data Driven
Data Science - Big Data - Data Driven
 
Brasilia - Tecnologias Emergentes de BPM: Processos mais Inteligentes
Brasilia - Tecnologias Emergentes de BPM: Processos mais InteligentesBrasilia - Tecnologias Emergentes de BPM: Processos mais Inteligentes
Brasilia - Tecnologias Emergentes de BPM: Processos mais Inteligentes
 
KDD e Data Mining
KDD e Data MiningKDD e Data Mining
KDD e Data Mining
 

Mais de ufrj

Os três “q´s” da formação universitária de jovens no Brasil: Para o quê? Quem...
Os três “q´s” da formação universitária de jovens no Brasil: Para o quê? Quem...Os três “q´s” da formação universitária de jovens no Brasil: Para o quê? Quem...
Os três “q´s” da formação universitária de jovens no Brasil: Para o quê? Quem...ufrj
 
Os 3qs
Os 3qsOs 3qs
Os 3qsufrj
 
Financiar periódicos abertos ou bases abertas de periódicos
Financiar periódicos abertos ou bases abertas de periódicosFinanciar periódicos abertos ou bases abertas de periódicos
Financiar periódicos abertos ou bases abertas de periódicosufrj
 
Mapping gold pathfinders
Mapping gold pathfindersMapping gold pathfinders
Mapping gold pathfindersufrj
 
Maratona de negocios cp br7 apresentação do projeto obsuni
Maratona de negocios cp br7   apresentação do projeto obsuniMaratona de negocios cp br7   apresentação do projeto obsuni
Maratona de negocios cp br7 apresentação do projeto obsuniufrj
 
Ejercicio 2, parte II
Ejercicio 2, parte IIEjercicio 2, parte II
Ejercicio 2, parte IIufrj
 
Mineria de Datos y Statistica
Mineria de Datos y StatisticaMineria de Datos y Statistica
Mineria de Datos y Statisticaufrj
 
Mineria de datos_parte IV
Mineria de datos_parte IVMineria de datos_parte IV
Mineria de datos_parte IVufrj
 
Mineria de Datos Parte III
Mineria de Datos Parte IIIMineria de Datos Parte III
Mineria de Datos Parte IIIufrj
 
Mineria de datos Parte II
Mineria de datos Parte IIMineria de datos Parte II
Mineria de datos Parte IIufrj
 
Presentation sinape
Presentation sinapePresentation sinape
Presentation sinapeufrj
 
AVAs e Moodle - Novos Recursos Pedagógicos somente para EAD?
AVAs e Moodle - Novos Recursos Pedagógicos somente para EAD?AVAs e Moodle - Novos Recursos Pedagógicos somente para EAD?
AVAs e Moodle - Novos Recursos Pedagógicos somente para EAD?ufrj
 
Publicar, publicar, publicar
Publicar, publicar, publicarPublicar, publicar, publicar
Publicar, publicar, publicarufrj
 
O futuro do livro
O futuro do livroO futuro do livro
O futuro do livroufrj
 
Abe Curso Estudos De Caso Ii
Abe Curso Estudos De Caso IiAbe Curso Estudos De Caso Ii
Abe Curso Estudos De Caso Iiufrj
 
Abe Curso Estudos De Caso
Abe Curso Estudos De CasoAbe Curso Estudos De Caso
Abe Curso Estudos De Casoufrj
 
Abe Curso
Abe CursoAbe Curso
Abe Cursoufrj
 
Stanford 2009
Stanford 2009Stanford 2009
Stanford 2009ufrj
 
Slides Chile
Slides ChileSlides Chile
Slides Chileufrj
 

Mais de ufrj (19)

Os três “q´s” da formação universitária de jovens no Brasil: Para o quê? Quem...
Os três “q´s” da formação universitária de jovens no Brasil: Para o quê? Quem...Os três “q´s” da formação universitária de jovens no Brasil: Para o quê? Quem...
Os três “q´s” da formação universitária de jovens no Brasil: Para o quê? Quem...
 
Os 3qs
Os 3qsOs 3qs
Os 3qs
 
Financiar periódicos abertos ou bases abertas de periódicos
Financiar periódicos abertos ou bases abertas de periódicosFinanciar periódicos abertos ou bases abertas de periódicos
Financiar periódicos abertos ou bases abertas de periódicos
 
Mapping gold pathfinders
Mapping gold pathfindersMapping gold pathfinders
Mapping gold pathfinders
 
Maratona de negocios cp br7 apresentação do projeto obsuni
Maratona de negocios cp br7   apresentação do projeto obsuniMaratona de negocios cp br7   apresentação do projeto obsuni
Maratona de negocios cp br7 apresentação do projeto obsuni
 
Ejercicio 2, parte II
Ejercicio 2, parte IIEjercicio 2, parte II
Ejercicio 2, parte II
 
Mineria de Datos y Statistica
Mineria de Datos y StatisticaMineria de Datos y Statistica
Mineria de Datos y Statistica
 
Mineria de datos_parte IV
Mineria de datos_parte IVMineria de datos_parte IV
Mineria de datos_parte IV
 
Mineria de Datos Parte III
Mineria de Datos Parte IIIMineria de Datos Parte III
Mineria de Datos Parte III
 
Mineria de datos Parte II
Mineria de datos Parte IIMineria de datos Parte II
Mineria de datos Parte II
 
Presentation sinape
Presentation sinapePresentation sinape
Presentation sinape
 
AVAs e Moodle - Novos Recursos Pedagógicos somente para EAD?
AVAs e Moodle - Novos Recursos Pedagógicos somente para EAD?AVAs e Moodle - Novos Recursos Pedagógicos somente para EAD?
AVAs e Moodle - Novos Recursos Pedagógicos somente para EAD?
 
Publicar, publicar, publicar
Publicar, publicar, publicarPublicar, publicar, publicar
Publicar, publicar, publicar
 
O futuro do livro
O futuro do livroO futuro do livro
O futuro do livro
 
Abe Curso Estudos De Caso Ii
Abe Curso Estudos De Caso IiAbe Curso Estudos De Caso Ii
Abe Curso Estudos De Caso Ii
 
Abe Curso Estudos De Caso
Abe Curso Estudos De CasoAbe Curso Estudos De Caso
Abe Curso Estudos De Caso
 
Abe Curso
Abe CursoAbe Curso
Abe Curso
 
Stanford 2009
Stanford 2009Stanford 2009
Stanford 2009
 
Slides Chile
Slides ChileSlides Chile
Slides Chile
 

Introdução à Mineração de Dados