SlideShare uma empresa Scribd logo
1 de 22
Baixar para ler offline
Data Mining



Hênio Carlos
Iessa Mota
Mariana Caroline Costa
Marcela Mayara Barbosa
Nilton Rodrigues Pereira
Data Mining



•   “Mineração de dados é a exploração e análise de
    dados, por meios automáticos ou semiautomáticos, em
    grandes quantidades de dados, com o objetivo de
    descobrir regras ou padrões interessantes.”



    Michael J. A. Berry; Gordon Linoff, “Data Mining Techiques for Marketing, Sales, and customer
Support”; John Wiley & Sons, Inc., 1997.
Data Mining
   Bancos de Dados

   Limpeza (consistência, preenchimento de
    informações, remoção de ruído e
    redundâncias)

   (Data Marts e Data Warehouses)

   Um analista refina e conduz o processo até
    que valiosos padrões apareçam.
Data Mining
Funcionalidade em Data Mining



   Funcionalidade em Data Mining

 Analise de Descritiva
 Análise de Prognóstico
Funcionalidade em Data Mining
Técnicas de exploração de dados




Técnicas de exploração de dados
•   Técnicas de estatísticas
•   Árvores de decisão
Técnicas de exploração de dados

Árvores de decisão
Técnicas de exploração de dados




Regras de associação
Técnicas de exploração de dados




Redes neurais artificiais
Algoritmos Genéticos


       Algoritmos Genéticos
“Quanto melhor um indivíduo se adaptar ao seu
   meio ambiente, maior será sua chance de
       sobreviver e gerar descendentes.”

              (DARWIN, 1859)
Algoritmos Genéticos


 Algoritmos Genéticos – O que são?

 Os Algoritmos Genéticos são uma classe de
  procedimentos, com passos distintos bem
  definidos.
 Essa classe se fundamenta em analogias a
  conceitos biológicos já testadas à exaustão.
 Cada passo distinto pode ter diversas versões
  diferentes.
Algoritmos Genéticos

   Algoritmos Genéticos – Para que
              servem?
 Busca e Otimização
 Amplamente utilizados, com sucesso,  em
  problemas de difícil manipulação pelas técnicas
  tradicionais
 Eficiência X Flexibilidade
Algoritmos Genéticos

Algoritmos Genéticos –
Funcionamento Fundamental
1.   Gerar População Inicial
2.   Descartar uma parte dos Indivíduos menos
     aptos
3.   Aplicar operadores de reprodução
4.   Aplicar operadores de mutação
5.   Se o critério de parada foi satisfeito, encerrar.
     Senão, voltar ao passo 2.
Algoritmos Genéticos



Algoritmos Genéticos - Desvantagens
 Desvantagens:
     Larga super produção de indivíduos;
     Envolve enorme quantidade de energia e tempo;
     Todo o processo parece ter pouco propósito, pois
      que o melhoramento das espécies depende do fator
      sorte
Algoritmos Genéticos


Algoritmos Genéticos - Vantagens

 Vantagens:
  Solidez e paralelismo inerente (o processo não fica
  preso em um local nem fica retido em soluções
  genéricas)
Algoritmos Genéticos



Algoritmos Genéticos – Aplicação
 Alocação de tarefas
 Configuração de sistemas complexos
 Seleção de Rotas
 Problemas de Otimização e de Aprendizagem de
  Máquina
 Problemas cuja solução seja um estado final e não
  um caminho
Data Mining

                 Conclusão
 Data mininig é um processo que
                              permite
  compreender o comportamento dos dados
 Pode ser bem aplicado em diversas   áreas de
  negócios
 Para que a mineração de dados seja bem sucedida
  é preciso, uma busca apropriada, analise e
  preparação dos dados encontrados
Exemplos
   Empresas de software para Data mining:

       SAS                     http://www.sas.com
       Information Havesting   http://www.convex.com
       Red Brick               http://www.redbrick.com
       Oracle                  http://www.oracle.com
       Sybase                  http://www.sybase.com
       Informix                http://www.informix.com
       IBM                     http://www.ibm.com
Data Mining
Ferramentas para Data Mining

 Os    softwares para data mining custam muito
    caro (uma licença single-user pode custar
    mais de 40.000 dólares).




Leia mais em: Data Mining – Novos Recursos nos Sistemas de Banco de Dados
http://www.devmedia.com.br/data-mining-novos-recursos-nos-sistemas-de-banco-de-
dados/5892#ixzz2Baq5JZfy
Referências

                           Referências
   Michael J. A. Berry; Gordon Linoff, “Data Mining Techiques for
    Marketing, Sales, and customer Support”; John Wiley & Sons, Inc., 1997
   http://www-pcc.qub.ac.uk/tec/courses/datamining
   http://www.santafe.edu/~kurt
   http://www.devmedia.com.br/data-mining-novos-recursos-nos-sistemas-
    de-banco-de-dados/5892#ixzz2Baq5JZfy
   http://www.infoescola.com/informatica/data-mining/
   http://amigonerd.net/trabalho/19327-data-mining
   http://www.mackenzie.br/7589.html
FIM

ALGUMA PERGUNTA??? NÃO NÉ...

Mais conteúdo relacionado

Mais procurados

Descoberta de Conhecimento em Bancos de Dados e Mineração de Dados
Descoberta de Conhecimento em Bancos de Dados e Mineração de DadosDescoberta de Conhecimento em Bancos de Dados e Mineração de Dados
Descoberta de Conhecimento em Bancos de Dados e Mineração de DadosEduardo de Lucena Falcão
 
Banco de Dados I Aula 06 - Generalização e Especialização
Banco de Dados I Aula 06 - Generalização e EspecializaçãoBanco de Dados I Aula 06 - Generalização e Especialização
Banco de Dados I Aula 06 - Generalização e EspecializaçãoLeinylson Fontinele
 
Introdução à Sistemas de Informação
Introdução à Sistemas de InformaçãoIntrodução à Sistemas de Informação
Introdução à Sistemas de InformaçãoÁlvaro Farias Pinheiro
 
Normalização - Banco de Dados
Normalização - Banco de DadosNormalização - Banco de Dados
Normalização - Banco de DadosRoberto Grande
 
Sistemas de recuperação de informação
Sistemas de recuperação de informação Sistemas de recuperação de informação
Sistemas de recuperação de informação Célia Dias
 
Fundamentos de sistemas de informação
Fundamentos de sistemas de informaçãoFundamentos de sistemas de informação
Fundamentos de sistemas de informaçãoLeonardo Melo Santos
 
INTRODUÇÃO FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO
INTRODUÇÃO FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃOINTRODUÇÃO FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO
INTRODUÇÃO FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃOEdson Lima
 
Banco de Dados I - Aula Prática - Criando o Primeiro Banco
Banco de Dados I - Aula Prática - Criando o Primeiro BancoBanco de Dados I - Aula Prática - Criando o Primeiro Banco
Banco de Dados I - Aula Prática - Criando o Primeiro BancoLeinylson Fontinele
 
Representação da Informação
Representação da InformaçãoRepresentação da Informação
Representação da InformaçãoHercules Santos
 
Banco de Dados I - Aula 03 - Conceitos de Sistemas de Banco de Dados
Banco de Dados I - Aula 03 - Conceitos de Sistemas de Banco de DadosBanco de Dados I - Aula 03 - Conceitos de Sistemas de Banco de Dados
Banco de Dados I - Aula 03 - Conceitos de Sistemas de Banco de DadosLeinylson Fontinele
 
Aula 01 - Recuperação da Informação
Aula 01 - Recuperação da InformaçãoAula 01 - Recuperação da Informação
Aula 01 - Recuperação da InformaçãoNilton Heck
 
Ciência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisõesCiência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisõesMarlesson Santana
 
Normalização de Banco de Dados
Normalização de Banco de DadosNormalização de Banco de Dados
Normalização de Banco de Dadoselliando dias
 
Normalização - Alexandruk
Normalização - AlexandrukNormalização - Alexandruk
Normalização - AlexandrukHebert Alquimim
 
Banco de Dados Conceitos
Banco de Dados ConceitosBanco de Dados Conceitos
Banco de Dados ConceitosCleber Ramos
 

Mais procurados (20)

Modelo E-R
Modelo E-RModelo E-R
Modelo E-R
 
Modelação de Dados
Modelação de DadosModelação de Dados
Modelação de Dados
 
Descoberta de Conhecimento em Bancos de Dados e Mineração de Dados
Descoberta de Conhecimento em Bancos de Dados e Mineração de DadosDescoberta de Conhecimento em Bancos de Dados e Mineração de Dados
Descoberta de Conhecimento em Bancos de Dados e Mineração de Dados
 
Banco de Dados I Aula 06 - Generalização e Especialização
Banco de Dados I Aula 06 - Generalização e EspecializaçãoBanco de Dados I Aula 06 - Generalização e Especialização
Banco de Dados I Aula 06 - Generalização e Especialização
 
Introdução à Sistemas de Informação
Introdução à Sistemas de InformaçãoIntrodução à Sistemas de Informação
Introdução à Sistemas de Informação
 
Estrutura de Dados - Grafos
Estrutura de Dados - GrafosEstrutura de Dados - Grafos
Estrutura de Dados - Grafos
 
Normalização - Banco de Dados
Normalização - Banco de DadosNormalização - Banco de Dados
Normalização - Banco de Dados
 
Sistemas de recuperação de informação
Sistemas de recuperação de informação Sistemas de recuperação de informação
Sistemas de recuperação de informação
 
Fundamentos de sistemas de informação
Fundamentos de sistemas de informaçãoFundamentos de sistemas de informação
Fundamentos de sistemas de informação
 
Power BI
Power BIPower BI
Power BI
 
INTRODUÇÃO FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO
INTRODUÇÃO FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃOINTRODUÇÃO FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO
INTRODUÇÃO FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO
 
Banco de Dados I - Aula Prática - Criando o Primeiro Banco
Banco de Dados I - Aula Prática - Criando o Primeiro BancoBanco de Dados I - Aula Prática - Criando o Primeiro Banco
Banco de Dados I - Aula Prática - Criando o Primeiro Banco
 
Repositórios Digitais Confiáveis
Repositórios Digitais ConfiáveisRepositórios Digitais Confiáveis
Repositórios Digitais Confiáveis
 
Representação da Informação
Representação da InformaçãoRepresentação da Informação
Representação da Informação
 
Banco de Dados I - Aula 03 - Conceitos de Sistemas de Banco de Dados
Banco de Dados I - Aula 03 - Conceitos de Sistemas de Banco de DadosBanco de Dados I - Aula 03 - Conceitos de Sistemas de Banco de Dados
Banco de Dados I - Aula 03 - Conceitos de Sistemas de Banco de Dados
 
Aula 01 - Recuperação da Informação
Aula 01 - Recuperação da InformaçãoAula 01 - Recuperação da Informação
Aula 01 - Recuperação da Informação
 
Ciência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisõesCiência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisões
 
Normalização de Banco de Dados
Normalização de Banco de DadosNormalização de Banco de Dados
Normalização de Banco de Dados
 
Normalização - Alexandruk
Normalização - AlexandrukNormalização - Alexandruk
Normalização - Alexandruk
 
Banco de Dados Conceitos
Banco de Dados ConceitosBanco de Dados Conceitos
Banco de Dados Conceitos
 

Destaque

Data warehouse & Data mining
Data warehouse & Data miningData warehouse & Data mining
Data warehouse & Data miningCassius Busemeyer
 
Seminário paty aula 9 04-05-2011
Seminário paty aula 9 04-05-2011Seminário paty aula 9 04-05-2011
Seminário paty aula 9 04-05-2011Patricia Neubert
 
Transparência em Belém: a hora é agora
Transparência em Belém: a hora é agora Transparência em Belém: a hora é agora
Transparência em Belém: a hora é agora Amarribo
 
Big Data Analytics - Data Science - Aplicação e Tecnologia
Big Data Analytics - Data Science - Aplicação e TecnologiaBig Data Analytics - Data Science - Aplicação e Tecnologia
Big Data Analytics - Data Science - Aplicação e TecnologiaHélio Silva
 
Custos e controle social bh. 22.04.12
Custos e controle social  bh. 22.04.12Custos e controle social  bh. 22.04.12
Custos e controle social bh. 22.04.12ufumec
 
Data Mining e Data Warehouse
Data Mining e Data WarehouseData Mining e Data Warehouse
Data Mining e Data WarehouseJeorgeCarmona
 
sci10lmu2-150623083448-lva1-app6891
sci10lmu2-150623083448-lva1-app6891sci10lmu2-150623083448-lva1-app6891
sci10lmu2-150623083448-lva1-app6891Edgar Pural
 
Biwa summit 2015 oaa oracle data miner hands on lab
Biwa summit 2015 oaa oracle data miner hands on labBiwa summit 2015 oaa oracle data miner hands on lab
Biwa summit 2015 oaa oracle data miner hands on labCharlie Berger
 
Big Data e Data Science: admirável mundo novo - IV SIC IFNMG
Big Data e Data Science: admirável mundo novo - IV SIC IFNMGBig Data e Data Science: admirável mundo novo - IV SIC IFNMG
Big Data e Data Science: admirável mundo novo - IV SIC IFNMGPetronio Candido
 
Plano contigência
Plano contigênciaPlano contigência
Plano contigêncialeopp
 

Destaque (20)

KDD e Data Mining
KDD e Data MiningKDD e Data Mining
KDD e Data Mining
 
Data Mining
Data MiningData Mining
Data Mining
 
Data Mining
Data Mining Data Mining
Data Mining
 
Data warehouse & Data mining
Data warehouse & Data miningData warehouse & Data mining
Data warehouse & Data mining
 
Técnicas de data mining
Técnicas de data miningTécnicas de data mining
Técnicas de data mining
 
Data warehouse & data mining
Data warehouse & data miningData warehouse & data mining
Data warehouse & data mining
 
Seminário paty aula 9 04-05-2011
Seminário paty aula 9 04-05-2011Seminário paty aula 9 04-05-2011
Seminário paty aula 9 04-05-2011
 
Data mining
Data miningData mining
Data mining
 
Data mining
Data miningData mining
Data mining
 
Transparência em Belém: a hora é agora
Transparência em Belém: a hora é agora Transparência em Belém: a hora é agora
Transparência em Belém: a hora é agora
 
Big Data Analytics - Data Science - Aplicação e Tecnologia
Big Data Analytics - Data Science - Aplicação e TecnologiaBig Data Analytics - Data Science - Aplicação e Tecnologia
Big Data Analytics - Data Science - Aplicação e Tecnologia
 
Custos e controle social bh. 22.04.12
Custos e controle social  bh. 22.04.12Custos e controle social  bh. 22.04.12
Custos e controle social bh. 22.04.12
 
Painel 00 01 - wesley - Análise de dados como ferramenta estratégica para o...
Painel 00   01 - wesley - Análise de dados como ferramenta estratégica para o...Painel 00   01 - wesley - Análise de dados como ferramenta estratégica para o...
Painel 00 01 - wesley - Análise de dados como ferramenta estratégica para o...
 
Data Mining e Data Warehouse
Data Mining e Data WarehouseData Mining e Data Warehouse
Data Mining e Data Warehouse
 
Mineração de dados
Mineração de dadosMineração de dados
Mineração de dados
 
sci10lmu2-150623083448-lva1-app6891
sci10lmu2-150623083448-lva1-app6891sci10lmu2-150623083448-lva1-app6891
sci10lmu2-150623083448-lva1-app6891
 
Biwa summit 2015 oaa oracle data miner hands on lab
Biwa summit 2015 oaa oracle data miner hands on labBiwa summit 2015 oaa oracle data miner hands on lab
Biwa summit 2015 oaa oracle data miner hands on lab
 
Big Data e Data Science: admirável mundo novo - IV SIC IFNMG
Big Data e Data Science: admirável mundo novo - IV SIC IFNMGBig Data e Data Science: admirável mundo novo - IV SIC IFNMG
Big Data e Data Science: admirável mundo novo - IV SIC IFNMG
 
Plano contigência
Plano contigênciaPlano contigência
Plano contigência
 
La visión del ministerio de planificación- TCU
La visión del ministerio de planificación- TCULa visión del ministerio de planificación- TCU
La visión del ministerio de planificación- TCU
 

Semelhante a Data Mining Técnicas

Rene Seguranca Ai Agents
Rene Seguranca Ai AgentsRene Seguranca Ai Agents
Rene Seguranca Ai AgentsMarco Manso
 
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharePalestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharepccdias
 
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014 Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014 Marcos Vinicius Fidelis
 
Minicurso: O que o twitter está pensando? Extraindo informações do twitter ut...
Minicurso: O que o twitter está pensando? Extraindo informações do twitter ut...Minicurso: O que o twitter está pensando? Extraindo informações do twitter ut...
Minicurso: O que o twitter está pensando? Extraindo informações do twitter ut...Adolfo Guimaraes
 
Artigo 1-fraudes-agua-passini-seminco2002-6
Artigo 1-fraudes-agua-passini-seminco2002-6Artigo 1-fraudes-agua-passini-seminco2002-6
Artigo 1-fraudes-agua-passini-seminco2002-6Wosley Arruda
 
Aula11-12 TESI UFS - Explroracao e Gestao de SI nas Empresas Digitais
Aula11-12 TESI UFS - Explroracao e Gestao de SI nas Empresas DigitaisAula11-12 TESI UFS - Explroracao e Gestao de SI nas Empresas Digitais
Aula11-12 TESI UFS - Explroracao e Gestao de SI nas Empresas DigitaisRogerio P C do Nascimento
 
Big Data e suas Vertentes
Big Data e suas VertentesBig Data e suas Vertentes
Big Data e suas VertentesUnicamp
 
Palestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine Learning
Palestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine LearningPalestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine Learning
Palestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine LearningJosias Oliveira
 
Palestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinowarePalestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinowareMarcos Vinicius Fidelis
 
Qual é o futuro da estratégia de dados?
Qual é o futuro da estratégia de dados?Qual é o futuro da estratégia de dados?
Qual é o futuro da estratégia de dados?Denodo
 
Pentaho Data Mining - FTSL - Fórum de Tecnologia de Software Livre - Serpro -...
Pentaho Data Mining - FTSL - Fórum de Tecnologia de Software Livre - Serpro -...Pentaho Data Mining - FTSL - Fórum de Tecnologia de Software Livre - Serpro -...
Pentaho Data Mining - FTSL - Fórum de Tecnologia de Software Livre - Serpro -...Marcos Vinicius Fidelis
 
Big Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoBig Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoHélio Silva
 

Semelhante a Data Mining Técnicas (20)

Mineração
MineraçãoMineração
Mineração
 
Rene Seguranca Ai Agents
Rene Seguranca Ai AgentsRene Seguranca Ai Agents
Rene Seguranca Ai Agents
 
Clustering
ClusteringClustering
Clustering
 
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharePalestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
 
Data mining
Data miningData mining
Data mining
 
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014 Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014
 
Minicurso: O que o twitter está pensando? Extraindo informações do twitter ut...
Minicurso: O que o twitter está pensando? Extraindo informações do twitter ut...Minicurso: O que o twitter está pensando? Extraindo informações do twitter ut...
Minicurso: O que o twitter está pensando? Extraindo informações do twitter ut...
 
Big Data x Data Mining - Hadoop
Big Data x Data Mining - HadoopBig Data x Data Mining - Hadoop
Big Data x Data Mining - Hadoop
 
Artigo 1-fraudes-agua-passini-seminco2002-6
Artigo 1-fraudes-agua-passini-seminco2002-6Artigo 1-fraudes-agua-passini-seminco2002-6
Artigo 1-fraudes-agua-passini-seminco2002-6
 
Weka pentaho day2014-fidelis
Weka pentaho day2014-fidelisWeka pentaho day2014-fidelis
Weka pentaho day2014-fidelis
 
Aula11-12 TESI UFS - Explroracao e Gestao de SI nas Empresas Digitais
Aula11-12 TESI UFS - Explroracao e Gestao de SI nas Empresas DigitaisAula11-12 TESI UFS - Explroracao e Gestao de SI nas Empresas Digitais
Aula11-12 TESI UFS - Explroracao e Gestao de SI nas Empresas Digitais
 
Big Data e suas Vertentes
Big Data e suas VertentesBig Data e suas Vertentes
Big Data e suas Vertentes
 
Palestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine Learning
Palestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine LearningPalestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine Learning
Palestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine Learning
 
Big Data
Big DataBig Data
Big Data
 
Palestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinowarePalestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinoware
 
Qual é o futuro da estratégia de dados?
Qual é o futuro da estratégia de dados?Qual é o futuro da estratégia de dados?
Qual é o futuro da estratégia de dados?
 
Mineração Livre de Dados
Mineração Livre de DadosMineração Livre de Dados
Mineração Livre de Dados
 
Pentaho Weka latinoware
Pentaho Weka latinowarePentaho Weka latinoware
Pentaho Weka latinoware
 
Pentaho Data Mining - FTSL - Fórum de Tecnologia de Software Livre - Serpro -...
Pentaho Data Mining - FTSL - Fórum de Tecnologia de Software Livre - Serpro -...Pentaho Data Mining - FTSL - Fórum de Tecnologia de Software Livre - Serpro -...
Pentaho Data Mining - FTSL - Fórum de Tecnologia de Software Livre - Serpro -...
 
Big Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoBig Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e Mercado
 

Data Mining Técnicas

  • 1. Data Mining Hênio Carlos Iessa Mota Mariana Caroline Costa Marcela Mayara Barbosa Nilton Rodrigues Pereira
  • 2. Data Mining • “Mineração de dados é a exploração e análise de dados, por meios automáticos ou semiautomáticos, em grandes quantidades de dados, com o objetivo de descobrir regras ou padrões interessantes.” Michael J. A. Berry; Gordon Linoff, “Data Mining Techiques for Marketing, Sales, and customer Support”; John Wiley & Sons, Inc., 1997.
  • 3. Data Mining  Bancos de Dados  Limpeza (consistência, preenchimento de informações, remoção de ruído e redundâncias)  (Data Marts e Data Warehouses)  Um analista refina e conduz o processo até que valiosos padrões apareçam.
  • 5. Funcionalidade em Data Mining Funcionalidade em Data Mining  Analise de Descritiva  Análise de Prognóstico
  • 7. Técnicas de exploração de dados Técnicas de exploração de dados • Técnicas de estatísticas • Árvores de decisão
  • 8. Técnicas de exploração de dados Árvores de decisão
  • 9. Técnicas de exploração de dados Regras de associação
  • 10. Técnicas de exploração de dados Redes neurais artificiais
  • 11. Algoritmos Genéticos Algoritmos Genéticos “Quanto melhor um indivíduo se adaptar ao seu meio ambiente, maior será sua chance de sobreviver e gerar descendentes.” (DARWIN, 1859)
  • 12. Algoritmos Genéticos Algoritmos Genéticos – O que são?  Os Algoritmos Genéticos são uma classe de procedimentos, com passos distintos bem definidos.  Essa classe se fundamenta em analogias a conceitos biológicos já testadas à exaustão.  Cada passo distinto pode ter diversas versões diferentes.
  • 13. Algoritmos Genéticos Algoritmos Genéticos – Para que servem?  Busca e Otimização  Amplamente utilizados, com sucesso, em problemas de difícil manipulação pelas técnicas tradicionais  Eficiência X Flexibilidade
  • 14. Algoritmos Genéticos Algoritmos Genéticos – Funcionamento Fundamental 1. Gerar População Inicial 2. Descartar uma parte dos Indivíduos menos aptos 3. Aplicar operadores de reprodução 4. Aplicar operadores de mutação 5. Se o critério de parada foi satisfeito, encerrar. Senão, voltar ao passo 2.
  • 15. Algoritmos Genéticos Algoritmos Genéticos - Desvantagens  Desvantagens:  Larga super produção de indivíduos;  Envolve enorme quantidade de energia e tempo;  Todo o processo parece ter pouco propósito, pois que o melhoramento das espécies depende do fator sorte
  • 16. Algoritmos Genéticos Algoritmos Genéticos - Vantagens  Vantagens: Solidez e paralelismo inerente (o processo não fica preso em um local nem fica retido em soluções genéricas)
  • 17. Algoritmos Genéticos Algoritmos Genéticos – Aplicação  Alocação de tarefas  Configuração de sistemas complexos  Seleção de Rotas  Problemas de Otimização e de Aprendizagem de Máquina  Problemas cuja solução seja um estado final e não um caminho
  • 18. Data Mining Conclusão  Data mininig é um processo que permite compreender o comportamento dos dados  Pode ser bem aplicado em diversas áreas de negócios  Para que a mineração de dados seja bem sucedida é preciso, uma busca apropriada, analise e preparação dos dados encontrados
  • 19. Exemplos  Empresas de software para Data mining:  SAS http://www.sas.com  Information Havesting http://www.convex.com  Red Brick http://www.redbrick.com  Oracle http://www.oracle.com  Sybase http://www.sybase.com  Informix http://www.informix.com  IBM http://www.ibm.com
  • 20. Data Mining Ferramentas para Data Mining  Os softwares para data mining custam muito caro (uma licença single-user pode custar mais de 40.000 dólares). Leia mais em: Data Mining – Novos Recursos nos Sistemas de Banco de Dados http://www.devmedia.com.br/data-mining-novos-recursos-nos-sistemas-de-banco-de- dados/5892#ixzz2Baq5JZfy
  • 21. Referências Referências  Michael J. A. Berry; Gordon Linoff, “Data Mining Techiques for Marketing, Sales, and customer Support”; John Wiley & Sons, Inc., 1997  http://www-pcc.qub.ac.uk/tec/courses/datamining  http://www.santafe.edu/~kurt  http://www.devmedia.com.br/data-mining-novos-recursos-nos-sistemas- de-banco-de-dados/5892#ixzz2Baq5JZfy  http://www.infoescola.com/informatica/data-mining/  http://amigonerd.net/trabalho/19327-data-mining  http://www.mackenzie.br/7589.html