Data warehouse & Data mining

14.038 visualizações

Publicada em

Apresentação sobre Data warehouse e Data mining do curso de Gestão da Informação UFPR. Matéria Informática aplicada II (Business Intelligence).

Autores: Cassius Busemeyer, Cristiane Aparecida Luquetta, Rafael Slonik

Publicada em: Tecnologia
3 comentários
13 gostaram
Estatísticas
Notas
Sem downloads
Visualizações
Visualizações totais
14.038
No SlideShare
0
A partir de incorporações
0
Número de incorporações
589
Ações
Compartilhamentos
0
Downloads
71
Comentários
3
Gostaram
13
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Data warehouse & Data mining

  1. 1. DATA WAREHOUSE Cassius Busemeyer Cristiane Luquetta Rafael Slonik
  2. 2. 1º computador em 1946
  3. 3. Armazenamento de dados Anos 60
  4. 4. Dispositivo de armazenamento Acesso direto (DASD) Anos 70
  5. 5. Linguagem 4ª geração Computador pessoal Anos 80 - 90
  6. 6. OLTP gerou SAD que por sua vez gerou DW
  7. 7. DW é orientado por temas,
  8. 8. É integrado, DW é orientado por temas,
  9. 9. Não-volátil e É integrado, DW é orientado por temas,
  10. 10. Variante no tempo Não-volátil e É integrado, DW é orientado por temas,
  11. 12. OLAP: (Online Analytical Processing) OLTP: (Online Transaction Processing) <ul><li>Do negócio; </li></ul><ul><li>Transacional; </li></ul><ul><li>Operacional; </li></ul><ul><li>Volátil; </li></ul><ul><li>Não-padronizada; </li></ul><ul><li>Sobre o negócio; </li></ul><ul><li>Analítica: </li></ul><ul><li>Tático-estratégica; </li></ul><ul><li>Não-volátil; </li></ul><ul><li>Padronizada; </li></ul><ul><ul><li>Outros: </li></ul></ul><ul><ul><li>ROLAP (relacional); </li></ul></ul><ul><ul><li>MOLAP (Multi); </li></ul></ul><ul><ul><li>HOLAP (Híbrido); </li></ul></ul><ul><ul><li>DOLAP (Desktop); </li></ul></ul>
  12. 14. Como funciona o data warehouse ? Metadados : “dados sobre dados”; Granularidade : nível de detalhe contido nas unidades de dados existentes no data warehouse; ETL :Extrair,Transformar,Carregar (Vidotti,2001)
  13. 15. Data Mart é um DW segmentado, por departamento, por exemplo
  14. 17. Método Kimball
  15. 18. Método Inmon
  16. 19. O data warehouse é o ponto central de todos os seus dados ; O sistema Linux suporta o processamento de extração, transformação e carregamento e suporta também a Interface do Usuário; O tempo de trabalho foi reduzido de fato em 20%
  17. 20. Data Mining Mineração de dados
  18. 21. “ Data mining é o processo de busca de dados por padrões anteriormente desconhecidos e uso freqüente destes padrões para predizer conseqüências futuras.” - Jeff Jonas e Jim Harper
  19. 22. Simplificando...
  20. 23. Torture os dados até eles confessarem ... Se você torturar o suficiente, eles irão confessar tudo - ACM SIGKDD
  21. 25. O Web Mining apresenta-se como responsável pela procura de regras e padrões importantes de uma forma automática. Permite saber, por exemplo, quais os padrões de navegação típicos dentro do site, o que caracteriza os visitantes / clientes ou qual a sua propensão para adquirir determinado produto ou serviço . Fonte: http://www.novabase.pt/showNews.asp?idProd=reswebmining
  22. 26. <ul><li>Compreender o domínio da aplicação, entender as expectativas do usuário final do processo. </li></ul><ul><li>2. Criar/selecionar uma coleção de dados para aplicação. </li></ul><ul><li>3. Pré-processar e limpar os dados (eliminar impurezas e dados irrelevantes). </li></ul>O Processo de KDD
  23. 27. 4. Transformar (reduzir e reprojetar) os dados (encontrar atributos úteis e interessantes). 5. Escolher a tarefa, métodos, modelos, parâmetros etc. do processo de mineração de dados e executar este processo. 6. Interpretar os resultados. 7. Consolidar o conhecimento adquirido, resolver conflitos.
  24. 28. <ul><li>Aprendizagem Supervisionada: </li></ul><ul><ul><li>Classificação ( Árvores e Regras). </li></ul></ul><ul><li>Aprendizagem Não-super-visionada : </li></ul><ul><ul><li>Associação; </li></ul></ul><ul><ul><li>Clustering. </li></ul></ul>Mineração de Dados
  25. 29. Caso de Fracasso Gazelle.com (simulado) : CL/DM caro Total Information Awareness : ético?
  26. 30. Cases de Sucesso IMS América: campanha de MKT Harrah’s Entertainment Inc : clientes prospects Highmark: fraudes
  27. 31. Créditos pelas fotos: Sxc.hu e Flickr.com Referências no próximo slide Obrigado! Cassius Busemeyer - cassiusbusemeyer@hotmail.com Cristiane Luquetta - criscrical@hotmail.com Rafael Slonik – rafael@novo-mundo.org

×