Modelagem Dimensional

8.288 visualizações

Publicada em

Palestra de Modelagem Dimensional, ministrada pelo Marco Garcia da Cetax Consultoria na Faculdade CFSA em São Bernardo do Campo - SP

Publicada em: Tecnologia
2 comentários
6 gostaram
Estatísticas
Notas
Sem downloads
Visualizações
Visualizações totais
8.288
No SlideShare
0
A partir de incorporações
0
Número de incorporações
182
Ações
Compartilhamentos
0
Downloads
0
Comentários
2
Gostaram
6
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Modelagem Dimensional

  1. 1. Palestra sobre Modelagem Dimensional CFSA – São Bernardo do Campo - SP<br />Cetax Consultoria e Treinamentos<br />Maio/2009<br />
  2. 2. Apresentação - Cetax<br /><ul><li>A Cetax é uma empresa de consultoria e treinamento especializada em sistemas de Business Intelligence e Data Warehouse
  3. 3. Existe desde 2000 trabalhando exclusivamente com BI e DW
  4. 4. Nossos treinamentos são exclusivos sem cursos semelhantes no Brasil
  5. 5. Outros cursos são ministrados em parcerias com outras empresas do mercado ou mesmo profissionais que possuem experiência diferenciada</li></ul>Modelagem Dimensional<br />
  6. 6. Apresentação - Instrutor<br /><ul><li>Marco Antonio Garcia
  7. 7. 15 anos de experiência em TI, sendo 9 exclusivamente com Business Intelligence e Data Warehouse.
  8. 8. Certificado pelo Kimball University nos EUA, onde teve aula pessoalmente com Ralph Kimball, um dos principais gurus do data Warehouse.
  9. 9. Vivência profissional em diversos projetos, passando por Bancos e Financeiras, Construção, Serviços, Varejo, Marketing e outros.</li></ul>Modelagem Dimensional<br />
  10. 10. Fatos, Dimensões e GranularidadeIniciando a Modelagem Dimensional<br />Fatos – medidas, métricas, acontecimentos ou valores.<br />Dimensões – descrições, características, localidade, detalhamento.<br />Granularidade – nível de detalhe da informação.<br />Modelagem Dimensional<br />
  11. 11. Objeto com características desnormalizadas:<br />Decodes, hierarquias, rollups.<br />Atributos da dimensão. <br />Descrições e restrições das queries.<br />Clausulas BY e WHERE das queries.<br />Conjunto de descrições :<br />Características Físicas<br />Descrições baseados nas regras de negócios ou com significado modificado.<br />Terminologias: Dimensões<br />Modelagem Dimensional<br />
  12. 12. Chaves Primarias das Dimensões.<br />Surrogate Key<br />Numero inteiro seqüencial, exceto em datas. Para as datas pode-se utilizar o tipo date ou um numérico representando a data, como YYYYMMDD, por exemplo. <br />Utilizado para unir as dimensões as tabelas de fatos.<br />A Chave natural da tabela origem é utilizada para geração da surrogate key.<br />Benefícios:<br />Isola o datawarehouse do sistema operacional<br />Incrementa a performance<br />Pode-se utilizar atributos como “Não se aplica”,”Dado a ser determinado”.<br />Permite a integração de diversas fontes.<br />Suporta rastrear mudanças nos dados, Slowly Changing Dimensions.<br />Desvantagem<br />O ETL torna-se mais complexo.<br />Modelagem Dimensional<br />
  13. 13. Terminologias: Tabelas Fatos<br />Resolve os relacionamentos Muitos-para-Muitos entre as dimensões.<br />Chave Primaria<br />Geralmente é um subset das foreign keys.<br />Fatos<br />São métricas resultantes do processo de negocio ou eventos.<br />Geralmente são numéricas.<br />Geralmente são aditivas, mas não sempre.<br />Modelagem Dimensional<br />
  14. 14. Granularidade<br />Identifica o nível de detalhe.<br />1 Grão por fato<br />Nova Fato a cada novo grão<br />Grão Atômico da mais flexibilidade<br />Degenerated Dimension (DD)<br />Sem correspondente na Dimensão<br />Chave Operacional<br />Mais sobre tabelas Fatos<br />Modelagem Dimensional<br />
  15. 15. Terminologia - Dimensional Model ou Star Schema <br />1 Fato por processo de negocio<br />Benefícios<br />Fácil entendimento<br />Performance<br />Facilita mudanças<br />Modelagem Dimensional<br />
  16. 16. Resista ao Snowflaking<br />Modelagem Dimensional<br />
  17. 17. Star X Snowflakes Models<br />Modelagem Dimensional<br />
  18. 18. Somente Dados sumarizados<br />Soluções Departamentais<br />Sem foco na Empresa, tático mas não estratégico<br />Não integrável<br />Não escalável<br />Pode ser implementada com SQL e Views sobre um modelo relacional<br />Fabulas sobre Modelagem Dimensional<br />Modelagem Dimensional<br />
  19. 19. Data WarehouseBus Architecture<br />Modelagem Dimensional<br />
  20. 20. EnterpriseData Warehouse Bus Matrix<br />Modelagem Dimensional<br />
  21. 21. Modelagem Dimensional no Ciclo de Vida do DW <br />Modelagem Dimensional<br />
  22. 22. Usando Slowly Changing Dimensions<br />Atributos da Dimensão que se alteram<br />Clientes que tenham filhos, mudam de cidade, casam, separam, etc.<br />Para cada atributo da dimensão é necessário identificar uma estratégia para capturar a mudança<br />Pode-se mesmo utilizar uma combinação de estratégias em uma única dimensão.<br />Modelagem Dimensional<br />
  23. 23. Técnicas Fundamentais para Slowly Changing Dimensions<br />Type 1 : Sobrescreve<br />Corrige enganos ou remove dados antigos<br />Type 2 : Cria nova linha na dimensão<br />Divide os dados históricos<br />Type 3 : Adiciona um atributo para tratar o dado antigo.<br />Trabalha com 2 informações na mesma linha de dados, dado anterior e dado atual<br />Modelagem Dimensional<br />
  24. 24. Dimensões de Tempo<br /><ul><li>Essas dimensões são a melhor maneira de montar quebras e hierarquias envolvendo medidas de tempo.
  25. 25. Podemos ter pelo menos 3 tipos
  26. 26. Dias
  27. 27. Meses
  28. 28. Horas</li></ul>Modelagem Dimensional<br />
  29. 29. Dimensões de Tempo - Meses<br />DIM_TEMPO_MES<br />TEMPO_MES (PK)<br />DESC_CURTA_MES<br />DESC_LONGA_MES<br />DESC_CURTA_MES_ANO<br />DESC_LONGA_MES_ANO<br />DESC_ANO_MES<br />NUM_ANO<br />ULTIMO_DIA_MES<br />ULTIMO_DIA_UTIL_MES<br />Exemplos de valores :<br />101<br />FEV<br />Fevereiro<br />FEV/2007<br />Fevereiro/2007<br />2007/02<br />2007<br />28/02/2007<br />28/02/2007<br />100<br />JAN<br />Janeiro<br />JAN/2007<br />Janeiro/2007<br />2007/01<br />2007<br />31/01/2007<br />31/01/2007<br />Modelagem Dimensional<br />
  30. 30. Dimensões de Tempo - Horas<br />DIM_TEMPO_HORAMIN<br />TEMPO_HHMM (PK)<br />NUM_HORAS<br />NUM_MINUTOS<br />DESC_HHMM<br />DESC_PERIODO<br />DESC_HHMM_INICIO<br />DESC_HHMM_FINAL<br />Exemplos de valores :<br />1<br />0<br />0<br />00:00<br />Madrugada<br />00:00<br />05:59<br />2341<br />23<br />40<br />23:40<br />Noite<br />18:00<br />23:59<br />1013<br />10<br />12<br />10:12<br />Manhã<br />06:00<br />11:59<br />Modelagem Dimensional<br />
  31. 31. Perguntas ?<br />Visitem nosso site e conheçam melhor nossos serviços e treinamentos.<br />www.cetax.com.br<br />Muito Obrigado !<br />Marco Garcia ( mgarcia@cetax.com.br )<br />Finalizando<br />Modelagem Dimensional<br />

×