Lição Modelo Dimensional

2.441 visualizações

Publicada em

Dimensional model description

Publicada em: Educação
0 comentários
0 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

  • Seja a primeira pessoa a gostar disto

Sem downloads
Visualizações
Visualizações totais
2.441
No SlideShare
0
A partir de incorporações
0
Número de incorporações
116
Ações
Compartilhamentos
0
Downloads
58
Comentários
0
Gostaram
0
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide
  • Lição Modelo Dimensional

    1. 1. Mineração e Armazenamento de Dados Carlos P. Caldeira Departamento de Informática Universidade de Évora [email_address] http://www.di.uevora.pt/~ccaldeira
    2. 2. Modelo dimensional
    3. 3. Modelo dimensional <ul><li>Modelo Entidade-Relação </li></ul><ul><li>Limitações dos SGBDR </li></ul><ul><li>Modelo dimensional: com fácil acesso e utilização </li></ul>
    4. 4. Modelo relacional <ul><li>Objectivos: </li></ul><ul><ul><li>Redundância </li></ul></ul><ul><ul><li>Integridade </li></ul></ul><ul><li>Consequência: </li></ul><ul><ul><li>Transações </li></ul></ul><ul><ul><li>Divisão dos dados </li></ul></ul><ul><ul><li>Teia intrincada </li></ul></ul><ul><ul><li>Todas as tabelas são semelhantes </li></ul></ul>
    5. 5. Modelo relacional <ul><li>Problemas: </li></ul><ul><ul><li>Queries </li></ul></ul><ul><ul><ul><ul><li>simples </li></ul></ul></ul></ul><ul><ul><ul><ul><li>complexas </li></ul></ul></ul></ul><ul><ul><li>Diagramas demasiado complexos </li></ul></ul><ul><ul><li>Número de possibilidades num join </li></ul></ul>
    6. 6. Modelo relacional <ul><li>Análise complexa? </li></ul><ul><li>Calcular a percentagem do total das vendas para </li></ul><ul><li>cada produto, por categoria e cidade, comparado </li></ul><ul><li>com o mesmo período do ano anterior. </li></ul><ul><ul><li>pergunta complicada? </li></ul></ul><ul><ul><li>como faz o utilizador? </li></ul></ul>
    7. 7. Análise dos dados OLTP: Qual foi o lucro gerado pelo novo produto? DSS: Qual foi o lucro gerado pelo novo produto por mês, na Beira Litoral, por nível demográfico, em cada ponto de venda, em relação à anterior versão do produto?
    8. 8. Modelo multi-dimensional <ul><li>Estrutura adequada aos utilizadores </li></ul><ul><li>“ Olhar” para os dados usando uma vista multi-dimensional </li></ul><ul><li>Modelo de dados </li></ul><ul><li>Diagrama </li></ul>
    9. 9. Modelo dimensional <ul><li>Dois grupos: factos e dimensões </li></ul><ul><ul><li>dados a analisar </li></ul></ul><ul><ul><li>atributos sobre os factos </li></ul></ul>
    10. 10. Tabela de factos <ul><li>Tabela principal </li></ul><ul><li>facto - é uma medida da actividade </li></ul>
    11. 11. Tabelas de dimensões <ul><li>Contêm a descrição textual do negócio </li></ul><ul><li>Muitos atributos </li></ul><ul><li>Cada dimensão é definida pela PK </li></ul><ul><li>Principal fonte de informação </li></ul><ul><li>Manter o DW utilizável </li></ul><ul><li>Não-normalizadas </li></ul>
    12. 12. Modelo dimensional Star Join Schema <ul><li>Simplicidade e simetria </li></ul><ul><li>Compreensão e navegabilidade </li></ul><ul><li>Melhor performance </li></ul><ul><li>Dados atómicos </li></ul>
    13. 13. Complementaridade entre...
    14. 14. Complementaridade entre...
    15. 15. Asneiras... <ul><li>Utilização de nomes crípticos: </li></ul><ul><li>T_Colegio </li></ul><ul><li>T_Grau </li></ul><ul><li>T_Especialidade </li></ul><ul><li>Num_Al </li></ul><ul><li>Doc_Id </li></ul><ul><li>Cd_cr_key </li></ul><ul><li>etc. …………. </li></ul>
    16. 16. Asneiras... Tabela tradução de códigos
    17. 17. Modelo dimensional Casos de Estudo
    18. 18. As quatro fases do desenho <ul><li>Escolha do processo a modelar </li></ul><ul><ul><li>Um processo não é... </li></ul></ul><ul><ul><li>Publicar os dados apenas uma vez </li></ul></ul>
    19. 19. As quatro fases do desenho <ul><li>Declaração do grão do processo </li></ul><ul><ul><li>Nível de detalhe, o que significa... </li></ul></ul><ul><ul><li>Exem p los : </li></ul></ul><ul><ul><ul><ul><li>Cada um dos medicamentos... </li></ul></ul></ul></ul><ul><ul><ul><ul><li>A classificação a cada disciplina... </li></ul></ul></ul></ul><ul><ul><ul><ul><li>O balanço mensal de uma conta... </li></ul></ul></ul></ul><ul><ul><ul><ul><li>O bilhete de embarque... </li></ul></ul></ul></ul>
    20. 20. As quatro fases do desenho <ul><li>Escolha das dimensões </li></ul><ul><ul><li>Quais são as propriedades dos dados? </li></ul></ul><ul><ul><li>Se a granularidade for bem escolhida... </li></ul></ul>
    21. 21. As quatro fases do desenho <ul><li>Identificação dos factos numéricos </li></ul><ul><ul><li>O que se está a medir? </li></ul></ul><ul><ul><li>Os factos têm que estar de acordo com o nível de detalhe definido no ponto 2 . </li></ul></ul>
    22. 22. Empresa distribuição (retail case) <ul><li>Cada loja: mercearia, drogaria, lácteos, padaria, ... </li></ul><ul><li>Cada loja tem  60 000 produtos: </li></ul><ul><ul><ul><li>código de inventário </li></ul></ul></ul><ul><ul><ul><li>5 000 não têm UPC </li></ul></ul></ul><ul><li>Processo </li></ul><ul><li>Grão </li></ul><ul><li>Dimensões </li></ul><ul><li>Factos </li></ul>
    23. 23. Empresa distribuição <ul><li>Estudar as vendas nos POS </li></ul><ul><ul><li>Analisar o comportamento dos clientes </li></ul></ul><ul><ul><li>Tipo de vendas por loja </li></ul></ul><ul><ul><li>Promoções </li></ul></ul>
    24. 24. Empresa distribuição <ul><li>Cada linha numa venda no POS </li></ul><ul><ul><li>Dados atómicos são naturalmente dimensionais </li></ul></ul><ul><ul><ul><li>alto valor analítico </li></ul></ul></ul><ul><ul><ul><li>agregado de múltiplas formas </li></ul></ul></ul><ul><ul><ul><li>Qualquer estudo-resumo pode ter base nos dados atómicos mas... </li></ul></ul></ul>
    25. 25. Empresa distribuição <ul><li>Derivação das dimensões </li></ul><ul><ul><li>Loja, produto e data </li></ul></ul><ul><ul><ul><ul><li>dimensões primárias </li></ul></ul></ul></ul><ul><ul><ul><li>Promoção </li></ul></ul></ul><ul><ul><ul><ul><li>dimensão adicional </li></ul></ul></ul></ul>
    26. 26. Empresa distribuição <ul><li>Escolha dos factos </li></ul><ul><ul><li>Os factos têm que alinhar com o grão escolhido </li></ul></ul><ul><ul><li>Que factos são recolhidos num POS? </li></ul></ul><ul><ul><ul><li>a quantidade vendida </li></ul></ul></ul><ul><ul><ul><li>o valor da venda </li></ul></ul></ul>
    27. 27. Data - dimensão

    ×