Pg20235 rf20222vp20208

rikardojsf
rikardojsfMusician em Home
DATA WAREHOUSING E OLAP
                       Trabalho realizado por:
                    Paulo Gonçalves n.º 20235
                  Ricardo Fernandes n.º 20222
                       Vilma Pombo n.º 20208
O que é data warehouse?
Data warehouse é uma base dados de suporte, a decisão
que é mantida separadamente da base operacional da
organização.

Suporta processamento de informação fornecendo uma
plataforma sólida para análise de dados históricos e
consolidados.


   Data warehousing:
   O processo de construir e usar data warehouses.
Tipos de data warehouse
  ORIENTADO POR TEMA

      INTEGRADO

    VARIÁVEL TEMPO

     NÃO VOLÁTIL
ORIENTADO POR TEMA


O Data warehouse orientado por tema é organizado em
torno de temas importantes, tais como cliente, produto,
vendas.
Foca-se na modelação e análise de dados para quem
toma decisões, em vez de operações diárias e
processamento de transacções.

Fornece também uma visão simples e concisa sobre
questões de um tema particular através da exclusão de
dados que não são importantes no suporte ao processo de
decisão.
INTEGRADO


O Data warehouse integrado é construído por integração
de múltiplas e heterogéneas fontes de dados.
As Bases de dados são relacionais, contêm ficheiros
simples e registos de transacções on-line onde são
aplicadas técnicas de limpeza de dados e integração de
dados. É assim assegurada a consistência na convenção
de nomes, codificação de estruturas, atributos de
medidas, etc. entre diferentes fontes de dados (ex: Hotel
price: currency, tax, breakfast covered, etc.)

Concluindo quando a informação é movida para o
warehouse, é feita a conversão.
VARIÁVEL TEMPO


Cada estrutura chave no data warehouse contém um
elemento de tempo, explicita ou implicitamente, mas a
chave de dados operacionais pode ou não conter um
“elemento de tempo”.

O horizonte de tempo para um data warehouse é
significativamente maior do que o de sistemas
operacionais, onde a base de dados operacional contem a
informação actual, e os Dados nela contidos fornecem a
informação numa perspectiva histórica (ex: últimos 5-10
anos)
NÃO VOLÁTIL


Um Data warehouse não volátil é um repositório
fisicamente separado de dados transformados do
ambiente operacional.

Neste tipo de Data warehouse não ocorre actualização de
dados operacional sobre a informação, pois não requer
mecanismos de processamento de transacções,
recuperação e controlo de concorrência, requerendo
apenas duas operações de acesso a dados:

      - Carregamento inicial de dados;
      - Acesso a dados.
Data warehouse
              vs
    SGBD heterogéneos house
Na integração tradicional de base de dados heterogéneas
constroem-se conversores/mediadores sobre este tipo de
base de dados.

A abordagem usada é a orientada-a-consulta, ou seja,
quando uma consulta é feita a uma determinada base de
dados, usa-se um meta-dicionário para traduzir a consulta
em consultas apropriadas para outras base de dados
envolvidas, e os resultados são integrados num conjunto
resposta global.
Nesta abordagem a filtragem de informação é complexa.
Data warehouse
              vs
    SGBD heterogéneos house
Já pelo Data warehouse a abordagem usada é a orientada-
por-actualizaçao.

A informação de fontes heterogéneas é previamente
integrada e guardada em warehouses para consulta e
análise directa.
Data warehouse
                 vs
          SGBD operacionais
OLTP (on-line transaction processing)

São sistemas que se encarregam de registar todas as
transacções contidas em uma determinada operação
organizacional. Por exemplo, sistema de transacções
bancárias que regista todas as operações efectuadas num
banco, caixas de multibanco, reservas de viagens ou hotel
on-line, Cartões de Crédito.

OLTP é a tarefa principal dos SGBD relacionais
tradicionais.
Data warehouse
                 vs
          SGBD operacionais
OLAP (on-line analytical processing)

É a capacidade de manipular e analisar um grande
volume de dados sob múltiplas perspectivas.
As aplicações OLAP são usadas pelos gestores num
qualquer nível da organização para lhes permitir análises
comparativas que facilitem a suas decisões diárias.

OLAP é a tarefa principal de sistemas de data warehouse.
CARACTERÍSTICAS

                            OLTP                  OLAP

Orientação do sistema e
                            Cliente               Mercado
utilizador

Conteúdo dos dados          actuais, detalhados   históricos, consolidados

Desenho da Base de dados    ER + aplicaçao        estrela + tema

Visão                       actual, local         evolucionária, integrada

                                                  consultas read-only,
Padrões de acesso           actualização
                                                  complexas
DIFERÊNÇAS
                                          OLTP                             OLAP

Utilizadores                   Escriturário, profissional IT        Analista de mercado

Função                              Operações diárias                Suporte a decisões

Desenho da base de dados        Orientado-por-aplicaçao             Orientado-por-tema

                                 correntes, actualizados                 históricos,
Dados                             detalhados, relacional       sumarizados, multidimensionais
                                     simples isolado              integrados, consolidados

Uso                                     repetitivo                         ad-hoc
                                       read/write
Acesso                                                                Leitura exaustiva
                               index/hash na chave prim.

Unidade de trabalho            Transacção simples e curta            Consulta complexa


Numero de registos acedidos              dezenas                          Milhões

Numero de utilizadores                  milhares                          centenas

Tamanho da base de dados               100MB-GB                          100GB-TB

Métrica                         Transacções por minuto         Consultas por minuto, resposta
Modelação conceptual
        de data warehouse

Existem 3 tipos de modelação para as data warehouse:

- esquema estrela;
- esquema floco de neve;
- constelações de factos.
ESQUEMA DE ESTRELA
Tabela de factos no centro ligada a um conjunto de tabelas dimensão.
ESQUEMA FLOCO DE NEVE
Um refinamento do esquema estrela onde parte da hierarquia dimensional
é normalizada num conjunto de tabelas de dimensão mais pequenas,
numa forma similar a um floco de neve.
CONSTELAÇÕES DE FACTOS
Tabelas de factos múltiplas partilham tabelas dimensão,
formando um grupo de estrelas, logo chamado constelação de factos.
Desenho de data warehouse

Existem quatro perspectivas de desenho de um data
warehouse

- Perspectiva Top-down
Permite a selecção da informação relevante necessária
para o data warehouse.

- Perspectiva de Origem de Dados
Mostra a informação a ser adquirida, guardada e gerida
pelos sistemas operativos.
Desenho de data warehouse


- Perspectiva Data warehouse
Consiste em tabelas de factos e tabelas dimensão.

- Perspectiva de Consulta de Análise
Vê a perspectiva dos dados no warehouse do ponto de
vista do utilizador final.
Processo de desenho
         de um data warehouse
O processo de desenho de um Data Warehouse pode ser
efectuado através de 3 abordagens diferentes:

Abordagens Top-down, bottom-up ou uma combinação de ambos

- Top-down: Começa com o desenho e planeamento geral
- Bottom-up: Começa com experiencias e protótipos

Do ponto de vista da engenharia de software

- Cascata: Análise estruturada e sistemática em cada passo antes de
prosseguir para o próximo
- Espiral: Geração rápida e incremental de funcionalidades do sistema
Processo de desenho
         de um data warehouse
Processo de desenho típico de data warehouse

-Escolher um processo de negócio a modelar, e.g., encomendas,
facturas, etc.
-Escolher o grão (nível de dados atómico) do processo de negócio
-Escolher as dimensões que estão associadas a cada tabela de factos
-Escolher as medidas presentes em cada registo da tabela de factos
Arquitectura Multi-camada
Tipos de arquitectura OLAP

Existem 3 tipos diferentes de arquitecturas OLAP:
Relacional, multidimensional e hybrid OLAP.

Na arquitectura relacional (ROLAP) usa-se base de dados
relacionais estendidas para guardar e gerir os dados do
data warehouse e aplicações OLAP para suportar análise
complexa de dados.

Este tipo de arquitectura inclui uma optimização dos
sistemas de base de dados de backend e contém a
implementação de navegação baseada em agregação assim
como mais ferramentas e serviços.
Tipos de arquitectura OLAP

A arquitectura multidimensional (MOLAP) é baseada em
matrizes de armazenamento multidimensionais.
Neste tipo de arquitectura a indexação é rápida sobre
dados sumarizados pré-calculados.

A Hybrid OLAP(HOLAP) é uma combinação das outras 2
arquitecturas.
Esta arquitectura permite armazenar parte dos dados
num MOLAP e outra parte dos dados em ROLAP.
1 de 24

Recomendados

Data Warehouse por
Data WarehouseData Warehouse
Data WarehouseThiago Oliveira
7.6K visualizações49 slides
Data warehousing - Técnicas e procedimentos por
Data warehousing - Técnicas e procedimentosData warehousing - Técnicas e procedimentos
Data warehousing - Técnicas e procedimentosMarcos Pessoa
1.8K visualizações51 slides
Data Warehouse e Data Mining por
Data Warehouse e Data MiningData Warehouse e Data Mining
Data Warehouse e Data MiningMauricio Cesar Santos da Purificação
1.7K visualizações45 slides
OLAP por
OLAPOLAP
OLAPEder E. Pereira
1K visualizações27 slides
Data Warehouse por
Data WarehouseData Warehouse
Data WarehouseMenelik Soares
474 visualizações18 slides
Data Mart e Data Warehouse por
Data Mart e Data WarehouseData Mart e Data Warehouse
Data Mart e Data WarehouseFernando Peres
12.2K visualizações11 slides

Mais conteúdo relacionado

Mais procurados

UCP - Projeto de Banco de Dados - Data Warehouse por
UCP - Projeto de Banco de Dados - Data WarehouseUCP - Projeto de Banco de Dados - Data Warehouse
UCP - Projeto de Banco de Dados - Data WarehouseVinícius Amaral
1.8K visualizações20 slides
Data Mining e Data Warehouse por
Data Mining e Data WarehouseData Mining e Data Warehouse
Data Mining e Data WarehouseJeorgeCarmona
7K visualizações28 slides
Datawarehouse por
DatawarehouseDatawarehouse
DatawarehouseAlana Souza
2.9K visualizações44 slides
Introdução ao Data Warehouse por
Introdução ao Data WarehouseIntrodução ao Data Warehouse
Introdução ao Data WarehouseMessias Batista
701 visualizações41 slides
OLAP, BI, EIS por
OLAP, BI, EISOLAP, BI, EIS
OLAP, BI, EISNetalva - Joel Alvarenga
3.2K visualizações44 slides
Business Intelligence - Data Warehouse por
Business Intelligence - Data WarehouseBusiness Intelligence - Data Warehouse
Business Intelligence - Data WarehouseRudson Kiyoshi Souza Carvalho
1.6K visualizações59 slides

Mais procurados(20)

UCP - Projeto de Banco de Dados - Data Warehouse por Vinícius Amaral
UCP - Projeto de Banco de Dados - Data WarehouseUCP - Projeto de Banco de Dados - Data Warehouse
UCP - Projeto de Banco de Dados - Data Warehouse
Vinícius Amaral1.8K visualizações
Data Mining e Data Warehouse por JeorgeCarmona
Data Mining e Data WarehouseData Mining e Data Warehouse
Data Mining e Data Warehouse
JeorgeCarmona7K visualizações
Datawarehouse por Alana Souza
DatawarehouseDatawarehouse
Datawarehouse
Alana Souza2.9K visualizações
Introdução ao Data Warehouse por Messias Batista
Introdução ao Data WarehouseIntrodução ao Data Warehouse
Introdução ao Data Warehouse
Messias Batista701 visualizações
Kimball Vs Inmon por guest2308b5
Kimball Vs InmonKimball Vs Inmon
Kimball Vs Inmon
guest2308b514.7K visualizações
Data warehouse & Data mining por Cassius Busemeyer
Data warehouse & Data miningData warehouse & Data mining
Data warehouse & Data mining
Cassius Busemeyer8.9K visualizações
Projeto de Banco de Dados - Capítulo 1 por Januário Neto
Projeto de Banco de Dados - Capítulo 1Projeto de Banco de Dados - Capítulo 1
Projeto de Banco de Dados - Capítulo 1
Januário Neto1.2K visualizações
Tópico 2 por Douglas Godoi
Tópico 2Tópico 2
Tópico 2
Douglas Godoi165 visualizações
Sistemas de Informação (SAD / OLAP) por m4rkSpinelli
Sistemas de Informação (SAD / OLAP)Sistemas de Informação (SAD / OLAP)
Sistemas de Informação (SAD / OLAP)
m4rkSpinelli10.4K visualizações
Data warehousing por acistec
Data warehousingData warehousing
Data warehousing
acistec2.5K visualizações
Desenhar o conceito de data warehouse numa biblioteca da universidade por Aristidis Jesus
Desenhar o conceito de data warehouse numa biblioteca da universidadeDesenhar o conceito de data warehouse numa biblioteca da universidade
Desenhar o conceito de data warehouse numa biblioteca da universidade
Aristidis Jesus1.3K visualizações
Modelos de Banco de dados e SGBDS por Mahuan Capeletto Abdala
Modelos de Banco de dados e SGBDSModelos de Banco de dados e SGBDS
Modelos de Banco de dados e SGBDS
Mahuan Capeletto Abdala21.2K visualizações
Exploracao datawarehouse mineracao_de_dados_ou_olap por KlaytonAlves
Exploracao datawarehouse mineracao_de_dados_ou_olapExploracao datawarehouse mineracao_de_dados_ou_olap
Exploracao datawarehouse mineracao_de_dados_ou_olap
KlaytonAlves421 visualizações
Aula 1 introdução a base de dados por Hélio Martins
Aula 1   introdução a base de dadosAula 1   introdução a base de dados
Aula 1 introdução a base de dados
Hélio Martins9K visualizações
Aplicação de Business Intelligence em Laboratórios Clínicos como ferramenta p... por fabiolagrijo
Aplicação de Business Intelligence em Laboratórios Clínicos como ferramenta p...Aplicação de Business Intelligence em Laboratórios Clínicos como ferramenta p...
Aplicação de Business Intelligence em Laboratórios Clínicos como ferramenta p...
fabiolagrijo1.6K visualizações
Arquitetura e sgbd de um banco de dados por diogocbj
Arquitetura e sgbd de um banco de dadosArquitetura e sgbd de um banco de dados
Arquitetura e sgbd de um banco de dados
diogocbj15.1K visualizações

Destaque

Pam,ela guamanb 4 b por
Pam,ela guamanb 4 bPam,ela guamanb 4 b
Pam,ela guamanb 4 bluzmariadelsol1995
174 visualizações11 slides
Sisustuskivetcom Esite Shadow Stone por
Sisustuskivetcom Esite Shadow StoneSisustuskivetcom Esite Shadow Stone
Sisustuskivetcom Esite Shadow StoneEravia
86 visualizações4 slides
A agua por
A aguaA agua
A aguaanibal16626
258 visualizações10 slides
Juan pablo ii caricaturas por
Juan pablo ii caricaturasJuan pablo ii caricaturas
Juan pablo ii caricaturasjemos123
172 visualizações17 slides
Sito por
SitoSito
Sitosimonef21
78 visualizações5 slides
Cartell%20 marga[1] por
Cartell%20 marga[1]Cartell%20 marga[1]
Cartell%20 marga[1]margaff
63 visualizações3 slides

Destaque(19)

Pam,ela guamanb 4 b por luzmariadelsol1995
Pam,ela guamanb 4 bPam,ela guamanb 4 b
Pam,ela guamanb 4 b
luzmariadelsol1995174 visualizações
Sisustuskivetcom Esite Shadow Stone por Eravia
Sisustuskivetcom Esite Shadow StoneSisustuskivetcom Esite Shadow Stone
Sisustuskivetcom Esite Shadow Stone
Eravia86 visualizações
A agua por anibal16626
A aguaA agua
A agua
anibal16626258 visualizações
Juan pablo ii caricaturas por jemos123
Juan pablo ii caricaturasJuan pablo ii caricaturas
Juan pablo ii caricaturas
jemos123172 visualizações
Sito por simonef21
SitoSito
Sito
simonef2178 visualizações
Cartell%20 marga[1] por margaff
Cartell%20 marga[1]Cartell%20 marga[1]
Cartell%20 marga[1]
margaff63 visualizações
Question 2 - Evaluation por heyitsdanni_
Question 2 - EvaluationQuestion 2 - Evaluation
Question 2 - Evaluation
heyitsdanni_121 visualizações
Trabajo miriam por miriamarsan
Trabajo miriamTrabajo miriam
Trabajo miriam
miriamarsan69 visualizações
도유진 por vivadick0425
도유진도유진
도유진
vivadick0425135 visualizações
Torey's slideshow por tom-asselstine
Torey's slideshowTorey's slideshow
Torey's slideshow
tom-asselstine93 visualizações
Tv radio 2 por anibal16626
Tv radio 2Tv radio 2
Tv radio 2
anibal16626241 visualizações
972003 por luzjannete
972003972003
972003
luzjannete83 visualizações
Virus y vacunas informaticas por oscarsfonseca
Virus y vacunas informaticasVirus y vacunas informaticas
Virus y vacunas informaticas
oscarsfonseca140 visualizações
Apresentacao PPT Template por Marcela Uehara
Apresentacao PPT TemplateApresentacao PPT Template
Apresentacao PPT Template
Marcela Uehara257 visualizações
Contrato internacional por Jimmy Kfk
Contrato internacionalContrato internacional
Contrato internacional
Jimmy Kfk97 visualizações
Penilaian psma wayan18092015 por Wayan Sumertha
Penilaian psma wayan18092015Penilaian psma wayan18092015
Penilaian psma wayan18092015
Wayan Sumertha1.3K visualizações
Penilaian Kinerja Guru ( PKG ) por purdiyanto -
Penilaian Kinerja Guru ( PKG )Penilaian Kinerja Guru ( PKG )
Penilaian Kinerja Guru ( PKG )
purdiyanto -42.6K visualizações
Sueño hecho realidad de dos visionarios por SISTEMA EDUCATIVO SEFMOL
Sueño hecho realidad de dos visionariosSueño hecho realidad de dos visionarios
Sueño hecho realidad de dos visionarios
SISTEMA EDUCATIVO SEFMOL325 visualizações

Similar a Pg20235 rf20222vp20208

Data warehouse por
Data warehouseData warehouse
Data warehouseRuiPedroGomes7
476 visualizações11 slides
Oltp artigo 1 por
Oltp artigo 1Oltp artigo 1
Oltp artigo 1kaze002
666 visualizações7 slides
Ecosistema de data warehouse com ferramentas microsoft por
Ecosistema de data warehouse com ferramentas microsoftEcosistema de data warehouse com ferramentas microsoft
Ecosistema de data warehouse com ferramentas microsoftDennes Torres
433 visualizações50 slides
GS1-Data_Archtecture v2.pptx por
GS1-Data_Archtecture v2.pptxGS1-Data_Archtecture v2.pptx
GS1-Data_Archtecture v2.pptxDoisbagus2bagus
3 visualizações11 slides
Banco de dados parte 01 por
Banco de dados parte 01Banco de dados parte 01
Banco de dados parte 01Barbara Beatriz Santos
1.1K visualizações13 slides
Conceitos DW por
Conceitos DWConceitos DW
Conceitos DWStella Finamore
72 visualizações11 slides

Similar a Pg20235 rf20222vp20208(20)

Data warehouse por RuiPedroGomes7
Data warehouseData warehouse
Data warehouse
RuiPedroGomes7476 visualizações
Oltp artigo 1 por kaze002
Oltp artigo 1Oltp artigo 1
Oltp artigo 1
kaze002666 visualizações
Ecosistema de data warehouse com ferramentas microsoft por Dennes Torres
Ecosistema de data warehouse com ferramentas microsoftEcosistema de data warehouse com ferramentas microsoft
Ecosistema de data warehouse com ferramentas microsoft
Dennes Torres433 visualizações
GS1-Data_Archtecture v2.pptx por Doisbagus2bagus
GS1-Data_Archtecture v2.pptxGS1-Data_Archtecture v2.pptx
GS1-Data_Archtecture v2.pptx
Doisbagus2bagus3 visualizações
Conceitos DW por Stella Finamore
Conceitos DWConceitos DW
Conceitos DW
Stella Finamore72 visualizações
Bi microsoft & pentaho por cristian_custodio
Bi microsoft & pentahoBi microsoft & pentaho
Bi microsoft & pentaho
cristian_custodio653 visualizações
Parte8 - Fundamentos de Sistema de Informação por Gabriel Faustino
Parte8 - Fundamentos de Sistema de InformaçãoParte8 - Fundamentos de Sistema de Informação
Parte8 - Fundamentos de Sistema de Informação
Gabriel Faustino2K visualizações
Conceitos Base_de_Dados.pdf por ticepcCapelas
Conceitos Base_de_Dados.pdfConceitos Base_de_Dados.pdf
Conceitos Base_de_Dados.pdf
ticepcCapelas7 visualizações
Tomada decisão por Ecoplas
Tomada decisãoTomada decisão
Tomada decisão
Ecoplas3.6K visualizações
Olap (PROCESSAMENTO ANALÍTICO ONLINE) por EderPereira33
Olap (PROCESSAMENTO ANALÍTICO ONLINE)Olap (PROCESSAMENTO ANALÍTICO ONLINE)
Olap (PROCESSAMENTO ANALÍTICO ONLINE)
EderPereira3350 visualizações
por_detras_dos_relatorios por arthurjosemberg
por_detras_dos_relatoriospor_detras_dos_relatorios
por_detras_dos_relatorios
arthurjosemberg175 visualizações
Banco aula 01 por Leclerc Victer
Banco aula 01Banco aula 01
Banco aula 01
Leclerc Victer49 visualizações
2019-2 - BD I - Aula 01 C - Introdução a Banco de Dados por Rodrigo Kiyoshi Saito
2019-2 - BD I - Aula 01 C - Introdução a Banco de Dados2019-2 - BD I - Aula 01 C - Introdução a Banco de Dados
2019-2 - BD I - Aula 01 C - Introdução a Banco de Dados
Rodrigo Kiyoshi Saito125 visualizações
Data warehouse & olap por Brian Supra
Data warehouse & olapData warehouse & olap
Data warehouse & olap
Brian Supra259 visualizações
Data Warehouse por Maicon Silva
Data WarehouseData Warehouse
Data Warehouse
Maicon Silva1.3K visualizações

Pg20235 rf20222vp20208

  • 1. DATA WAREHOUSING E OLAP Trabalho realizado por: Paulo Gonçalves n.º 20235 Ricardo Fernandes n.º 20222 Vilma Pombo n.º 20208
  • 2. O que é data warehouse? Data warehouse é uma base dados de suporte, a decisão que é mantida separadamente da base operacional da organização. Suporta processamento de informação fornecendo uma plataforma sólida para análise de dados históricos e consolidados. Data warehousing: O processo de construir e usar data warehouses.
  • 3. Tipos de data warehouse ORIENTADO POR TEMA INTEGRADO VARIÁVEL TEMPO NÃO VOLÁTIL
  • 4. ORIENTADO POR TEMA O Data warehouse orientado por tema é organizado em torno de temas importantes, tais como cliente, produto, vendas. Foca-se na modelação e análise de dados para quem toma decisões, em vez de operações diárias e processamento de transacções. Fornece também uma visão simples e concisa sobre questões de um tema particular através da exclusão de dados que não são importantes no suporte ao processo de decisão.
  • 5. INTEGRADO O Data warehouse integrado é construído por integração de múltiplas e heterogéneas fontes de dados. As Bases de dados são relacionais, contêm ficheiros simples e registos de transacções on-line onde são aplicadas técnicas de limpeza de dados e integração de dados. É assim assegurada a consistência na convenção de nomes, codificação de estruturas, atributos de medidas, etc. entre diferentes fontes de dados (ex: Hotel price: currency, tax, breakfast covered, etc.) Concluindo quando a informação é movida para o warehouse, é feita a conversão.
  • 6. VARIÁVEL TEMPO Cada estrutura chave no data warehouse contém um elemento de tempo, explicita ou implicitamente, mas a chave de dados operacionais pode ou não conter um “elemento de tempo”. O horizonte de tempo para um data warehouse é significativamente maior do que o de sistemas operacionais, onde a base de dados operacional contem a informação actual, e os Dados nela contidos fornecem a informação numa perspectiva histórica (ex: últimos 5-10 anos)
  • 7. NÃO VOLÁTIL Um Data warehouse não volátil é um repositório fisicamente separado de dados transformados do ambiente operacional. Neste tipo de Data warehouse não ocorre actualização de dados operacional sobre a informação, pois não requer mecanismos de processamento de transacções, recuperação e controlo de concorrência, requerendo apenas duas operações de acesso a dados: - Carregamento inicial de dados; - Acesso a dados.
  • 8. Data warehouse vs SGBD heterogéneos house Na integração tradicional de base de dados heterogéneas constroem-se conversores/mediadores sobre este tipo de base de dados. A abordagem usada é a orientada-a-consulta, ou seja, quando uma consulta é feita a uma determinada base de dados, usa-se um meta-dicionário para traduzir a consulta em consultas apropriadas para outras base de dados envolvidas, e os resultados são integrados num conjunto resposta global. Nesta abordagem a filtragem de informação é complexa.
  • 9. Data warehouse vs SGBD heterogéneos house Já pelo Data warehouse a abordagem usada é a orientada- por-actualizaçao. A informação de fontes heterogéneas é previamente integrada e guardada em warehouses para consulta e análise directa.
  • 10. Data warehouse vs SGBD operacionais OLTP (on-line transaction processing) São sistemas que se encarregam de registar todas as transacções contidas em uma determinada operação organizacional. Por exemplo, sistema de transacções bancárias que regista todas as operações efectuadas num banco, caixas de multibanco, reservas de viagens ou hotel on-line, Cartões de Crédito. OLTP é a tarefa principal dos SGBD relacionais tradicionais.
  • 11. Data warehouse vs SGBD operacionais OLAP (on-line analytical processing) É a capacidade de manipular e analisar um grande volume de dados sob múltiplas perspectivas. As aplicações OLAP são usadas pelos gestores num qualquer nível da organização para lhes permitir análises comparativas que facilitem a suas decisões diárias. OLAP é a tarefa principal de sistemas de data warehouse.
  • 12. CARACTERÍSTICAS OLTP OLAP Orientação do sistema e Cliente Mercado utilizador Conteúdo dos dados actuais, detalhados históricos, consolidados Desenho da Base de dados ER + aplicaçao estrela + tema Visão actual, local evolucionária, integrada consultas read-only, Padrões de acesso actualização complexas
  • 13. DIFERÊNÇAS OLTP OLAP Utilizadores Escriturário, profissional IT Analista de mercado Função Operações diárias Suporte a decisões Desenho da base de dados Orientado-por-aplicaçao Orientado-por-tema correntes, actualizados históricos, Dados detalhados, relacional sumarizados, multidimensionais simples isolado integrados, consolidados Uso repetitivo ad-hoc read/write Acesso Leitura exaustiva index/hash na chave prim. Unidade de trabalho Transacção simples e curta Consulta complexa Numero de registos acedidos dezenas Milhões Numero de utilizadores milhares centenas Tamanho da base de dados 100MB-GB 100GB-TB Métrica Transacções por minuto Consultas por minuto, resposta
  • 14. Modelação conceptual de data warehouse Existem 3 tipos de modelação para as data warehouse: - esquema estrela; - esquema floco de neve; - constelações de factos.
  • 15. ESQUEMA DE ESTRELA Tabela de factos no centro ligada a um conjunto de tabelas dimensão.
  • 16. ESQUEMA FLOCO DE NEVE Um refinamento do esquema estrela onde parte da hierarquia dimensional é normalizada num conjunto de tabelas de dimensão mais pequenas, numa forma similar a um floco de neve.
  • 17. CONSTELAÇÕES DE FACTOS Tabelas de factos múltiplas partilham tabelas dimensão, formando um grupo de estrelas, logo chamado constelação de factos.
  • 18. Desenho de data warehouse Existem quatro perspectivas de desenho de um data warehouse - Perspectiva Top-down Permite a selecção da informação relevante necessária para o data warehouse. - Perspectiva de Origem de Dados Mostra a informação a ser adquirida, guardada e gerida pelos sistemas operativos.
  • 19. Desenho de data warehouse - Perspectiva Data warehouse Consiste em tabelas de factos e tabelas dimensão. - Perspectiva de Consulta de Análise Vê a perspectiva dos dados no warehouse do ponto de vista do utilizador final.
  • 20. Processo de desenho de um data warehouse O processo de desenho de um Data Warehouse pode ser efectuado através de 3 abordagens diferentes: Abordagens Top-down, bottom-up ou uma combinação de ambos - Top-down: Começa com o desenho e planeamento geral - Bottom-up: Começa com experiencias e protótipos Do ponto de vista da engenharia de software - Cascata: Análise estruturada e sistemática em cada passo antes de prosseguir para o próximo - Espiral: Geração rápida e incremental de funcionalidades do sistema
  • 21. Processo de desenho de um data warehouse Processo de desenho típico de data warehouse -Escolher um processo de negócio a modelar, e.g., encomendas, facturas, etc. -Escolher o grão (nível de dados atómico) do processo de negócio -Escolher as dimensões que estão associadas a cada tabela de factos -Escolher as medidas presentes em cada registo da tabela de factos
  • 23. Tipos de arquitectura OLAP Existem 3 tipos diferentes de arquitecturas OLAP: Relacional, multidimensional e hybrid OLAP. Na arquitectura relacional (ROLAP) usa-se base de dados relacionais estendidas para guardar e gerir os dados do data warehouse e aplicações OLAP para suportar análise complexa de dados. Este tipo de arquitectura inclui uma optimização dos sistemas de base de dados de backend e contém a implementação de navegação baseada em agregação assim como mais ferramentas e serviços.
  • 24. Tipos de arquitectura OLAP A arquitectura multidimensional (MOLAP) é baseada em matrizes de armazenamento multidimensionais. Neste tipo de arquitectura a indexação é rápida sobre dados sumarizados pré-calculados. A Hybrid OLAP(HOLAP) é uma combinação das outras 2 arquitecturas. Esta arquitectura permite armazenar parte dos dados num MOLAP e outra parte dos dados em ROLAP.