1. Data Warehouse
Primeiro Conceito
• Data Warehouse
o Um Data Warehouse é um conjunto de
dados baseado em assuntos, integrado,
não volátil, e variável em relação ao tempo,
de apoio às decisõesgerenciais
William Immon – 1992
• Há estudos indicam que não existam produtos
que apliquem todos os requisitos para sua
utilização
2. Segundo Conceito
• O Data Warehouse (DW) é um conjunto de
técnicas que aplicadas em conjunto geram
um sistema de dados que nos proporcionam
informações para tomada de decisões.
• Data Warehousing não é um produto, e sim
uma estratégia que reconhece a necessidade
de armazenar dados, separadamente, em
sistemas de informação e consolidá-los, de
forma a assistir diversos profissionais de uma
empresa na tomada de decisões de modo
rápido e eficaz.
3. Premissas
• A informação é um bem valioso para a empresa;
• Decisões precisam ser tomadas rapidamente e
corretamente, usando todo dado disponível;
• Usuários são “experts” em negócios, e não profissionais
em tecnologia;
• O volume de dados cresce vertiginosamente, o que afeta
o tempo de resposta e a habilidade de compreender seu
conteúdo;
• Estratégias de competição - diferencial positivo em
relação a concorrência;
• Análise do perfil do mercado.
4. OLTP
On-Line Transaction Processing
• Processamentos que executam as operações
do dia-a-dia da organização
• Ênfase ao suporte do negócio, através de um
processamento rápido, acurado e eficiente de
dados
o Ex: movimento bancário
5. OLAP
On Line Analytical Processing
• Processamentos que suportam a tomada de
decisões
• Permite analisar tendências e padrões em
grande quantidades de dados
o ao longo do tempo (histórico)
o e em diferentes localizações (geográficos)
6. Tipos de Datawarehouse
• Marketing – Avalia a performance comercial
de um produto ou serviço a partir de diversas
perspectivas diferentes
• Financeiro – Monitoram a performance
comercial em termos financeiros
• Comportamental – Contêm informações
individuais a respeito de cada cliente e seus
comportamentos
8. Orientado por Temas
• Refere-se ao fato do DW armazenar
informações sobre temas específicos
importantes para o negócio da empresa.
Exemplos produtos, atividades, contas,
clientes, etc.
• O ambiente operacional é organizado por
aplicações funcionais.
Exemplo, em uma organização bancária,
estas aplicações incluem empréstimos,
investimentos e seguros.
9. Integrado
• Refere-se à consistência de nomes, das
unidades das variáveis.
• Dados foram transformados até um estado
uniforme.
Exemplo, considere-se sexo como um
elemento de dado.
10. Variante no Tempo
• Refere-se a algum momento específico,
o Não é atualizável
• Enquanto que o dado de produção é
atualizado de acordo com mudanças de
estado do objeto em questão, refletindo, em
geral, o estado do objeto no momento do
acesso.
• A cada ocorrência de uma mudança,
o Uma nova entrada é criada, para marcar
esta mudança.
11. Não Volátil
• Permite o "load-and-access”
• Após integração e transformação, dados
armazenados em bloco para o DW
o Após aos usuários
• Rollback, recuperação de falhas, commits e
bloqueios
13. Passos para Aplicação de um DW
• DW não é um produto que se compra, mas
sim um projeto que envolve:
o Análise e implementação, com a
participação de várias tecnologias.
14. Criação de um DW (1/2)
– Traduzir rapidamente as necessidades do
negócio em uma especificação que possa ser
construída em etapas.
– Integrar sistemas - dados de produção e de
fontes externas precisam ser mapeados para o
modelo de dados do DW.
– Escolher o banco de dados de suporte.
– Considerar as ferramentas de extração
disponíveis no mercado.
15. Criação de um DW (2/2)
– Construir um DW que possa ser expandido,
mantendo níveis aceitáveis de desempenho até
gigabytes.
– Ambiente DW deve ser aberto para permitir que
os componentes ou ferramentas identificadas no
passo 4 possam ser substituídas por outras mais
atuais e eficientes.
– Considerar o sistema de armazenamento que
fisicamente gerencia: tráfego, alocação, backup e
restauração dos dados .
16. Ferramentas de Extração
• Como o DW é um BD que fica separado do
sistema OLTP, existem ferramentas que
automatizam o processo.
• Ex:
o Platinum
o Prism
o Power Stage (sybase)