SlideShare uma empresa Scribd logo
1 de 20
TÓPICO 2 – INTRODUÇÃO AO DATA WAREHOUSE
FORMAÇÃO MODELAGEM DIMENSIONAL
• Esclarecer conceitos de Business Intelligence, Data
Warehous, suas possíveis arquiteturas e subdivisões.
• Cobrir os conceitos da Modelagem Dimensional.
• Demonstrar técnicas confiáveis para a construção de um
Modelo Dimensional.
OBJETIVOS
• O que vocês conhecem?
• BI e DW é a mesma coisa?
• Quais são as ferramentas?
Aula 1
Conceitos e
Fundamentos de BI
• A melhor estratégia é a montagem de um Data Warehouse para organização dos
dados.
• Vantagens da Montagem do DW:
– Criação de um ambiente para integração e tratamento dos dados
– Ambiente com objetivo único
– Separação dos sistemas legados (transacionais)
– Base de dados Otimizada ara consultas
– Suporte de ferramentas específicas para esse fim
Melhor estratégia para montagem de sistemas de BI
• Data Warehouse é um processo que extrai os dados de sistemas operacionais e
transacionais, limpando, transformando em informações organizadas permitindo
analises dessas informações.
• Seus principais autores são: Ralph Kimball e Bill Inmon
O que é o Data Warehouse
• Um software
• Um modelo de dados
• Uma técnica isolada
• Uma base de dados
• Um produto
• Uma linguagem de programação
• Uma cópia do sistema transcional
O que um Data Warehouse não é?
• Tornar a informação facilmente acessível
• Apresentar a informação de maneira consistente e única
• Centralizar e controlar o acesso as informações corporativas
• Permitir as áreas de negócio avaliar suas informações e tomar decisões mais
precisas
• Padronizar a informação de diversas fontes
Objetivos de um Data Warehouse
• Orientado por assunto (Subject Oriented)
• Integrado (integrated)
• Não volátil (nonvolatile)
• Orientado por tempo (time variant)
Características de um Data Warehouse
• Diferentemente dos sistemas legados que tem seus dados orientados por
funcionalidades, os Data Warehouses são orientados por assuntos, considerando
um seguradora:
Características de um DW – Orientado por assunto
SISTEMA OPERACIONAL
DATA WAREHOUSE
Vida Clientes
Saúde Produtos
Odontológico Contratos
Previdência Apólices
• Os dados carregados no Data Warehouse são extraídos e carregados no Data
Warehouse, padronizando as informações .
• O dado pode ter diversas fontes o Data Warehouse integra essas informações
fornecendo uma visão única e corporativa.
Características de um Data Warehouse -Integrado
Os dados carregados dos Sistemas Operacionais, sofrem modificações durante todo o
dia:
• Inserções de novos clientes
• Exclusão de clientes
• Alteração no cadastro dos clientes
Características de um Data Warehouse – Não Volátil
No Data Warehouse, os dados são carregados em janelas de tempo previamente
determinadas, 1 vez por dia, todas as madrugadas etc.
Características de um Data Warehouse – Não Volátil
DATA WAREHOUSE
Atualizar
Inserir
Apagar
Sistemas Operacionais
Cargas de dados
• Os sistemas operacionais sempre possuem as informações correntes no momento
da leitura. Os Data Warehouses possuem posições históricas, onde é possível
comparar os períodos de tempo.
• As cargas de dados são feitas em intervalos regulares e pré-definidos, sendo as
informações organizadas por uma unidade de tempo.
Por exemplo: Diário, Semanal ou Mensal.
Características de um Data Warehouse – Orientado por
tempo
Sistemas Operacionais X Sistemas de Informações
Gerenciais
OPERACIONAL INFORMAÇÕES
CONTEÚDO DOS DADOS VALOR CORRENTE TRANSFORMADOS SUMARIZADOS
ESTRUTURA DE DADOS OTIMIZADOS PARA TRANSAÇÕES OTIMIZADOS PARA QUERIES
FREQUÊNCIA DE ACESSO ALTO MÉDIO PARA BAIXO
TIPO DE ACESSO LEITURA, ALTERAÇÃO E DELEÇÃO LEITURA
USO DO SISTEMA PREVISIVEIS E REPETITIVOS
AD-HOC RONDÔMICO.
HEURÍSTICO
TEMPO DE RESPOSTA MILISEGUNDOS
ALGUNS SEGUNDOS. ATÉ
MINUTOS..
QUANTIDADE DE USUÁRIOS GRANDE GRUPO PEQUENO GRUPO
OLTPX OLAP
OLTP – Estruturas de Dados
mais complexas (3NF)
Data Warehouse –
Estruturas de dados
Multidimensionais
Poucos Índices Muitos
Muitos Joins Alguns
Normalizados Dados Desnormalizados
Raramente Dados derivados agregações Comum
O que é OLAP? ROLAP/MOLAP/HOLAP
• OLAP = On-line Analystical Processing
• Podem ser:
– ROLAP ( Relacional – OLAP)
– São consideradas ROLAP quando aplicadas a banco de dados relacional, como
Oracle, SqlServe, DB2, MySql, entre outros.
– A linguagem principal é SQL
O que é OLAP? ROLAP/MOLAP/HOLAP
• MOLAP ( Multidimensional – OLAP)
• São consideradas MOLAP quando aplicadas a banco de dados multidimensionais
como Analysis Services (SSAS), Hyperion, Cognos PowerPLay/TM1, Oracle OLAP
entre outros.
• A linguagem principal é o MDX (Multidimensional eXtensions)
• O armazenamento dos dados é em cubo
O que é OLAP?
• HOLAP (Hibrido – OLAP)
• As análises podem ser feitas utilizando ROLAP e MOLAP
• Com linguagens SQL e MDX
• Pode armazenar dados detalhados no relacional e agregados no multidimensional
Camada Semântica ou Metadados
• Área intermediária entre os bancos de dados e os usuários finais.
DATA WAREHOUSE
TB_CLIENTES (TABELA)
CD_CLIENTE (COLUNAS)
NM_CLIENTE
DS_ENDEREÇO
CLIENTES
CÓDIGO DO CLIENTE
NOME DO CLIENE
ENDEREÇO DO CLIENTE
Data Warehouse X Data Mart
DATA WAREHOUSE DATA MART
Visão Abrangente Visão Localizada
Empresa Departamento ou processo de negócio
Feito para a empresa Público-alvo focado
Regras de negócios corporativas Regras de negócios específicos

Mais conteúdo relacionado

Mais procurados

Data Mining e Data Warehouse
Data Mining e Data WarehouseData Mining e Data Warehouse
Data Mining e Data WarehouseJeorgeCarmona
 
Data Mart e Data Warehouse
Data Mart e Data WarehouseData Mart e Data Warehouse
Data Mart e Data WarehouseFernando Peres
 
Sistemas de Informação (SAD / OLAP)
Sistemas de Informação (SAD / OLAP)Sistemas de Informação (SAD / OLAP)
Sistemas de Informação (SAD / OLAP)m4rkSpinelli
 
Data warehousing e Business Intelligence | BRUNO FERNANDES CHIMIESKI
Data warehousing e Business Intelligence | BRUNO FERNANDES CHIMIESKIData warehousing e Business Intelligence | BRUNO FERNANDES CHIMIESKI
Data warehousing e Business Intelligence | BRUNO FERNANDES CHIMIESKIBruno Fernandes Chimieski
 
Banco de Dados NoSQL - Disciplina: Sistemas Distribuídos
Banco de Dados NoSQL - Disciplina: Sistemas DistribuídosBanco de Dados NoSQL - Disciplina: Sistemas Distribuídos
Banco de Dados NoSQL - Disciplina: Sistemas DistribuídosJoão Helis Bernardo
 
Kimball Vs Inmon
Kimball Vs InmonKimball Vs Inmon
Kimball Vs Inmonguest2308b5
 
Erp Enterprise Resource Planning
Erp Enterprise Resource PlanningErp Enterprise Resource Planning
Erp Enterprise Resource Planningvanessavdf
 
2019-2 - BD I - Aula 02 - Camadas de aplicação a Banco de Dados e Introd MER
2019-2 - BD I - Aula 02 - Camadas de aplicação a Banco de Dados e Introd MER2019-2 - BD I - Aula 02 - Camadas de aplicação a Banco de Dados e Introd MER
2019-2 - BD I - Aula 02 - Camadas de aplicação a Banco de Dados e Introd MERRodrigo Kiyoshi Saito
 
Redes san, Data center e virtualizacao
Redes san, Data center e virtualizacaoRedes san, Data center e virtualizacao
Redes san, Data center e virtualizacaoJohn Muconto
 
High Avaiability Architeture with Oracle Data Guard Broker
High Avaiability Architeture with Oracle Data Guard BrokerHigh Avaiability Architeture with Oracle Data Guard Broker
High Avaiability Architeture with Oracle Data Guard BrokerJonatan Ritter
 
Data warehouse & Data mining
Data warehouse & Data miningData warehouse & Data mining
Data warehouse & Data miningCassius Busemeyer
 
IBTA - Oracle Database Security
IBTA - Oracle Database SecurityIBTA - Oracle Database Security
IBTA - Oracle Database SecurityRodrigo Almeida
 

Mais procurados (20)

Dawarehouse e OLAP
Dawarehouse e OLAPDawarehouse e OLAP
Dawarehouse e OLAP
 
OLAP, BI, EIS
OLAP, BI, EISOLAP, BI, EIS
OLAP, BI, EIS
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouse
 
Data Mining e Data Warehouse
Data Mining e Data WarehouseData Mining e Data Warehouse
Data Mining e Data Warehouse
 
Data Warehouse e Data Mining
Data Warehouse e Data MiningData Warehouse e Data Mining
Data Warehouse e Data Mining
 
datawarehouse2
datawarehouse2datawarehouse2
datawarehouse2
 
Data Mart e Data Warehouse
Data Mart e Data WarehouseData Mart e Data Warehouse
Data Mart e Data Warehouse
 
Sistemas de Informação (SAD / OLAP)
Sistemas de Informação (SAD / OLAP)Sistemas de Informação (SAD / OLAP)
Sistemas de Informação (SAD / OLAP)
 
Data warehousing e Business Intelligence | BRUNO FERNANDES CHIMIESKI
Data warehousing e Business Intelligence | BRUNO FERNANDES CHIMIESKIData warehousing e Business Intelligence | BRUNO FERNANDES CHIMIESKI
Data warehousing e Business Intelligence | BRUNO FERNANDES CHIMIESKI
 
Banco de Dados NoSQL - Disciplina: Sistemas Distribuídos
Banco de Dados NoSQL - Disciplina: Sistemas DistribuídosBanco de Dados NoSQL - Disciplina: Sistemas Distribuídos
Banco de Dados NoSQL - Disciplina: Sistemas Distribuídos
 
Kimball Vs Inmon
Kimball Vs InmonKimball Vs Inmon
Kimball Vs Inmon
 
Conceitos DW
Conceitos DWConceitos DW
Conceitos DW
 
Erp Enterprise Resource Planning
Erp Enterprise Resource PlanningErp Enterprise Resource Planning
Erp Enterprise Resource Planning
 
Business Intelligence - Data Warehouse
Business Intelligence - Data WarehouseBusiness Intelligence - Data Warehouse
Business Intelligence - Data Warehouse
 
2019-2 - BD I - Aula 02 - Camadas de aplicação a Banco de Dados e Introd MER
2019-2 - BD I - Aula 02 - Camadas de aplicação a Banco de Dados e Introd MER2019-2 - BD I - Aula 02 - Camadas de aplicação a Banco de Dados e Introd MER
2019-2 - BD I - Aula 02 - Camadas de aplicação a Banco de Dados e Introd MER
 
Redes san, Data center e virtualizacao
Redes san, Data center e virtualizacaoRedes san, Data center e virtualizacao
Redes san, Data center e virtualizacao
 
Aula 3 banco de dados
Aula 3   banco de dadosAula 3   banco de dados
Aula 3 banco de dados
 
High Avaiability Architeture with Oracle Data Guard Broker
High Avaiability Architeture with Oracle Data Guard BrokerHigh Avaiability Architeture with Oracle Data Guard Broker
High Avaiability Architeture with Oracle Data Guard Broker
 
Data warehouse & Data mining
Data warehouse & Data miningData warehouse & Data mining
Data warehouse & Data mining
 
IBTA - Oracle Database Security
IBTA - Oracle Database SecurityIBTA - Oracle Database Security
IBTA - Oracle Database Security
 

Destaque

Destaque (14)

SOAP Services
SOAP ServicesSOAP Services
SOAP Services
 
Rio de Janeiro 2016
Rio de Janeiro 2016Rio de Janeiro 2016
Rio de Janeiro 2016
 
MOOC Programs
MOOC ProgramsMOOC Programs
MOOC Programs
 
Web service vm in mule
Web service vm in muleWeb service vm in mule
Web service vm in mule
 
Aula 1
Aula 1Aula 1
Aula 1
 
Jenkins2
Jenkins2Jenkins2
Jenkins2
 
Actividad de aprendizaje 9
Actividad de aprendizaje 9Actividad de aprendizaje 9
Actividad de aprendizaje 9
 
FINAL PAPER THBC
FINAL PAPER THBCFINAL PAPER THBC
FINAL PAPER THBC
 
El discurso
El discursoEl discurso
El discurso
 
Testing soapui
Testing soapuiTesting soapui
Testing soapui
 
Derechos Políticos de la Constitución de 1830 A 1857
Derechos Políticos de la Constitución de 1830 A 1857Derechos Políticos de la Constitución de 1830 A 1857
Derechos Políticos de la Constitución de 1830 A 1857
 
SOAP, WSDL and UDDI
SOAP, WSDL and UDDISOAP, WSDL and UDDI
SOAP, WSDL and UDDI
 
Mule webservices in detail
Mule webservices in detailMule webservices in detail
Mule webservices in detail
 
Java in Mule
Java in MuleJava in Mule
Java in Mule
 

Semelhante a Tópico 2

Bancos de dados no sql – uma nova abordagem
Bancos de dados no sql – uma nova abordagemBancos de dados no sql – uma nova abordagem
Bancos de dados no sql – uma nova abordagemJoão Gabriel Lima
 
Fundamentos de Banco de Dados.pptx
Fundamentos de Banco de Dados.pptxFundamentos de Banco de Dados.pptx
Fundamentos de Banco de Dados.pptxNatliaGomes72
 
TimesTen In-Memory Database
TimesTen In-Memory DatabaseTimesTen In-Memory Database
TimesTen In-Memory DatabaseAndre Danelon
 
Olap (PROCESSAMENTO ANALÍTICO ONLINE)
Olap (PROCESSAMENTO ANALÍTICO ONLINE)Olap (PROCESSAMENTO ANALÍTICO ONLINE)
Olap (PROCESSAMENTO ANALÍTICO ONLINE)EderPereira33
 
Ecosistema de data warehouse com ferramentas microsoft
Ecosistema de data warehouse com ferramentas microsoftEcosistema de data warehouse com ferramentas microsoft
Ecosistema de data warehouse com ferramentas microsoftDennes Torres
 
Data Vault - TDC 2020 Porto Alegre
Data Vault - TDC 2020 Porto AlegreData Vault - TDC 2020 Porto Alegre
Data Vault - TDC 2020 Porto AlegreSergio Lima
 
Poc1 apresentacao parcial_henriquechevreux
Poc1 apresentacao parcial_henriquechevreuxPoc1 apresentacao parcial_henriquechevreux
Poc1 apresentacao parcial_henriquechevreuxchevreux
 
2019-2 - BD I - Aula 01 C - Introdução a Banco de Dados
2019-2 - BD I - Aula 01 C - Introdução a Banco de Dados2019-2 - BD I - Aula 01 C - Introdução a Banco de Dados
2019-2 - BD I - Aula 01 C - Introdução a Banco de DadosRodrigo Kiyoshi Saito
 
Aplicação de Business Intelligence em Laboratórios Clínicos como ferramenta p...
Aplicação de Business Intelligence em Laboratórios Clínicos como ferramenta p...Aplicação de Business Intelligence em Laboratórios Clínicos como ferramenta p...
Aplicação de Business Intelligence em Laboratórios Clínicos como ferramenta p...fabiolagrijo
 
Oltp artigo 1
Oltp artigo 1Oltp artigo 1
Oltp artigo 1kaze002
 
Parte8 - Fundamentos de Sistema de Informação
Parte8 - Fundamentos de Sistema de InformaçãoParte8 - Fundamentos de Sistema de Informação
Parte8 - Fundamentos de Sistema de InformaçãoGabriel Faustino
 
Big Data, NoSQL e In Memory Databases
Big Data, NoSQL e In Memory DatabasesBig Data, NoSQL e In Memory Databases
Big Data, NoSQL e In Memory DatabasesCaio Louro
 
aula01_Fundamentos de Banco de Dados.pptx.pdf
aula01_Fundamentos de Banco de Dados.pptx.pdfaula01_Fundamentos de Banco de Dados.pptx.pdf
aula01_Fundamentos de Banco de Dados.pptx.pdfssuser7a84f91
 

Semelhante a Tópico 2 (20)

Bancos de dados no sql – uma nova abordagem
Bancos de dados no sql – uma nova abordagemBancos de dados no sql – uma nova abordagem
Bancos de dados no sql – uma nova abordagem
 
Fundamentos de Banco de Dados.pptx
Fundamentos de Banco de Dados.pptxFundamentos de Banco de Dados.pptx
Fundamentos de Banco de Dados.pptx
 
TimesTen In-Memory Database
TimesTen In-Memory DatabaseTimesTen In-Memory Database
TimesTen In-Memory Database
 
Olap (PROCESSAMENTO ANALÍTICO ONLINE)
Olap (PROCESSAMENTO ANALÍTICO ONLINE)Olap (PROCESSAMENTO ANALÍTICO ONLINE)
Olap (PROCESSAMENTO ANALÍTICO ONLINE)
 
Ecosistema de data warehouse com ferramentas microsoft
Ecosistema de data warehouse com ferramentas microsoftEcosistema de data warehouse com ferramentas microsoft
Ecosistema de data warehouse com ferramentas microsoft
 
Data warehouse & data mining
Data warehouse & data miningData warehouse & data mining
Data warehouse & data mining
 
Data Vault - TDC 2020 Porto Alegre
Data Vault - TDC 2020 Porto AlegreData Vault - TDC 2020 Porto Alegre
Data Vault - TDC 2020 Porto Alegre
 
Business intelligence
Business intelligenceBusiness intelligence
Business intelligence
 
Poc1 apresentacao parcial_henriquechevreux
Poc1 apresentacao parcial_henriquechevreuxPoc1 apresentacao parcial_henriquechevreux
Poc1 apresentacao parcial_henriquechevreux
 
2019-2 - BD I - Aula 01 C - Introdução a Banco de Dados
2019-2 - BD I - Aula 01 C - Introdução a Banco de Dados2019-2 - BD I - Aula 01 C - Introdução a Banco de Dados
2019-2 - BD I - Aula 01 C - Introdução a Banco de Dados
 
Aplicação de Business Intelligence em Laboratórios Clínicos como ferramenta p...
Aplicação de Business Intelligence em Laboratórios Clínicos como ferramenta p...Aplicação de Business Intelligence em Laboratórios Clínicos como ferramenta p...
Aplicação de Business Intelligence em Laboratórios Clínicos como ferramenta p...
 
Banco de dados
Banco de dadosBanco de dados
Banco de dados
 
Oltp artigo 1
Oltp artigo 1Oltp artigo 1
Oltp artigo 1
 
Banco de dados 1
Banco de dados 1Banco de dados 1
Banco de dados 1
 
Parte8 - Fundamentos de Sistema de Informação
Parte8 - Fundamentos de Sistema de InformaçãoParte8 - Fundamentos de Sistema de Informação
Parte8 - Fundamentos de Sistema de Informação
 
Sistemas de Informação - Aula05 - cap5 bd e business intelligence
Sistemas de Informação - Aula05 - cap5 bd e business intelligenceSistemas de Informação - Aula05 - cap5 bd e business intelligence
Sistemas de Informação - Aula05 - cap5 bd e business intelligence
 
TA1 - Slides Acessibilidade.pdf
TA1 - Slides Acessibilidade.pdfTA1 - Slides Acessibilidade.pdf
TA1 - Slides Acessibilidade.pdf
 
Sistemas de Informação 2 - Aula13 - psi cap10 sistemas de infomração gerencia...
Sistemas de Informação 2 - Aula13 - psi cap10 sistemas de infomração gerencia...Sistemas de Informação 2 - Aula13 - psi cap10 sistemas de infomração gerencia...
Sistemas de Informação 2 - Aula13 - psi cap10 sistemas de infomração gerencia...
 
Big Data, NoSQL e In Memory Databases
Big Data, NoSQL e In Memory DatabasesBig Data, NoSQL e In Memory Databases
Big Data, NoSQL e In Memory Databases
 
aula01_Fundamentos de Banco de Dados.pptx.pdf
aula01_Fundamentos de Banco de Dados.pptx.pdfaula01_Fundamentos de Banco de Dados.pptx.pdf
aula01_Fundamentos de Banco de Dados.pptx.pdf
 

Último

Soluções MNE - Mês das Mães 2024_sv (1).pdf
Soluções MNE - Mês das Mães 2024_sv (1).pdfSoluções MNE - Mês das Mães 2024_sv (1).pdf
Soluções MNE - Mês das Mães 2024_sv (1).pdfSabrinaPrado11
 
Despertar SEBRAE [PROFESSOR] (1).pdfccss
Despertar SEBRAE [PROFESSOR] (1).pdfccssDespertar SEBRAE [PROFESSOR] (1).pdfccss
Despertar SEBRAE [PROFESSOR] (1).pdfccssGuilhermeMelo381677
 
A influência da Liderança nos Resultados Extraordinários.pptx
A influência da Liderança nos Resultados Extraordinários.pptxA influência da Liderança nos Resultados Extraordinários.pptx
A influência da Liderança nos Resultados Extraordinários.pptxVitorSchneider7
 
LIDER COACH E SUA IMORTÂNCIA NSS ORGANIZAÇÕES.
LIDER COACH E SUA IMORTÂNCIA NSS ORGANIZAÇÕES.LIDER COACH E SUA IMORTÂNCIA NSS ORGANIZAÇÕES.
LIDER COACH E SUA IMORTÂNCIA NSS ORGANIZAÇÕES.JosineiPeres
 
relatorio de estagio de terapia ocupacional.pdf
relatorio de estagio de terapia ocupacional.pdfrelatorio de estagio de terapia ocupacional.pdf
relatorio de estagio de terapia ocupacional.pdfHELLEN CRISTINA
 
Catálogo de Produtos OceanTech 2024 - Atualizado
Catálogo de Produtos OceanTech 2024 - AtualizadoCatálogo de Produtos OceanTech 2024 - Atualizado
Catálogo de Produtos OceanTech 2024 - AtualizadoWagnerSouza717812
 

Último (6)

Soluções MNE - Mês das Mães 2024_sv (1).pdf
Soluções MNE - Mês das Mães 2024_sv (1).pdfSoluções MNE - Mês das Mães 2024_sv (1).pdf
Soluções MNE - Mês das Mães 2024_sv (1).pdf
 
Despertar SEBRAE [PROFESSOR] (1).pdfccss
Despertar SEBRAE [PROFESSOR] (1).pdfccssDespertar SEBRAE [PROFESSOR] (1).pdfccss
Despertar SEBRAE [PROFESSOR] (1).pdfccss
 
A influência da Liderança nos Resultados Extraordinários.pptx
A influência da Liderança nos Resultados Extraordinários.pptxA influência da Liderança nos Resultados Extraordinários.pptx
A influência da Liderança nos Resultados Extraordinários.pptx
 
LIDER COACH E SUA IMORTÂNCIA NSS ORGANIZAÇÕES.
LIDER COACH E SUA IMORTÂNCIA NSS ORGANIZAÇÕES.LIDER COACH E SUA IMORTÂNCIA NSS ORGANIZAÇÕES.
LIDER COACH E SUA IMORTÂNCIA NSS ORGANIZAÇÕES.
 
relatorio de estagio de terapia ocupacional.pdf
relatorio de estagio de terapia ocupacional.pdfrelatorio de estagio de terapia ocupacional.pdf
relatorio de estagio de terapia ocupacional.pdf
 
Catálogo de Produtos OceanTech 2024 - Atualizado
Catálogo de Produtos OceanTech 2024 - AtualizadoCatálogo de Produtos OceanTech 2024 - Atualizado
Catálogo de Produtos OceanTech 2024 - Atualizado
 

Tópico 2

  • 1. TÓPICO 2 – INTRODUÇÃO AO DATA WAREHOUSE FORMAÇÃO MODELAGEM DIMENSIONAL
  • 2. • Esclarecer conceitos de Business Intelligence, Data Warehous, suas possíveis arquiteturas e subdivisões. • Cobrir os conceitos da Modelagem Dimensional. • Demonstrar técnicas confiáveis para a construção de um Modelo Dimensional. OBJETIVOS
  • 3. • O que vocês conhecem? • BI e DW é a mesma coisa? • Quais são as ferramentas? Aula 1 Conceitos e Fundamentos de BI
  • 4. • A melhor estratégia é a montagem de um Data Warehouse para organização dos dados. • Vantagens da Montagem do DW: – Criação de um ambiente para integração e tratamento dos dados – Ambiente com objetivo único – Separação dos sistemas legados (transacionais) – Base de dados Otimizada ara consultas – Suporte de ferramentas específicas para esse fim Melhor estratégia para montagem de sistemas de BI
  • 5. • Data Warehouse é um processo que extrai os dados de sistemas operacionais e transacionais, limpando, transformando em informações organizadas permitindo analises dessas informações. • Seus principais autores são: Ralph Kimball e Bill Inmon O que é o Data Warehouse
  • 6. • Um software • Um modelo de dados • Uma técnica isolada • Uma base de dados • Um produto • Uma linguagem de programação • Uma cópia do sistema transcional O que um Data Warehouse não é?
  • 7. • Tornar a informação facilmente acessível • Apresentar a informação de maneira consistente e única • Centralizar e controlar o acesso as informações corporativas • Permitir as áreas de negócio avaliar suas informações e tomar decisões mais precisas • Padronizar a informação de diversas fontes Objetivos de um Data Warehouse
  • 8. • Orientado por assunto (Subject Oriented) • Integrado (integrated) • Não volátil (nonvolatile) • Orientado por tempo (time variant) Características de um Data Warehouse
  • 9. • Diferentemente dos sistemas legados que tem seus dados orientados por funcionalidades, os Data Warehouses são orientados por assuntos, considerando um seguradora: Características de um DW – Orientado por assunto SISTEMA OPERACIONAL DATA WAREHOUSE Vida Clientes Saúde Produtos Odontológico Contratos Previdência Apólices
  • 10. • Os dados carregados no Data Warehouse são extraídos e carregados no Data Warehouse, padronizando as informações . • O dado pode ter diversas fontes o Data Warehouse integra essas informações fornecendo uma visão única e corporativa. Características de um Data Warehouse -Integrado
  • 11. Os dados carregados dos Sistemas Operacionais, sofrem modificações durante todo o dia: • Inserções de novos clientes • Exclusão de clientes • Alteração no cadastro dos clientes Características de um Data Warehouse – Não Volátil
  • 12. No Data Warehouse, os dados são carregados em janelas de tempo previamente determinadas, 1 vez por dia, todas as madrugadas etc. Características de um Data Warehouse – Não Volátil DATA WAREHOUSE Atualizar Inserir Apagar Sistemas Operacionais Cargas de dados
  • 13. • Os sistemas operacionais sempre possuem as informações correntes no momento da leitura. Os Data Warehouses possuem posições históricas, onde é possível comparar os períodos de tempo. • As cargas de dados são feitas em intervalos regulares e pré-definidos, sendo as informações organizadas por uma unidade de tempo. Por exemplo: Diário, Semanal ou Mensal. Características de um Data Warehouse – Orientado por tempo
  • 14. Sistemas Operacionais X Sistemas de Informações Gerenciais OPERACIONAL INFORMAÇÕES CONTEÚDO DOS DADOS VALOR CORRENTE TRANSFORMADOS SUMARIZADOS ESTRUTURA DE DADOS OTIMIZADOS PARA TRANSAÇÕES OTIMIZADOS PARA QUERIES FREQUÊNCIA DE ACESSO ALTO MÉDIO PARA BAIXO TIPO DE ACESSO LEITURA, ALTERAÇÃO E DELEÇÃO LEITURA USO DO SISTEMA PREVISIVEIS E REPETITIVOS AD-HOC RONDÔMICO. HEURÍSTICO TEMPO DE RESPOSTA MILISEGUNDOS ALGUNS SEGUNDOS. ATÉ MINUTOS.. QUANTIDADE DE USUÁRIOS GRANDE GRUPO PEQUENO GRUPO
  • 15. OLTPX OLAP OLTP – Estruturas de Dados mais complexas (3NF) Data Warehouse – Estruturas de dados Multidimensionais Poucos Índices Muitos Muitos Joins Alguns Normalizados Dados Desnormalizados Raramente Dados derivados agregações Comum
  • 16. O que é OLAP? ROLAP/MOLAP/HOLAP • OLAP = On-line Analystical Processing • Podem ser: – ROLAP ( Relacional – OLAP) – São consideradas ROLAP quando aplicadas a banco de dados relacional, como Oracle, SqlServe, DB2, MySql, entre outros. – A linguagem principal é SQL
  • 17. O que é OLAP? ROLAP/MOLAP/HOLAP • MOLAP ( Multidimensional – OLAP) • São consideradas MOLAP quando aplicadas a banco de dados multidimensionais como Analysis Services (SSAS), Hyperion, Cognos PowerPLay/TM1, Oracle OLAP entre outros. • A linguagem principal é o MDX (Multidimensional eXtensions) • O armazenamento dos dados é em cubo
  • 18. O que é OLAP? • HOLAP (Hibrido – OLAP) • As análises podem ser feitas utilizando ROLAP e MOLAP • Com linguagens SQL e MDX • Pode armazenar dados detalhados no relacional e agregados no multidimensional
  • 19. Camada Semântica ou Metadados • Área intermediária entre os bancos de dados e os usuários finais. DATA WAREHOUSE TB_CLIENTES (TABELA) CD_CLIENTE (COLUNAS) NM_CLIENTE DS_ENDEREÇO CLIENTES CÓDIGO DO CLIENTE NOME DO CLIENE ENDEREÇO DO CLIENTE
  • 20. Data Warehouse X Data Mart DATA WAREHOUSE DATA MART Visão Abrangente Visão Localizada Empresa Departamento ou processo de negócio Feito para a empresa Público-alvo focado Regras de negócios corporativas Regras de negócios específicos

Notas do Editor

  1. A montagem de um Data Warehouse (DW) é a saída mais acertada para a construção de sistemas de BI, no DW são desenvolvidos modelos e rotinas específicas para o tratamento, qualidade, performance e disponibilidade dos dados para o BI. Sendo um ambiente separado dos sistemas legados, durante o consumo dos dados pelo BI, os sistemas origem não são afetados e não perdem performance, mesmo que as consultas sejam muito demoradas.
  2. Data Warehouse é um conceito utilizado para definir a organização de informações para análises. Entre seus principais autores estão Kimball e Inmon, que foram precursores definindo técnicas e modelos, como Slowly Changing Dimension e arquitetura CIF ( Corporate Information Factory )
  3. Muitas definições são utilizadas para Data Warehouse, mas nenhuma dessas acima definem o que é. É um conjunto de técnicas e ferramentas.
  4. O Objetivos de um Data Warehouse são todos voltados para informação, seja integrando, limpando ou melhorando sua apresentação. Muitas vezes usar o DW para resolver problemas nos sistemas operacionais é um erro, pois os dados com problemas continuam nos sistemas, já que o DW é apenas um consumidor dessas informações. Para integrações complexas de sistemas e informações, é aconselhável a montagem de um Operational Data Store (ODS) ou outra base de integração. As técnicas de Master Data Management (MDM) também podem ser utilizadas na integração de informações.
  5. O Objetivos de um Data Warehouse são todos voltados para informação, seja integrando, limpando ou melhorando sua apresentação. Muitas vezes usar o DW para resolver problemas nos sistemas operacionais é um erro, pois os dados com problemas continuam nos sistemas, já que o DW é apenas um consumidor dessas informações. Para integrações complexas de sistemas e informações, é aconselhável a montagem de um Operational Data Store (ODS) ou outra base de integração. As técnicas de Master Data Management (MDM) também podem ser utilizadas na integração de informações.
  6. Sistemas Operacionais tem preocupações primárias com o controle dos processos, ou seja, suportar o negócio, não permitindo erros no cadastramento de informações dos clientes, venda de produtos que não possuem estoque, ou quaisquer outros problemas que possam afetar o funcionamento da empresa. Os Data Warehouses são organizados e orientados por assuntos de dados, sem preocupação com os processos operacionais. O Data Warehouse deve ser desenhado para suprir o negócio de informações. Dessa maneira, a orientação por assunto agrupa informações para grupos de analises. Análise de Vendas e Faturamento, pode ser feita por Produto, Cliente e outros, mas o objetivo principal é demonstrar informações pertinentes a Vendas e Faturamento, não se preocupando especificamente com um produto ou classificação de cliente.
  7. A Integração do Data Warehouse é feita pelo processo de ETL, que é responsável por manter os dados íntegros e padronizados.
  8. Os dados dos sistemas operacionais devem ser atualizados no Data Warehouse em processos definidos e controlados pelo próprio DW. Sendo assim, todas as alterações feitas durante o dia no sistema operacional, deve ser levada em Lote no processo do ETL.
  9. Os dados dos sistemas operacionais devem ser atualizados no Data Warehouse em processos definidos e controlados pelo próprio DW. Sendo assim, todas as alterações feitas durante o dia no sistema operacional, deve ser levada em Lote no processo do ETL.
  10. Os sistemas operacionais sempre possuem os valores correntes, no DW os valores estão orientados de acordo com as suas definições
  11. Sistemas Operacionais : Orientado a transação. Muitas transações com pequeno volume de dados. Responsável por manter o funcionamento do negócio. Sistemas de Informações Gerenciais: Orientado a consulta. Poucas consultas com grande volume de dados. Responsável por alimentar a empresa com informações.
  12. Comparação entre sistemas OLTP e OLAP OLTP – On-Line Transaction Processing OLAP – On-Line Analítical Processing. As variações das estruturas OLAP são : ROLAP – modelos de dados de data warehouse construídos em bancos de dados relacionais (R). Exemplos, Oracle 9/10/11, SqlServer, DB2, etc. MOLAP – cubos baseados em tecnologias multidimensionais que armazenam as informações pré-computadas. Exemplos, Oracle OLÀP, Hyperion Essbase, MS Analysis Services
  13. Comparação entre sistemas OLTP e OLAP OLTP – On-Line Transaction Processing OLAP – On-Line Analítical Processing. As variações das estruturas OLAP são : ROLAP – modelos de dados de data warehouse construídos em bancos de dados relacionais (R). Exemplos, Oracle 9/10/11, SqlServer, DB2, etc. MOLAP – cubos baseados em tecnologias multidimensionais que armazenam as informações pré-computadas. Exemplos, Oracle OLÀP, Hyperion Essbase, MS Analysis Services
  14. O cubo tem uma estrutura otimizada para as consultas de dados, pré-computando os cruzamentos entre os dados
  15. O cubo tem uma estrutura otimizada para as consultas de dados, pré-computando os cruzamentos entre os dados
  16. O cubo tem uma estrutura otimizada para as consultas de dados, pré-computando os cruzamentos entre os dados
  17. Comparação entre sistemas OLTP e OLAP OLTP – On-Line Transaction Processing OLAP – On-Line Analítical Processing. As variações das estruturas OLAP são : ROLAP – modelos de dados de data warehouse construídos em bancos de dados relacionais (R). Exemplos, Oracle 9/10/11, SqlServer, DB2, etc. MOLAP – cubos baseados em tecnologias multidimensionais que armazenam as informações pré-computadas. Exemplos, Oracle OLÀP, Hyperion Essbase, MS Analysis Services