Ecosistema de data warehouse com ferramentas microsoft

Ecosistema de Data Warehouse com
Ferramentas Microsoft

Quem Sou
 Diretor da Búfalo Informática
 Líder do PASS Chapter devSQL/RJ
 MCT – Trainer
 MCSE Data e BI

Links
 http://facebook.com/devSQL
 Devsql-subscribe@yahoogroups.com
 http://www.youtube.com/c/dennestorres
 http://www.bufaloinfo.com.br
 http://bufaloinfo.cloudapp.net
 dennes@bufaloinfo.com.br
 @Dennes

O que é
• Trabalho rotineiro mantendo as atividades da empresa
em funcionamentoProdução
• Trabalho de análise dos dados gerados pela produção
com o objetivo de gerar novos métodos e rotinas de
trabalho, alterando o trabalho de produção
Bussiness
Intelligence
• A armazenagem de dados históricos utilizada pelo BI
Data
Warehouse

Desafios
 Tipo de Processamento
 Tipo de Modelagem
 Distribuição/Agregação dos dados
 Organização dos dados
 Contextualização

Modelagem
Fact
Dimension
Dimension
Dimension
Dimension
Dimension
Dimension
Snowflake schema
Star schema
Measures
Attributes
Attributes
Attributes
Attributes
Attributes
Attributes

Distribuição/Agregação dos dados
DW

Organização dos Dados
J.Jones
Feminino
2 de julho de 1945
J.Jones
Duas multas
Um acidente grave
J.Jones
Rua Bela, 123
Casado
J.Jones
Dois Filhos
Hipertensão Arterial
Seguro de Vida
Seguro de Veiculo
Seguro de Saúde
Seguro Residencial
J.Jones
Feminino
Nascimento – 2 de
Julho de 1945
Duas multas
Um acidente grave
Rua Bela, 123
Casado
Dois filhos
Hipertensão Arterial

Etapas
 Extrair para o DW
 Criar modelos de dados
 Criar Visualizações
 Disponibilizar

Componentes de uma Solução de Data Warehouse
Data
Warehouse
Master Data
Management
Data
Cleansing
DataSources

ETL
Data
Models
Reporting and Analysis

PASSOS EM UM DATA WAREHOUSE
Demo

Origens de dados
Data
Warehouse
Master Data
Management
Data
Cleansing
DataSources

ETL
Data
Models
Origens de dados dos mais diversos tipos:
 Application relational databases
 Proprietary data stores
 Documents
 Real-time data streams
 External data

Extract, Transform, e Load
Data
Warehouse
Master Data
Management
Data
Cleansing
DataSources

ETL
Data
Models
Enterprise Integration Management
 ETL:
 Extração de dados
 Transformação
 Carga de dados
 Data Cleansing:
 Validação de dados
 Eliminação de duplicações
 Master Data Management:
 Business entity integrity

Arquiteturas de ETL
• Single-stage ETL
• Transferência ocorre direto para o DW
• Transformações e validações ocorrendo durante
o procedimento
• Two-stage ETL
• Os dados são armazenados em um staging
• Transformações e validações ocorrem na
transferência ou no stagin
• Three-stage ETL
• Dados transferidos para uma landing zone e
depois para um staging
• Transformações e validações ocorrem durante o
fluxo de dados
Source DW
Source DWStaging
Source
DWStaging
Landing Zone

Data Warehouse
 Modelagem
 Particionamento
 Granularidade
 Distribuição/Data Marts

The Data Warehouse
Data
Warehouse
Master Data
Management
Data
Cleansing
DataSources

ETL
Data
Models
 Kimball Dimensional Data Marts
 Inmon Corporate Information Factory
 Central Dimensional Data Warehouse
 Federated Hub-and-Spoke

Granularidade
1 Registro por fato
Disco de alto
desempenho
1 Registro por dia
Disco de alto
desempenho
1 Registro por mês
Menor desempenho

Analysis Services
 Criação de modelos amigáveis para o analista final
 Multidimensional x Tabular
 Muitas otimizações

Analytical Data Models
Data
Warehouse
Master Data
Management
Data
Cleansing
DataSources

ETL
Data
Models
Benefícios do Data Model:
 Abstrai a estrutura do DW
 Simplifica a análise do usuário
 Adiciona regras de negócio
 Pre-agrega as measures
Tipos de modelo:
 Multidimensional
 Tabular

Multidimensional Tabular
MDX DAX
Mais complexo Mais simples – próximo do Excel
MOLAP/HOLAP/ROLAP In-Memory ou DirectQuery
Diversas pequenas diferenças

Data
Warehouse
Data ManagMaster
ement
Data
Cleansing
DataSources

ETL
Data
Models
 IT-provided reports
 Relatórios de Self-service
 Análises interativas
 Dashboards e scorecards
 Data mining

Excel
 Poderosa ferramenta client
 Muitos recursos de análise
 Evita o problema das manutenções infinitas

Self-Service BI
 Permitir que o usuário monte suas próprias analyses
 Desafogar equipes técnicas

Ferramentas de Self-Service BI
 Excel
 Reporting Services
 PowerPivot
 PowerQuery - M
 PowerView
 PowerMap
 Sharepoint

PowerBI
 Ferramenta online
 Une as ferramentas de self-service

Resultados do BI
 Novas estratégias de negócio
 Novos procedimentos para produção
 Novas necessidades dos clientes
 Dados para suporte a produção

Big Data
 Utilização de processamento paralelo para análise de
volumes muito grandes de dados
 Muito utilizado para informações da web ou IoT

Data
Cleansing
Componentes de uma Solução de Data Warehouse
Data
Warehouse
Master Data
Management
DataSources

ETL
Data
Models
Big Data
Machine
Learning

Soluções de Big Data
 Hadoop
 HDInsight
 SQL Server PDW
 SQL Data Warehouse
 Azure Data Lake

Mais
 Data Factory
 Data Mining x Machine Learning
 DMX
 R
 Spark e Storm
 StreamInsight

http://bufaloinfo.cloudapp.net

Ecosistema de data warehouse com ferramentas microsoft

Recomendados

Recomendados

Mais conteúdo relacionado

Mais procurados

Mais procurados (20)

Semelhante a Ecosistema de data warehouse com ferramentas microsoft

Semelhante a Ecosistema de data warehouse com ferramentas microsoft (20)

Mais de Dennes Torres

Mais de Dennes Torres (8)

Ecosistema de data warehouse com ferramentas microsoft

Notas do Editor