SlideShare uma empresa Scribd logo
1 de 50
Ecosistema de Data Warehouse com
Ferramentas Microsoft
Quem Sou
 Diretor da Búfalo Informática
 Líder do PASS Chapter devSQL/RJ
 MCT – Trainer
 MCSE Data e BI
Links
 http://facebook.com/devSQL
 Devsql-subscribe@yahoogroups.com
 http://www.youtube.com/c/dennestorres
 http://www.bufaloinfo.com.br
 http://bufaloinfo.cloudapp.net
 dennes@bufaloinfo.com.br
 @Dennes
O que é
• Trabalho rotineiro mantendo as atividades da empresa
em funcionamentoProdução
• Trabalho de análise dos dados gerados pela produção
com o objetivo de gerar novos métodos e rotinas de
trabalho, alterando o trabalho de produção
Bussiness
Intelligence
• A armazenagem de dados históricos utilizada pelo BI
Data
Warehouse
POR QUE UM DATA WAREHOUSE ?
Desafios
 Tipo de Processamento
 Tipo de Modelagem
 Distribuição/Agregação dos dados
 Organização dos dados
 Contextualização
Tipo de Processamento
Modelagem
Fact
Dimension
Dimension
Dimension
Dimension
Dimension
Dimension
Snowflake schema
Star schema
Measures
Attributes
Attributes
Attributes
Attributes
Attributes
Attributes
Distribuição/Agregação dos dados
DW
Organização dos Dados
J.Jones
Feminino
2 de julho de 1945
J.Jones
Duas multas
Um acidente grave
J.Jones
Rua Bela, 123
Casado
J.Jones
Dois Filhos
Hipertensão Arterial
Seguro de Vida
Seguro de Veiculo
Seguro de Saúde
Seguro Residencial
J.Jones
Feminino
Nascimento – 2 de
Julho de 1945
Duas multas
Um acidente grave
Rua Bela, 123
Casado
Dois filhos
Hipertensão Arterial
Contextualização
ETAPAS DE CONSTRUÇÃO
Etapas
 Extrair para o DW
 Criar modelos de dados
 Criar Visualizações
 Disponibilizar
Componentes de uma Solução de Data Warehouse
Data
Warehouse
Master Data
Management
Data
Cleansing
DataSources

ETL
Data
Models
Reporting and Analysis
PASSOS EM UM DATA WAREHOUSE
Demo
Origens de dados
Data
Warehouse
Master Data
Management
Data
Cleansing
DataSources

ETL
Data
Models
Reporting and Analysis
Origens de dados dos mais diversos tipos:
 Application relational databases
 Proprietary data stores
 Documents
 Real-time data streams
 External data
Extract, Transform, e Load
Reporting and Analysis
Data
Warehouse
Master Data
Management
Data
Cleansing
DataSources

ETL
Data
Models
Enterprise Integration Management
 ETL:
 Extração de dados
 Transformação
 Carga de dados
 Data Cleansing:
 Validação de dados
 Eliminação de duplicações
 Master Data Management:
 Business entity integrity
Arquiteturas de ETL
• Single-stage ETL
• Transferência ocorre direto para o DW
• Transformações e validações ocorrendo durante
o procedimento
• Two-stage ETL
• Os dados são armazenados em um staging
• Transformações e validações ocorrem na
transferência ou no stagin
• Three-stage ETL
• Dados transferidos para uma landing zone e
depois para um staging
• Transformações e validações ocorrem durante o
fluxo de dados
Source DW
Source DWStaging
Source
DWStaging
Landing Zone
DATA WAREHOUSE
Data Warehouse
 Modelagem
 Particionamento
 Granularidade
 Distribuição/Data Marts
The Data Warehouse
Reporting and Analysis
Data
Warehouse
Master Data
Management
Data
Cleansing
DataSources

ETL
Data
Models
 Kimball Dimensional Data Marts
 Inmon Corporate Information Factory
 Central Dimensional Data Warehouse
 Federated Hub-and-Spoke
Granularidade
1 Registro por fato
Disco de alto
desempenho
1 Registro por dia
Disco de alto
desempenho
1 Registro por mês
Menor desempenho
ANALYSIS SERVICES
Analysis Services
 Criação de modelos amigáveis para o analista final
 Multidimensional x Tabular
 Muitas otimizações
Analytical Data Models
Reporting and Analysis
Data
Warehouse
Master Data
Management
Data
Cleansing
DataSources

ETL
Data
Models
Benefícios do Data Model:
 Abstrai a estrutura do DW
 Simplifica a análise do usuário
 Adiciona regras de negócio
 Pre-agrega as measures
Tipos de modelo:
 Multidimensional
 Tabular
Multidimensional Tabular
MDX DAX
Mais complexo Mais simples – próximo do Excel
MOLAP/HOLAP/ROLAP In-Memory ou DirectQuery
Diversas pequenas diferenças
Modelo Multidimensional
Modelo Tabular
Reporting and Analysis
Data
Warehouse
Data ManagMaster
ement
Data
Cleansing
DataSources

ETL
Data
Models
 IT-provided reports
 Relatórios de Self-service
 Análises interativas
 Dashboards e scorecards
 Data mining
Reporting and Analysis
Excel
 Poderosa ferramenta client
 Muitos recursos de análise
 Evita o problema das manutenções infinitas
Self-Service BI
 Permitir que o usuário monte suas próprias analyses
 Desafogar equipes técnicas
Ferramentas de Self-Service BI
 Excel
 Reporting Services
 PowerPivot
 PowerQuery - M
 PowerView
 PowerMap
 Sharepoint
PowerBI
 Ferramenta online
 Une as ferramentas de self-service
DEMO
Resultados do BI
 Novas estratégias de negócio
 Novos procedimentos para produção
 Novas necessidades dos clientes
 Dados para suporte a produção
Big Data
 Utilização de processamento paralelo para análise de
volumes muito grandes de dados
 Muito utilizado para informações da web ou IoT
Hadoop Cluster
Data
Cleansing
Componentes de uma Solução de Data Warehouse
Data
Warehouse
Master Data
Management
DataSources

ETL
Data
Models
Big Data
Machine
Learning
Soluções de Big Data
 Hadoop
 HDInsight
 SQL Server PDW
 SQL Data Warehouse
 Azure Data Lake
HDInsight Cluster
Mais
 Data Factory
 Data Mining x Machine Learning
 DMX
 R
 Spark e Storm
 StreamInsight
Links
 http://facebook.com/devSQL
 Devsql-subscribe@yahoogroups.com
 http://www.youtube.com/c/dennestorres
 http://www.bufaloinfo.com.br
 http://bufaloinfo.cloudapp.net
 dennes@bufaloinfo.com.br
 @Dennes
http://bufaloinfo.cloudapp.net
OBRIGADO!

Mais conteúdo relacionado

Mais procurados

Data Mart e Data Warehouse
Data Mart e Data WarehouseData Mart e Data Warehouse
Data Mart e Data WarehouseFernando Peres
 
Apresentação de Business Intelligence
Apresentação de Business IntelligenceApresentação de Business Intelligence
Apresentação de Business IntelligenceJuliana Maria Lopes
 
Metodologia Ágil para Projetos de BI - Pentaho Day
Metodologia Ágil para Projetos de BI - Pentaho DayMetodologia Ágil para Projetos de BI - Pentaho Day
Metodologia Ágil para Projetos de BI - Pentaho DayMarco Garcia
 
Por que o Microsoft Power BI? Um breve overview sobre BI
Por que o Microsoft Power BI? Um breve overview sobre BIPor que o Microsoft Power BI? Um breve overview sobre BI
Por que o Microsoft Power BI? Um breve overview sobre BILeonardo Karpinski
 
Poc1 apresentacao parcial_henriquechevreux
Poc1 apresentacao parcial_henriquechevreuxPoc1 apresentacao parcial_henriquechevreux
Poc1 apresentacao parcial_henriquechevreuxchevreux
 
BI - Padrões de arquitetura e uso recursos
BI - Padrões de arquitetura e uso recursosBI - Padrões de arquitetura e uso recursos
BI - Padrões de arquitetura e uso recursosGiulianoCardoso
 
As 10 maiores tendências em business intelligence para 2014
As 10 maiores tendências em business intelligence para 2014As 10 maiores tendências em business intelligence para 2014
As 10 maiores tendências em business intelligence para 2014Tableau Software
 
Palestra sql saturday 361
Palestra sql saturday 361Palestra sql saturday 361
Palestra sql saturday 361Rodrigo Dornel
 
Data warehouse & Data mining
Data warehouse & Data miningData warehouse & Data mining
Data warehouse & Data miningCassius Busemeyer
 
Sistemas de Informação (SAD / OLAP)
Sistemas de Informação (SAD / OLAP)Sistemas de Informação (SAD / OLAP)
Sistemas de Informação (SAD / OLAP)m4rkSpinelli
 

Mais procurados (20)

OLAP
OLAPOLAP
OLAP
 
Data Warehouse e Data Mining
Data Warehouse e Data MiningData Warehouse e Data Mining
Data Warehouse e Data Mining
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouse
 
Data Mart e Data Warehouse
Data Mart e Data WarehouseData Mart e Data Warehouse
Data Mart e Data Warehouse
 
Apresentação de Business Intelligence
Apresentação de Business IntelligenceApresentação de Business Intelligence
Apresentação de Business Intelligence
 
OLAP, BI, EIS
OLAP, BI, EISOLAP, BI, EIS
OLAP, BI, EIS
 
Metodologia Ágil para Projetos de BI - Pentaho Day
Metodologia Ágil para Projetos de BI - Pentaho DayMetodologia Ágil para Projetos de BI - Pentaho Day
Metodologia Ágil para Projetos de BI - Pentaho Day
 
Por que o Microsoft Power BI? Um breve overview sobre BI
Por que o Microsoft Power BI? Um breve overview sobre BIPor que o Microsoft Power BI? Um breve overview sobre BI
Por que o Microsoft Power BI? Um breve overview sobre BI
 
Data warehouse & data mining
Data warehouse & data miningData warehouse & data mining
Data warehouse & data mining
 
Poc1 apresentacao parcial_henriquechevreux
Poc1 apresentacao parcial_henriquechevreuxPoc1 apresentacao parcial_henriquechevreux
Poc1 apresentacao parcial_henriquechevreux
 
Business Intelligence - Data Warehouse
Business Intelligence - Data WarehouseBusiness Intelligence - Data Warehouse
Business Intelligence - Data Warehouse
 
BI - Padrões de arquitetura e uso recursos
BI - Padrões de arquitetura e uso recursosBI - Padrões de arquitetura e uso recursos
BI - Padrões de arquitetura e uso recursos
 
Microsoft Power BI
Microsoft Power BIMicrosoft Power BI
Microsoft Power BI
 
As 10 maiores tendências em business intelligence para 2014
As 10 maiores tendências em business intelligence para 2014As 10 maiores tendências em business intelligence para 2014
As 10 maiores tendências em business intelligence para 2014
 
Palestra sql saturday 361
Palestra sql saturday 361Palestra sql saturday 361
Palestra sql saturday 361
 
Data warehouse & Data mining
Data warehouse & Data miningData warehouse & Data mining
Data warehouse & Data mining
 
Persitência Poliglota TDC Recife 2019
Persitência Poliglota TDC Recife 2019Persitência Poliglota TDC Recife 2019
Persitência Poliglota TDC Recife 2019
 
Sistemas de Informação (SAD / OLAP)
Sistemas de Informação (SAD / OLAP)Sistemas de Informação (SAD / OLAP)
Sistemas de Informação (SAD / OLAP)
 
datawarehouse2
datawarehouse2datawarehouse2
datawarehouse2
 
Modelagem dimensional
Modelagem dimensionalModelagem dimensional
Modelagem dimensional
 

Semelhante a Ecosistema de data warehouse com ferramentas microsoft

PowerBI na Pártica com Indicadores Elicitados com MindMap e Canvas consumidos...
PowerBI na Pártica com Indicadores Elicitados com MindMap e Canvas consumidos...PowerBI na Pártica com Indicadores Elicitados com MindMap e Canvas consumidos...
PowerBI na Pártica com Indicadores Elicitados com MindMap e Canvas consumidos...Aislan Honorato
 
Tesi Dados Final
Tesi Dados FinalTesi Dados Final
Tesi Dados Finaljcaroso
 
Bancos de Dados Pós-Relacionais
Bancos de Dados Pós-RelacionaisBancos de Dados Pós-Relacionais
Bancos de Dados Pós-Relacionaiselliando dias
 
Tomada decisão
Tomada decisãoTomada decisão
Tomada decisãoEcoplas
 
Pg20235 rf20222vp20208
Pg20235 rf20222vp20208Pg20235 rf20222vp20208
Pg20235 rf20222vp20208rikardojsf
 
Data warehousing
Data warehousingData warehousing
Data warehousingacistec
 
[DTC21] André Marques - Jornada do Engenheiro de Dados
[DTC21] André Marques - Jornada do Engenheiro de Dados[DTC21] André Marques - Jornada do Engenheiro de Dados
[DTC21] André Marques - Jornada do Engenheiro de DadosDeep Tech Brasil
 
Curso Gratuito Online Desmistificando BI (Business Intelligence) Open Source ...
Curso Gratuito Online Desmistificando BI (Business Intelligence) Open Source ...Curso Gratuito Online Desmistificando BI (Business Intelligence) Open Source ...
Curso Gratuito Online Desmistificando BI (Business Intelligence) Open Source ...Caio Moreno
 
Codificando .Net e SQL PASS Chapter - Novidades de BI para SQL Server 2012
Codificando .Net e SQL PASS Chapter - Novidades de BI para SQL Server 2012Codificando .Net e SQL PASS Chapter - Novidades de BI para SQL Server 2012
Codificando .Net e SQL PASS Chapter - Novidades de BI para SQL Server 2012Diego Nogare
 
Apresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptx
Apresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptxApresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptx
Apresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptxdataRain
 
O fator manutenção no ciclo de vida de data warehouse
O fator manutenção no ciclo de vida de data warehouseO fator manutenção no ciclo de vida de data warehouse
O fator manutenção no ciclo de vida de data warehouseEderson Schwaickardt
 
Aplicação de Business Intelligence em Laboratórios Clínicos como ferramenta p...
Aplicação de Business Intelligence em Laboratórios Clínicos como ferramenta p...Aplicação de Business Intelligence em Laboratórios Clínicos como ferramenta p...
Aplicação de Business Intelligence em Laboratórios Clínicos como ferramenta p...fabiolagrijo
 
Uma Experiência de Solução de Business Intelligence com Software Livre na UFB...
Uma Experiência de Solução de Business Intelligence com Software Livre na UFB...Uma Experiência de Solução de Business Intelligence com Software Livre na UFB...
Uma Experiência de Solução de Business Intelligence com Software Livre na UFB...Mauricio Cesar Santos da Purificação
 
Artigo particionamento
Artigo   particionamentoArtigo   particionamento
Artigo particionamentoPaulo Planez
 

Semelhante a Ecosistema de data warehouse com ferramentas microsoft (20)

PowerBI na Pártica com Indicadores Elicitados com MindMap e Canvas consumidos...
PowerBI na Pártica com Indicadores Elicitados com MindMap e Canvas consumidos...PowerBI na Pártica com Indicadores Elicitados com MindMap e Canvas consumidos...
PowerBI na Pártica com Indicadores Elicitados com MindMap e Canvas consumidos...
 
Conceitos DW
Conceitos DWConceitos DW
Conceitos DW
 
Tesi Dados Final
Tesi Dados FinalTesi Dados Final
Tesi Dados Final
 
Bancos de Dados Pós-Relacionais
Bancos de Dados Pós-RelacionaisBancos de Dados Pós-Relacionais
Bancos de Dados Pós-Relacionais
 
Tomada decisão
Tomada decisãoTomada decisão
Tomada decisão
 
ILM com PostgreSQL
ILM com PostgreSQLILM com PostgreSQL
ILM com PostgreSQL
 
Pg20235 rf20222vp20208
Pg20235 rf20222vp20208Pg20235 rf20222vp20208
Pg20235 rf20222vp20208
 
Business Analytics
Business AnalyticsBusiness Analytics
Business Analytics
 
Data warehousing
Data warehousingData warehousing
Data warehousing
 
[DTC21] André Marques - Jornada do Engenheiro de Dados
[DTC21] André Marques - Jornada do Engenheiro de Dados[DTC21] André Marques - Jornada do Engenheiro de Dados
[DTC21] André Marques - Jornada do Engenheiro de Dados
 
Curso Gratuito Online Desmistificando BI (Business Intelligence) Open Source ...
Curso Gratuito Online Desmistificando BI (Business Intelligence) Open Source ...Curso Gratuito Online Desmistificando BI (Business Intelligence) Open Source ...
Curso Gratuito Online Desmistificando BI (Business Intelligence) Open Source ...
 
Big Data - Hadoop
Big Data - HadoopBig Data - Hadoop
Big Data - Hadoop
 
Codificando .Net e SQL PASS Chapter - Novidades de BI para SQL Server 2012
Codificando .Net e SQL PASS Chapter - Novidades de BI para SQL Server 2012Codificando .Net e SQL PASS Chapter - Novidades de BI para SQL Server 2012
Codificando .Net e SQL PASS Chapter - Novidades de BI para SQL Server 2012
 
Apresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptx
Apresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptxApresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptx
Apresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptx
 
O fator manutenção no ciclo de vida de data warehouse
O fator manutenção no ciclo de vida de data warehouseO fator manutenção no ciclo de vida de data warehouse
O fator manutenção no ciclo de vida de data warehouse
 
Aplicação de Business Intelligence em Laboratórios Clínicos como ferramenta p...
Aplicação de Business Intelligence em Laboratórios Clínicos como ferramenta p...Aplicação de Business Intelligence em Laboratórios Clínicos como ferramenta p...
Aplicação de Business Intelligence em Laboratórios Clínicos como ferramenta p...
 
Uma Experiência de Solução de Business Intelligence com Software Livre na UFB...
Uma Experiência de Solução de Business Intelligence com Software Livre na UFB...Uma Experiência de Solução de Business Intelligence com Software Livre na UFB...
Uma Experiência de Solução de Business Intelligence com Software Livre na UFB...
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Tópico 2
Tópico 2Tópico 2
Tópico 2
 
Artigo particionamento
Artigo   particionamentoArtigo   particionamento
Artigo particionamento
 

Mais de Dennes Torres

Integrando big data ao oltp com polybase
Integrando big data ao oltp com polybaseIntegrando big data ao oltp com polybase
Integrando big data ao oltp com polybaseDennes Torres
 
Profissões e atividades do mercado de banco de
Profissões e atividades do mercado de banco deProfissões e atividades do mercado de banco de
Profissões e atividades do mercado de banco deDennes Torres
 
Técnicas de orm com o framework
Técnicas de orm com o frameworkTécnicas de orm com o framework
Técnicas de orm com o frameworkDennes Torres
 
Qualidade no desenvolvimento de software
Qualidade no desenvolvimento de softwareQualidade no desenvolvimento de software
Qualidade no desenvolvimento de softwareDennes Torres
 
Desenvolvimento para windows phone
Desenvolvimento para windows phoneDesenvolvimento para windows phone
Desenvolvimento para windows phoneDennes Torres
 
Desenvolvimento web com tecnologias microsoft
Desenvolvimento web com tecnologias microsoftDesenvolvimento web com tecnologias microsoft
Desenvolvimento web com tecnologias microsoftDennes Torres
 
Desenvolvendo em camadas com silverlight
Desenvolvendo em camadas com silverlightDesenvolvendo em camadas com silverlight
Desenvolvendo em camadas com silverlightDennes Torres
 

Mais de Dennes Torres (8)

Receitas XE
Receitas XEReceitas XE
Receitas XE
 
Integrando big data ao oltp com polybase
Integrando big data ao oltp com polybaseIntegrando big data ao oltp com polybase
Integrando big data ao oltp com polybase
 
Profissões e atividades do mercado de banco de
Profissões e atividades do mercado de banco deProfissões e atividades do mercado de banco de
Profissões e atividades do mercado de banco de
 
Técnicas de orm com o framework
Técnicas de orm com o frameworkTécnicas de orm com o framework
Técnicas de orm com o framework
 
Qualidade no desenvolvimento de software
Qualidade no desenvolvimento de softwareQualidade no desenvolvimento de software
Qualidade no desenvolvimento de software
 
Desenvolvimento para windows phone
Desenvolvimento para windows phoneDesenvolvimento para windows phone
Desenvolvimento para windows phone
 
Desenvolvimento web com tecnologias microsoft
Desenvolvimento web com tecnologias microsoftDesenvolvimento web com tecnologias microsoft
Desenvolvimento web com tecnologias microsoft
 
Desenvolvendo em camadas com silverlight
Desenvolvendo em camadas com silverlightDesenvolvendo em camadas com silverlight
Desenvolvendo em camadas com silverlight
 

Ecosistema de data warehouse com ferramentas microsoft

Notas do Editor

  1. If students want to better understand how the star join query optimizations in the SQL Server query optimizer work, review the articles referenced in their notes. However, emphasize that the optimizations are automatic and that students do not need to do anything other than use a star schema for the data warehouse tables to benefit from them.
  2. Note that not all data warehousing solutions include every component shown on the slide. However, each component has an important part to play in the implementation of a data warehousing solution and will be considered in this course.
  3. Ask students for examples of other types of data source they have encountered. Ask students how they would begin auditing a data source. Typical approaches include: Interactively querying tables in a relational database and examining the results. Reviewing data extracted from systems in text files. Using a tool such as the Data Profiling task in SQL Server Integration Services. Note that students who have previously attended course 20463C: Implementing a Data Warehouse with Microsoft® SQL Server® 2014 have used all of these techniques in the labs in that course.
  4. Point out that, although ETL is a primary element of a data warehousing solution, it is a subset of EIM. A comprehensive enterprise BI solution may also include data cleansing (either directly in the data sources or as part of the ETL process that loads the data warehouse) and master data management. Point out that the key difference between master data management and data cleansing is that the latter is based on knowledge about valid column values in a dataset. Master data management is based on knowledge about individual instances of business entities. For example, suppose a hypothetical customer has three records, one in each of three different systems. One indicates that the customer lives in “New Yrk”, another indicates that the customer lives in “Paris”, and the third indicates that the customer lives in “London”. A data quality solution might identify that the records all relate to the same customer (based on the fact that the records have the same name and email address) and that “New Yrk” should be corrected to “New York”, but it can’t determine in which of the three cities the customer lives. A master data management solution provides a definitive master record from which the correct data can be determined. Students who have attended course 20463C: Implementing a Data Warehouse with Microsoft® SQL Server® 2014 have used SSIS, DQS, and MDS during the labs in that course.
  5. Some students may want to debate the comparative merits of the Inmon and Kimball approaches. There are interesting aspects to both designs but, in practice, most solutions built on SQL Server favor a Kimball-style dimensional model in a centralized data warehouse or, in extremely large enterprises, a hub and spoke architecture. Try to avoid getting bogged down in a philosophical debate and steer students toward the pragmatic point that an understanding of dimensional modeling is important regardless of the methodology employed.
  6. Do not dwell too long on the differences between tabular and multidimensional models, because this is covered in subsequent modules.
  7. Explain that, although they can be considered as discrete elements of the BI solution, reporting and analysis are closely related and, in practice, are often indistinguishable from one another. For example, a user might employ an Excel PivotTable to analyze data in a cube, and then publish the resulting spreadsheet as a report. Another user might take an OData feed from a SQL Server Reporting Services report as a data source for a personal data model and analyze the report data together with data from other sources. Avoid getting into too much detail about analysis and reporting technologies at this stage. The key point is that reporting and analysis are the end goal of most BI solutions, and the specific reporting and analysis requirements must be identified and documented during the initial planning.
  8. Note that not all data warehousing solutions include every component shown on the slide. However, each component has an important part to play in the implementation of a data warehousing solution and will be considered in this course.