2. FASES DO APRENDIZADO
1 - Você não sabe o aquilo que não sabe
2 - Você sabe aquilo que não sabe
3 - Você sabe aquilo que sabe
3. Até 2003, a humanidade gerou cinco exabytes
de dados. Agora, nós produzimos cinco exabytes
de dados a cada dois dias.” – Eric Schmidt
(Google)
4.
5.
6. DEFINIÇÃO
BI é o conjunto de técnicas e processos para a coleta,
organização, análise, compartilhamento e
monitoramento dos dados para suportar a tomada
de decisão.
10. DATA MART VS. DATA WAREHOUSE
• DATA MART: conjunto de tabelas (fatos e dimensões de uma área
específica)
• DATA WAREHOUSE: conjunto de vários data marts
11.
12. ARQUITETURA STG -> ODS -> DW
• STAGING AREA (STG): camada de cópia de dados do sistema transacional
• OPERATIONAL DATA STORE (ODS): camada que reflete todos os dados históricos do sistema
transacional no formato transacional (normalizado e detalhado)
• DATA WAREHOUSE (DW): camada de armazenamento dos dados históricos no formato analítico
(desnormalizado, com fatos e dimensões)
15. TIPOS DE TABELAS NO DW
• Fato
• Armazena o histórico de processo de negócio se deseja analisar
• Vendas, Entregas, acidentes, Pedidos, Ligações etc.
• Dimensão
• Agrupa determinados atributos relacionados que fornecem contexto aos
processos de negócios .
• São usados para descrever o "o quê", "quando", "onde", "quem" e "como" para
qualquer processo de negócio.
• Exemplos:
• Data (dia, mês, ano, trimestre)
• Cliente
• Região (Loja, cidade, Estado, País)
• Produto (Item, categoria, subcategoria)
• Canal (e-commerce, loja física etc.)
16. MATRIZ DE NEGÓCIOS EMPRESARIAL
• EBM – Enterprise Business Matrix
• Permite identificar como as tabelas de dimensões se relacionam com as
tabelas fato.
Processo de
negócio(fato) /
dimensão
Data Cliente Cidade Fornecedor Nível de
Estoque
Vendas de Itens √ √ √ √
Compras de
fornecedores √ √ √ √
Processamento de
pedidos √ √ √ √
Movimentos de Estoque √ √ √ √ √
17. ETL (EXTRACT, TRANSFORM E LOAD)
•Extração, transformação e carga de dados
• Extração (leitura de dados do transacional para camada STG)
• Transformação (transformar dados se necessário para camada
ODS)
• Carga de dados (carregar tabelas da camada de dimensão –
outras camadas também são carregadas com dados
intermediários)
18. TIPOS DE MÉTRICAS
• Aditivas (agregável)
• Valores numéricos que podem ser somados por todas as dimensões de uma tabela fato
• Exemplo: quantidade de vendas
• São do tipo mais comum e as mais fáceis de se entender e de implementar
• Tipicamente usadas em análises de detalhamento e frequentemente servem como blocos de
construção de outros cálculos e medidas.
• Semi-aditivas (semi-agregável)
• Valores numéricos que podem ser somados por algumas dimensões da tabela fato, mas não
por todas.
• Na maioria dos casos podem ser agregados por qualquer dimensão, exceto a de tempo.
• Exemplo:
• Saldo de Conta: Você pode determinar o saldo final de uma conta no final de um mês, mas a soma
desses saldos mensais da conta não faz sentido.
• Geralmente encontradas em tabelas que armazenam fotos periódicas de dados.
19. • Não-aditivas (não agregável)
• Medidas não aditivas (não podem ser somadas).
• Incluem
• Porcentagens
• Percentual de Desconto
• Margem de Lucro
• Médias
• Custo Médio Unitário.
20. CUBO
• Estrutura de dados que
agrega as medidas pelos
níveis e hierarquias de cada
uma das dimensões.
• Combinam várias dimensões
(como tempo, geografia e
produtos) com dados
resumidos (como os números
de vendas ou de clientes)
• Semelhante a uma tabela
dinâmica, porém muito mais
poderoso
21. DASHBOARD
• Painel de visualização de dados, usado para facilitar a tomada de decisão
• Apresenta as informações mais importantes em formato visual, em uma única tela,
para que os dados possam ser monitorados e analisados ao mesmo tempo
• Aplica conceitos de storytelling para apresentar as informações da melhor forma
possível
• Exemplos:
• https://covid.saude.gov.br
• https://www.seade.gov.br/coronavirus/
• https://powerdax.com/product/power-bi-wide-world-importers/
22.
23.
24.
25. FERRAMENTAS
• Banco de dados
• MySQL
• Postgres
• SQL Server
• Oracle
• ETL
• ODI, OWB (Oracle)
• JasperSoft ETL
• SQL Server Integration Services (SSIS) - developer
• Talend
• Pentaho Data Integration (Kettle)
• Power Center
• Cubo
• SQL Server Analysis Services (SSAS) – developer
• Mondrian (Pentaho)
26. • Visualização de dados
• Microsoft Power BI
• Qlik View e Qlik Sense
• Tableau
• Google Data Studio
• Excel
• Cyfe
• Pentaho
30. POR ONDE COMEÇAR EM BI (RECOMENDAÇÃO)
• Banco de dados
• Normalização
• Joins (INNER, LEFT, FULL)
• Modelagem dimensional
• DDL e DML
• MERGE
• PK, UK
• ETL
• SSIS
• Pentaho Data Integration
• Visualização de dados
• Power BI
• Data Studio
• Pentaho
• Não é necessário conhecer Cubo
inicialmente
32. CANAIS E GRUPOS
• Data Science: https://t.me/joinchat/U2auSIAXz4hoKadJ
• Data Analytics BR: https://chat.whatsapp.com/CK9aKvwFA2j3DBl1UT6MY1
• Dados abertos: https://t.me/dadosabertos
• Data Science e Python: https://t.me/datasciencepython
• Ciência de Dados & R: https://t.me/DataScienceAndR