Ingestão de
Dados
• Papeis(Arquiteto, Engenheiro e Cientista)
• Data Driven
• Modelagem / Data Mart / Data Warehouse
• Processo de ETL / ELT / Virtualização de
Dados
• Staging / ODS / Slowly Change Dimension
• Data Lake / Delta Lake e afins
• Banco de Dados NoSQL
• Notebook´s para Machine Learning / Apache
Spark
Slowly
Change
Dimension
• SCD -Slowly Change Dimension.
• Para gerenciar mudanças em dados de
dimensões ao longo do tempo.
• https://en.wikipedia.org/wiki/
Slowly_changing_dimension
11.
Change Data
Capture
• CDC- Change Data Capture.
• Em bancos de dados, a captura de dados
alterados (CDC) é um conjunto de padrões de
design de software usados para determinar e
rastrear os dados que foram alterados (os
"deltas") para que ações possam ser tomadas
usando os dados alterados. O resultado é um
conjunto de dados orientado por delta.
12.
Change Data
Capture
• CDC- Change Data Capture.
• CDC é uma abordagem para integração de
dados baseada na identificação, captura e
entrega das alterações feitas nas fontes de
dados corporativos. Por exemplo, pode ser
usado para atualização incremental de
carregamento de dados.