Motivação
Imagine que umaempresa já possui um DW mas um produto novo
gerou um aumento de 100x no volume de dados e os relatórios
estão ficando muito lentos e caros. Além disso, foi criada uma
área de Data Science que deve gerar insights contínuos para as
equipes comerciais. A gestão decidiu que irá construir um DL
para substituir o DW.
Quais cuidados devemos ter ao
migrar de um DW para um DL?
● Data lake
○Dados normalmente armazenados em arquivos (Avro,
Parquet, JSON, etc)
○ Conjunto de camadas para facilitar a manipulação
○ Funcionalidades como time travel
● Existem produtos que apoiam essa criação:
○ Apache Hudi
○ Apache Iceberg
○ Delta Lake (Databricks)
○ Snowflake
Implementação