SlideShare uma empresa Scribd logo
1 de 14
Baixar para ler offline
Construindo um Data Lake
e democratizando os dados
empresa a fora
Daniel Cassiano
Head of Data @ luizalabs
@danielcassiano
Agenda
● Desafio
● Processo
● Arquitetura
● Democratizando os dados
● Perguntas
O desafio
● Habilitar a empresa para consumir dados
● Acurácia das informações
● Fonte única da verdade
● Formatos plugáveis
● Diversas fontes de dados
● Analytics + Data Science + Business + Marketing
O desafio - sources
● Pipelines de dados recorrentes
● Priorização do tempo de atualização (D-X)
● Formatos plugáveis/acessíveis (json, csv, SQL, ...)
● Validação dos dados (unit and value tests)
● Reprocessamento automatizado
Processo
● Simples é melhor do que complexo
● Acessível é melhor do que inacessível
● Acurácia é tudo
● Documentação e didática fazem diferença
● Governança gera confiança
Premissas
Data Lake?
Data Lake!
Arquitetura simplificada
Arquitetura
Democratizando os dados
● +200 pessoas acessando os dados (vários níveis)
● ~20TB de dados
● Dados NRT até D-7
● 1 ano e meio de vida
Democratizando os dados
● Documentação
● Queries/extrações prontas e exemplos
● Ferramentas de visualização
● Confiança nos dados
● Data Engineering + Business
Democratizando os dados
Perguntas?
Estamos contratando!
bit.ly/vagaluizalabs
Obrigado!
luizalabs.com
magazineluiza.com.br
Daniel Cassiano
Head of Data @ luizalabs
@danielcassiano

Mais conteúdo relacionado

Semelhante a Construindo um Data Lake e democratizando os dados

Carreira do profissional de dados
Carreira do profissional de dadosCarreira do profissional de dados
Carreira do profissional de dadosEdvaldo Castro
 
Tesi Dados Final
Tesi Dados FinalTesi Dados Final
Tesi Dados Finaljcaroso
 
DataOps: da teoria a prática, como realmente se aplica em projetos de BigData
DataOps: da teoria a prática, como realmente se aplica em projetos de BigDataDataOps: da teoria a prática, como realmente se aplica em projetos de BigData
DataOps: da teoria a prática, como realmente se aplica em projetos de BigDataEduardo Hahn
 
TDC2017 - Misturando dados com Pentaho para insights mais significativos
TDC2017 - Misturando dados com Pentaho para insights mais significativosTDC2017 - Misturando dados com Pentaho para insights mais significativos
TDC2017 - Misturando dados com Pentaho para insights mais significativosAmbiente Livre
 
Ecosistema de data warehouse com ferramentas microsoft
Ecosistema de data warehouse com ferramentas microsoftEcosistema de data warehouse com ferramentas microsoft
Ecosistema de data warehouse com ferramentas microsoftDennes Torres
 
Apresentação TDC 2018 - Go e Banco de Dados
Apresentação TDC 2018 - Go e Banco de DadosApresentação TDC 2018 - Go e Banco de Dados
Apresentação TDC 2018 - Go e Banco de DadosMarcelo Krüger
 
TDC São Paulo Online 2020 - trilha Big Data
TDC São Paulo Online 2020 - trilha Big DataTDC São Paulo Online 2020 - trilha Big Data
TDC São Paulo Online 2020 - trilha Big DataEduardo Hahn
 
Postgres + Azure = Transformando dificuldades em oportunidades
Postgres + Azure = Transformando dificuldades em oportunidades Postgres + Azure = Transformando dificuldades em oportunidades
Postgres + Azure = Transformando dificuldades em oportunidades Marcelo Krüger
 
TDC2018FLN | Trilha Cloud - Postgres + Azure = Transformando dificuldades em ...
TDC2018FLN | Trilha Cloud - Postgres + Azure = Transformando dificuldades em ...TDC2018FLN | Trilha Cloud - Postgres + Azure = Transformando dificuldades em ...
TDC2018FLN | Trilha Cloud - Postgres + Azure = Transformando dificuldades em ...tdc-globalcode
 
Como Implementar a Análise de Dados em Tempo Real
Como Implementar a Análise de Dados em Tempo RealComo Implementar a Análise de Dados em Tempo Real
Como Implementar a Análise de Dados em Tempo RealDenodo
 
DataOps, Data Mesh e Data Fabric. Melhores práticas para seu projeto de arqui...
DataOps, Data Mesh e Data Fabric. Melhores práticas para seu projeto de arqui...DataOps, Data Mesh e Data Fabric. Melhores práticas para seu projeto de arqui...
DataOps, Data Mesh e Data Fabric. Melhores práticas para seu projeto de arqui...Eduardo Hahn
 
DBA Brasil 2.0: Como o papel e atividades de DBA ficam no contexto da cultura...
DBA Brasil 2.0: Como o papel e atividades de DBA ficam no contexto da cultura...DBA Brasil 2.0: Como o papel e atividades de DBA ficam no contexto da cultura...
DBA Brasil 2.0: Como o papel e atividades de DBA ficam no contexto da cultura...Fabrízio Mello
 
Qual é o futuro da estratégia de dados?
Qual é o futuro da estratégia de dados?Qual é o futuro da estratégia de dados?
Qual é o futuro da estratégia de dados?Denodo
 
Flisol 2016 fidelis - Curitiba - PR - Brazil
Flisol 2016   fidelis - Curitiba - PR - BrazilFlisol 2016   fidelis - Curitiba - PR - Brazil
Flisol 2016 fidelis - Curitiba - PR - BrazilMarcos Vinicius Fidelis
 
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
[DTC21] Lucas Gomes - Do 0 ao 100 no Big DataDeep Tech Brasil
 

Semelhante a Construindo um Data Lake e democratizando os dados (20)

Carreira do profissional de dados
Carreira do profissional de dadosCarreira do profissional de dados
Carreira do profissional de dados
 
Tesi Dados Final
Tesi Dados FinalTesi Dados Final
Tesi Dados Final
 
Big Data - Hadoop
Big Data - HadoopBig Data - Hadoop
Big Data - Hadoop
 
DataOps: da teoria a prática, como realmente se aplica em projetos de BigData
DataOps: da teoria a prática, como realmente se aplica em projetos de BigDataDataOps: da teoria a prática, como realmente se aplica em projetos de BigData
DataOps: da teoria a prática, como realmente se aplica em projetos de BigData
 
TDC2017 - Misturando dados com Pentaho para insights mais significativos
TDC2017 - Misturando dados com Pentaho para insights mais significativosTDC2017 - Misturando dados com Pentaho para insights mais significativos
TDC2017 - Misturando dados com Pentaho para insights mais significativos
 
ILM com PostgreSQL
ILM com PostgreSQLILM com PostgreSQL
ILM com PostgreSQL
 
Ecosistema de data warehouse com ferramentas microsoft
Ecosistema de data warehouse com ferramentas microsoftEcosistema de data warehouse com ferramentas microsoft
Ecosistema de data warehouse com ferramentas microsoft
 
TDC - Planejando data Lake com big data clusters
TDC - Planejando data Lake com big data clustersTDC - Planejando data Lake com big data clusters
TDC - Planejando data Lake com big data clusters
 
Apresentação TDC 2018 - Go e Banco de Dados
Apresentação TDC 2018 - Go e Banco de DadosApresentação TDC 2018 - Go e Banco de Dados
Apresentação TDC 2018 - Go e Banco de Dados
 
Business Analytics
Business AnalyticsBusiness Analytics
Business Analytics
 
TDC São Paulo Online 2020 - trilha Big Data
TDC São Paulo Online 2020 - trilha Big DataTDC São Paulo Online 2020 - trilha Big Data
TDC São Paulo Online 2020 - trilha Big Data
 
Postgres + Azure = Transformando dificuldades em oportunidades
Postgres + Azure = Transformando dificuldades em oportunidades Postgres + Azure = Transformando dificuldades em oportunidades
Postgres + Azure = Transformando dificuldades em oportunidades
 
TDC2018FLN | Trilha Cloud - Postgres + Azure = Transformando dificuldades em ...
TDC2018FLN | Trilha Cloud - Postgres + Azure = Transformando dificuldades em ...TDC2018FLN | Trilha Cloud - Postgres + Azure = Transformando dificuldades em ...
TDC2018FLN | Trilha Cloud - Postgres + Azure = Transformando dificuldades em ...
 
Como Implementar a Análise de Dados em Tempo Real
Como Implementar a Análise de Dados em Tempo RealComo Implementar a Análise de Dados em Tempo Real
Como Implementar a Análise de Dados em Tempo Real
 
DataOps, Data Mesh e Data Fabric. Melhores práticas para seu projeto de arqui...
DataOps, Data Mesh e Data Fabric. Melhores práticas para seu projeto de arqui...DataOps, Data Mesh e Data Fabric. Melhores práticas para seu projeto de arqui...
DataOps, Data Mesh e Data Fabric. Melhores práticas para seu projeto de arqui...
 
DBA Brasil 2.0: Como o papel e atividades de DBA ficam no contexto da cultura...
DBA Brasil 2.0: Como o papel e atividades de DBA ficam no contexto da cultura...DBA Brasil 2.0: Como o papel e atividades de DBA ficam no contexto da cultura...
DBA Brasil 2.0: Como o papel e atividades de DBA ficam no contexto da cultura...
 
Lecture 7 :: Ferramentas Case
Lecture 7 :: Ferramentas CaseLecture 7 :: Ferramentas Case
Lecture 7 :: Ferramentas Case
 
Qual é o futuro da estratégia de dados?
Qual é o futuro da estratégia de dados?Qual é o futuro da estratégia de dados?
Qual é o futuro da estratégia de dados?
 
Flisol 2016 fidelis - Curitiba - PR - Brazil
Flisol 2016   fidelis - Curitiba - PR - BrazilFlisol 2016   fidelis - Curitiba - PR - Brazil
Flisol 2016 fidelis - Curitiba - PR - Brazil
 
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
 

Construindo um Data Lake e democratizando os dados