SlideShare uma empresa Scribd logo
1 de 28
Data Lake
Meetup SQL Norte + FCamara São Paulo,06/02/2020
Luiz Henrique Garetti
Por que falar
desse assunto?
O que não é
Data Lake?
Data Lake é
Uma prática de arquitetura implementada sob uma infraestrutura robusta que tem como objetivo suportar
o armazenamento e processaamento de grandes volumes de dados.
Centralizando o acesso e disponibilizando os dados para processamento, análise, consumo e distribuição
(democratizando) das informações para outros sistemas
Data Lake
• Arquitetura robusta para armazenamento e processamento de grandes volumes de dados;
• Ingestão de dados em diversas estruturas (Estruturados e não estruturados);
• Arquitetura com poder de escalabilidade (scale-out / scale-in) em processamento e armazenamento;
• Acesso a dados fundamentais para Data Science, Analytics, BI, etc;
• Democratização da informação/dados;
• Ponto unico (Data Hub) para consumo de dados;
• Arquitetura de referência para integração entre sistemas.
Habilita:
DW x Data Lake
No DW
É um “grande banco de dados” estruturado. Ou seja, os dados precisam ser “formatados” durante o processo
de carga (ETL).
Isso implica em:
• Existência prévia do schema (tabelas pré-definidas);
• Atendem a necessidades especificas;
• A mudança de estruturas impacta sistemas consumidores;
No Lake
Nao é necessário ter schemas pré-definidos;
Podemos armazenar qualquer tipo de arquivo;
Cada consumidor, consome da forma que precisa (Tempestividade, tratamento);
Porque e quando o Data Lake
(não) faz sentido
Implementações
Data Lake
Pipeline de Dados
Pipeline de Dados
1) Captura dados dos sistemas (dados brutos);
2) Processa os dados (aplicando regras);
3) Distribuí / Consome os dados;
4) Resultado é capturado e ciclo é iniciado
novamente.
Zones
Arquitetura (on-Premise)
Arquitetura (Azure)
Arquitetura (AWS)
E.... Se nosso ambiente for MultiCloud?
Data Lake MultiCloud ?
Add
Data Gravity (Gravidade dos Dados)
Virtualização e Federação de Dados
Virtualização de Dados é
É qualquer abordagem que permite que um aplicativo acesse os dados sem exigir detalhes técnicos,
localização fisica e tecnologia, podendo fornecer um único canal de acesso ao dado.
Interface que fornece um único ponto de acesso aos dados oculta seus detalhes de
armazenamento distribuído e heterogêneo
Imagine
Um ambiente com vários sistemas, sendo estruturas de dados diferentes (SQL, NoSQL)
alocados em plataformas distintas (On-Premise, Azure, AWS, GCP, Alibabá)
Agora Imagine
A integração entre o produto A (SQL-Azure) que tem dados de pedido com o produto B
(MongoDB-Atlas) que tem dados de geolocalização dos clientes.
Alguns processos do Hadoop (on-Premise) também precisam desses dados como
premissa para alguns processos.
Como poderíamos resolver isso?
Movimentar (duplicar)
dados para uma stage
Criar um linked
server (jump server)
Expor uma API
E Os Ciêntistas precisam de todos esses dados para suas analises, ML, etc
Data Lake
Produto A
Produto B
Produto C
DATA SOURCE DATA CONSUMER
• Movimentação de dados
• Duplicação de dados
• Aumento de complexidade para rastreabilidade dos dados (LGPD)
DATA VIRTUALIZATION
DATA
VIRTUALIZATION
Virtualização de Dados
Big Data Clusters
BDC - Arquitetura
Big Data Clusters - Virtualização de Dados
• Virtualização via engine Polybase.
• PushDown – External Table.
Master
Compute
Data
Pool
Data
Pool
Storage
Pool
Storage
Pool
SQL Server
Shared
HDFS
Control Plane
Compute Plane
Data Plane
ComputeCompute
Data
Pool
BDC – Scale-out
Virtualização de Dados
PowerBI
Consumindo Dados
Cadastros de Clientes
(SQL Server)
Feedbacks Redes Sociais
(HDFS)
XML das Notas
Fiscais
Geolocalização
Cidades
Data Lake com BDC
Recapitulando...
• Data Lake é pratica de arquitetura para construir uma infra com grande capacidade de armazenamento e
processamento. Que tem o objetivo disponibilizar dados para n fontes e n diversos tipos de consumo
• Principal Diferença entre Data Lake e Data Warehouse?
• O que devemos levar em consideração durante a criação da Arquitetura do Data Lake?
• Pipeline de Dados...
• Tecnologias...
• Conceitos (Gravidade de Dados) / Governança / DDD...
• Big Data Clusters
• Infraestrutura para processamento MPP
• Virtualização de Dados
• Arquitetura de Data Lake
• Hub de Dados
Scripts
https://github.com/luizhgaretti
Slides
http://bit.ly/SlideShare-Garetti
@Luizhgaretti @luizhenriquegaretti luizh.rosario@gmail.com @luizhgaretti
https://dataisbig.com.br/
Luiz Henrique Garetti
Obrigado, flw, vlws
#bigdataclusters
#sqlbigdataclusters

Mais conteúdo relacionado

Mais procurados

Data warehousing - Técnicas e procedimentos
Data warehousing - Técnicas e procedimentosData warehousing - Técnicas e procedimentos
Data warehousing - Técnicas e procedimentosMarcos Pessoa
 
Microsoft 5 Cal Dispositivo Local P/ Windows Server 2019 Standard R18-05766
Microsoft 5 Cal Dispositivo Local P/ Windows Server 2019 Standard R18-05766Microsoft 5 Cal Dispositivo Local P/ Windows Server 2019 Standard R18-05766
Microsoft 5 Cal Dispositivo Local P/ Windows Server 2019 Standard R18-05766Stryhn49Ritter
 
Kimball Vs Inmon
Kimball Vs InmonKimball Vs Inmon
Kimball Vs Inmonguest2308b5
 
2019-2 - BD I - Aula 01 C - Introdução a Banco de Dados
2019-2 - BD I - Aula 01 C - Introdução a Banco de Dados2019-2 - BD I - Aula 01 C - Introdução a Banco de Dados
2019-2 - BD I - Aula 01 C - Introdução a Banco de DadosRodrigo Kiyoshi Saito
 
Carreira do profissional de dados
Carreira do profissional de dadosCarreira do profissional de dados
Carreira do profissional de dadosEdvaldo Castro
 
Introdução ao Data Warehouse
Introdução ao Data WarehouseIntrodução ao Data Warehouse
Introdução ao Data WarehouseMessias Batista
 
Treinamento PowerBI
Treinamento  PowerBITreinamento  PowerBI
Treinamento PowerBItiaquarius
 
Arquitetura e sgbd de um banco de dados
Arquitetura e sgbd de um banco de dadosArquitetura e sgbd de um banco de dados
Arquitetura e sgbd de um banco de dadosdiogocbj
 
Inove simplificando a infraestrutura com Kafka
Inove simplificando a infraestrutura com KafkaInove simplificando a infraestrutura com Kafka
Inove simplificando a infraestrutura com KafkaTechrom Tecnologia
 

Mais procurados (20)

Data warehousing - Técnicas e procedimentos
Data warehousing - Técnicas e procedimentosData warehousing - Técnicas e procedimentos
Data warehousing - Técnicas e procedimentos
 
Microsoft 5 Cal Dispositivo Local P/ Windows Server 2019 Standard R18-05766
Microsoft 5 Cal Dispositivo Local P/ Windows Server 2019 Standard R18-05766Microsoft 5 Cal Dispositivo Local P/ Windows Server 2019 Standard R18-05766
Microsoft 5 Cal Dispositivo Local P/ Windows Server 2019 Standard R18-05766
 
Kimball Vs Inmon
Kimball Vs InmonKimball Vs Inmon
Kimball Vs Inmon
 
2019-2 - BD I - Aula 01 C - Introdução a Banco de Dados
2019-2 - BD I - Aula 01 C - Introdução a Banco de Dados2019-2 - BD I - Aula 01 C - Introdução a Banco de Dados
2019-2 - BD I - Aula 01 C - Introdução a Banco de Dados
 
Data center da wikipédia
Data center da wikipédiaData center da wikipédia
Data center da wikipédia
 
Comparação entre bancos de dados de modelo não relacional
Comparação entre bancos de dados de modelo não relacionalComparação entre bancos de dados de modelo não relacional
Comparação entre bancos de dados de modelo não relacional
 
FLISOL 2017 - SQL Server no Linux
FLISOL 2017 - SQL Server no LinuxFLISOL 2017 - SQL Server no Linux
FLISOL 2017 - SQL Server no Linux
 
SharperDataBI
SharperDataBI SharperDataBI
SharperDataBI
 
Modelos de Banco de dados e SGBDS
Modelos de Banco de dados e SGBDSModelos de Banco de dados e SGBDS
Modelos de Banco de dados e SGBDS
 
Ingestão de Dados
Ingestão de DadosIngestão de Dados
Ingestão de Dados
 
Carlinda 2013 imib
Carlinda 2013 imibCarlinda 2013 imib
Carlinda 2013 imib
 
Carreira do profissional de dados
Carreira do profissional de dadosCarreira do profissional de dados
Carreira do profissional de dados
 
Introdução ao Data Warehouse
Introdução ao Data WarehouseIntrodução ao Data Warehouse
Introdução ao Data Warehouse
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouse
 
Data Warehouse
Data WarehouseData Warehouse
Data Warehouse
 
Treinamento PowerBI
Treinamento  PowerBITreinamento  PowerBI
Treinamento PowerBI
 
Big data Workshop
Big data WorkshopBig data Workshop
Big data Workshop
 
Introdução ao banco de dados
Introdução ao banco de dadosIntrodução ao banco de dados
Introdução ao banco de dados
 
Arquitetura e sgbd de um banco de dados
Arquitetura e sgbd de um banco de dadosArquitetura e sgbd de um banco de dados
Arquitetura e sgbd de um banco de dados
 
Inove simplificando a infraestrutura com Kafka
Inove simplificando a infraestrutura com KafkaInove simplificando a infraestrutura com Kafka
Inove simplificando a infraestrutura com Kafka
 

Semelhante a Meetup - Data Lake

Azure SQL DataWarehouse
Azure SQL DataWarehouseAzure SQL DataWarehouse
Azure SQL DataWarehouseVitor Fava
 
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...Amazon Web Services LATAM
 
Stream de dados e Data Lake com Debezium, Delta Lake e EMR
Stream de dados e Data Lake com Debezium, Delta Lake e EMRStream de dados e Data Lake com Debezium, Delta Lake e EMR
Stream de dados e Data Lake com Debezium, Delta Lake e EMRCicero Joasyo Mateus de Moura
 
[DTC21] André Marques - Jornada do Engenheiro de Dados
[DTC21] André Marques - Jornada do Engenheiro de Dados[DTC21] André Marques - Jornada do Engenheiro de Dados
[DTC21] André Marques - Jornada do Engenheiro de DadosDeep Tech Brasil
 
Interoperabilidade entre bancos de dados
Interoperabilidade entre bancos de dadosInteroperabilidade entre bancos de dados
Interoperabilidade entre bancos de dadospichiliani
 
Interoperabilidade entre bancos de dados
Interoperabilidade entre bancos de dadosInteroperabilidade entre bancos de dados
Interoperabilidade entre bancos de dadospichiliani
 
NoSQL x SQL: Bancos de Dados em Nuvens Computacionais
NoSQL x SQL: Bancos de Dados em Nuvens ComputacionaisNoSQL x SQL: Bancos de Dados em Nuvens Computacionais
NoSQL x SQL: Bancos de Dados em Nuvens ComputacionaisCarlo Pires
 
Migrando Aplicações para o SQL Azure Database
Migrando Aplicações para o SQL Azure DatabaseMigrando Aplicações para o SQL Azure Database
Migrando Aplicações para o SQL Azure DatabaseRoberto Fonseca
 
Modernizando o papel do Data Lake em uma arquitetura de Data Fabric
Modernizando o papel do Data Lake em uma arquitetura de Data FabricModernizando o papel do Data Lake em uma arquitetura de Data Fabric
Modernizando o papel do Data Lake em uma arquitetura de Data FabricDenodo
 
Tesi Dados Final
Tesi Dados FinalTesi Dados Final
Tesi Dados Finaljcaroso
 

Semelhante a Meetup - Data Lake (20)

Streaming architecture with big data clusters
Streaming architecture with big data clustersStreaming architecture with big data clusters
Streaming architecture with big data clusters
 
Sql server 2019 big data cluster
Sql server 2019 big data clusterSql server 2019 big data cluster
Sql server 2019 big data cluster
 
TDC - Planejando data Lake com big data clusters
TDC - Planejando data Lake com big data clustersTDC - Planejando data Lake com big data clusters
TDC - Planejando data Lake com big data clusters
 
Azure SQL DataWarehouse
Azure SQL DataWarehouseAzure SQL DataWarehouse
Azure SQL DataWarehouse
 
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
 
Construindo um data lake na nuvem aws
Construindo um data lake na nuvem awsConstruindo um data lake na nuvem aws
Construindo um data lake na nuvem aws
 
Stream de dados e Data Lake com Debezium, Delta Lake e EMR
Stream de dados e Data Lake com Debezium, Delta Lake e EMRStream de dados e Data Lake com Debezium, Delta Lake e EMR
Stream de dados e Data Lake com Debezium, Delta Lake e EMR
 
[DTC21] André Marques - Jornada do Engenheiro de Dados
[DTC21] André Marques - Jornada do Engenheiro de Dados[DTC21] André Marques - Jornada do Engenheiro de Dados
[DTC21] André Marques - Jornada do Engenheiro de Dados
 
Interoperabilidade entre bancos de dados
Interoperabilidade entre bancos de dadosInteroperabilidade entre bancos de dados
Interoperabilidade entre bancos de dados
 
Interoperabilidade entre bancos de dados
Interoperabilidade entre bancos de dadosInteroperabilidade entre bancos de dados
Interoperabilidade entre bancos de dados
 
NoSQL x SQL: Bancos de Dados em Nuvens Computacionais
NoSQL x SQL: Bancos de Dados em Nuvens ComputacionaisNoSQL x SQL: Bancos de Dados em Nuvens Computacionais
NoSQL x SQL: Bancos de Dados em Nuvens Computacionais
 
Migrando Aplicações para o SQL Azure Database
Migrando Aplicações para o SQL Azure DatabaseMigrando Aplicações para o SQL Azure Database
Migrando Aplicações para o SQL Azure Database
 
Sql maniacs sql server 2019 Big Data Clusters
Sql maniacs   sql server 2019 Big Data ClustersSql maniacs   sql server 2019 Big Data Clusters
Sql maniacs sql server 2019 Big Data Clusters
 
SQL Maniacs - SQL Server 2019 Big Data Clusters
SQL Maniacs - SQL Server 2019 Big Data ClustersSQL Maniacs - SQL Server 2019 Big Data Clusters
SQL Maniacs - SQL Server 2019 Big Data Clusters
 
Meetup Tivir - Big Data Clusters
Meetup Tivir - Big Data ClustersMeetup Tivir - Big Data Clusters
Meetup Tivir - Big Data Clusters
 
Modernizando o papel do Data Lake em uma arquitetura de Data Fabric
Modernizando o papel do Data Lake em uma arquitetura de Data FabricModernizando o papel do Data Lake em uma arquitetura de Data Fabric
Modernizando o papel do Data Lake em uma arquitetura de Data Fabric
 
Pentaho PDI
Pentaho PDIPentaho PDI
Pentaho PDI
 
Artigo Nosql
Artigo NosqlArtigo Nosql
Artigo Nosql
 
Material Seminário NoSQL
Material Seminário NoSQLMaterial Seminário NoSQL
Material Seminário NoSQL
 
Tesi Dados Final
Tesi Dados FinalTesi Dados Final
Tesi Dados Final
 

Mais de Luiz Henrique Garetti Rosário

Mais de Luiz Henrique Garetti Rosário (8)

SQL SAT Salvador - Arquitetando Data Lake Multicloud
SQL SAT Salvador - Arquitetando Data Lake MulticloudSQL SAT Salvador - Arquitetando Data Lake Multicloud
SQL SAT Salvador - Arquitetando Data Lake Multicloud
 
Imasters - HA e DR como seguro de vida do DBA
Imasters - HA e DR como seguro de vida do DBAImasters - HA e DR como seguro de vida do DBA
Imasters - HA e DR como seguro de vida do DBA
 
SQL Saturday SP - SQL Server 2019 Big Data Clusters
SQL Saturday SP - SQL Server 2019 Big Data ClustersSQL Saturday SP - SQL Server 2019 Big Data Clusters
SQL Saturday SP - SQL Server 2019 Big Data Clusters
 
Otimizando a performance com in-memory no SQL 2016
Otimizando a performance com in-memory no SQL 2016Otimizando a performance com in-memory no SQL 2016
Otimizando a performance com in-memory no SQL 2016
 
High Availability and Disaster Recovery salvando vidas
High Availability and Disaster Recovery salvando vidasHigh Availability and Disaster Recovery salvando vidas
High Availability and Disaster Recovery salvando vidas
 
Otimizando a performance com in memory no sql 2016
Otimizando a performance com in memory no sql 2016Otimizando a performance com in memory no sql 2016
Otimizando a performance com in memory no sql 2016
 
High availability e Disaster Recovery é o seguro de vida de todo DBA
High availability e Disaster Recovery é o seguro de vida de todo DBAHigh availability e Disaster Recovery é o seguro de vida de todo DBA
High availability e Disaster Recovery é o seguro de vida de todo DBA
 
Escovando bit com alwayson sql server 2014
Escovando bit com alwayson sql server 2014Escovando bit com alwayson sql server 2014
Escovando bit com alwayson sql server 2014
 

Meetup - Data Lake

  • 1. Data Lake Meetup SQL Norte + FCamara São Paulo,06/02/2020 Luiz Henrique Garetti
  • 3. O que não é Data Lake?
  • 4. Data Lake é Uma prática de arquitetura implementada sob uma infraestrutura robusta que tem como objetivo suportar o armazenamento e processaamento de grandes volumes de dados. Centralizando o acesso e disponibilizando os dados para processamento, análise, consumo e distribuição (democratizando) das informações para outros sistemas
  • 5. Data Lake • Arquitetura robusta para armazenamento e processamento de grandes volumes de dados; • Ingestão de dados em diversas estruturas (Estruturados e não estruturados); • Arquitetura com poder de escalabilidade (scale-out / scale-in) em processamento e armazenamento; • Acesso a dados fundamentais para Data Science, Analytics, BI, etc; • Democratização da informação/dados; • Ponto unico (Data Hub) para consumo de dados; • Arquitetura de referência para integração entre sistemas. Habilita:
  • 6. DW x Data Lake No DW É um “grande banco de dados” estruturado. Ou seja, os dados precisam ser “formatados” durante o processo de carga (ETL). Isso implica em: • Existência prévia do schema (tabelas pré-definidas); • Atendem a necessidades especificas; • A mudança de estruturas impacta sistemas consumidores; No Lake Nao é necessário ter schemas pré-definidos; Podemos armazenar qualquer tipo de arquivo; Cada consumidor, consome da forma que precisa (Tempestividade, tratamento);
  • 7. Porque e quando o Data Lake (não) faz sentido
  • 10. Pipeline de Dados 1) Captura dados dos sistemas (dados brutos); 2) Processa os dados (aplicando regras); 3) Distribuí / Consome os dados; 4) Resultado é capturado e ciclo é iniciado novamente.
  • 11. Zones
  • 15. E.... Se nosso ambiente for MultiCloud? Data Lake MultiCloud ?
  • 16. Add Data Gravity (Gravidade dos Dados) Virtualização e Federação de Dados
  • 17. Virtualização de Dados é É qualquer abordagem que permite que um aplicativo acesse os dados sem exigir detalhes técnicos, localização fisica e tecnologia, podendo fornecer um único canal de acesso ao dado. Interface que fornece um único ponto de acesso aos dados oculta seus detalhes de armazenamento distribuído e heterogêneo
  • 18. Imagine Um ambiente com vários sistemas, sendo estruturas de dados diferentes (SQL, NoSQL) alocados em plataformas distintas (On-Premise, Azure, AWS, GCP, Alibabá) Agora Imagine A integração entre o produto A (SQL-Azure) que tem dados de pedido com o produto B (MongoDB-Atlas) que tem dados de geolocalização dos clientes. Alguns processos do Hadoop (on-Premise) também precisam desses dados como premissa para alguns processos. Como poderíamos resolver isso? Movimentar (duplicar) dados para uma stage Criar um linked server (jump server) Expor uma API E Os Ciêntistas precisam de todos esses dados para suas analises, ML, etc Data Lake
  • 19. Produto A Produto B Produto C DATA SOURCE DATA CONSUMER • Movimentação de dados • Duplicação de dados • Aumento de complexidade para rastreabilidade dos dados (LGPD) DATA VIRTUALIZATION DATA VIRTUALIZATION
  • 23. Big Data Clusters - Virtualização de Dados • Virtualização via engine Polybase. • PushDown – External Table.
  • 25. Virtualização de Dados PowerBI Consumindo Dados Cadastros de Clientes (SQL Server) Feedbacks Redes Sociais (HDFS) XML das Notas Fiscais Geolocalização Cidades
  • 27. Recapitulando... • Data Lake é pratica de arquitetura para construir uma infra com grande capacidade de armazenamento e processamento. Que tem o objetivo disponibilizar dados para n fontes e n diversos tipos de consumo • Principal Diferença entre Data Lake e Data Warehouse? • O que devemos levar em consideração durante a criação da Arquitetura do Data Lake? • Pipeline de Dados... • Tecnologias... • Conceitos (Gravidade de Dados) / Governança / DDD... • Big Data Clusters • Infraestrutura para processamento MPP • Virtualização de Dados • Arquitetura de Data Lake • Hub de Dados
  • 28. Scripts https://github.com/luizhgaretti Slides http://bit.ly/SlideShare-Garetti @Luizhgaretti @luizhenriquegaretti luizh.rosario@gmail.com @luizhgaretti https://dataisbig.com.br/ Luiz Henrique Garetti Obrigado, flw, vlws #bigdataclusters #sqlbigdataclusters

Notas do Editor

  1. Criar a sinergia com o Púbico Apresentação Pessoal Procurar entender o perfil do Público, (Com o que trabalham, conhecem do tema, querem entrar para a area de big data, se tivesse um curso de Big Data para DBAs...)
  2. Fala sobre Big Data... Big Data e os 5 Vs, as necessidades foram mudando conforme a evolução das tecnologias e etc. ----- A recente necessidade das empresas de lidar com quantidades enormes de informação e o valor estratégico da análise sobre todos esses dados têm feito com que surjam novas ferramentas e conceitos todos os dias. Entre essas soluções está o Data Lake, uma nova visão acerca do armazenamento e processamento de informações. Neste post, vamos mostrar como essa tecnologia funciona. Fique conosco e boa leitura! Uma arquitetura de big data foi projetada para lidar com a ingestão, processamento e análise de dados muito grandes ou complexos para os sistemas de banco de dados tradicionais. O limite em que as organizações entram no domínio de big data difere, dependendo dos recursos dos usuários e de suas ferramentas. Para alguns, pode significar centenas de gigabytes de dados, enquanto para outros significa centenas de terabytes. À medida que as ferramentas para trabalhar com conjuntos de big data avançam, o mesmo acontece com o significado de big data. Cada vez mais, esse termo está relacionado ao valor que você pode extrair de seus conjuntos de dados por meio de análises avançadas, em vez de estritamente o tamanho dos dados, embora, nesses casos, eles tendam a ser bastante grandes. Ao longo dos anos, o cenário de dados mudou. O que você pode fazer, ou se espera que seja, com os dados mudou. O custo do armazenamento caiu drasticamente, enquanto os meios pelos quais os dados são coletados continuam crescendo. Alguns dados chegam rapidamente, exigindo constantemente serem coletados e observados. Outros dados chegam mais lentamente, mas em blocos muito grandes, geralmente na forma de décadas de dados históricos. Você pode estar enfrentando um problema de análise avançada ou um que requer aprendizado de máquina. Esses são os desafios que as arquiteturas de big data procuram resolver.
  3. Não é um bicho de 7 cabeças. Não é uma Tecnologia Não é uma uma zona (Dark Lake). Não é um grande banco de Dados Não é o Hadoop. Não é a solução para todos os problemas da sua empresa. Não é a unica coisa que você precisa pensar e fazer para iniciar uma jornada Data Driven na sua empresa.
  4. As duas abordagens são verdadeiras e atendem tipos de problemas diferentes, muitas vezes, os dois são necessários na empresa. Um não mata o outro.. E também a existente de um, não depende da existencia do outro.