SlideShare uma empresa Scribd logo
© 2019, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Construindo Data Lakes para o Governo
Mv – Marcus Ferreira
Arquiteto de Soluções para Governo, Saúde e Educação
© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
The world’s most
valuable resource is
no longer oil, but data.*
“
”
*Copyright:The Economist, 2017, David Parkins
Visão Tradicional da Arquitetura Corporativa de Dados
OLTP ERP CRM LOB
Data warehouse
Business intelligence • Dado Relacional
• Escala deTBs–PBs
• Esquema definido antes do acúmulo de dados
• Relatórios Operacionais e ad-hoc
Data Lakes estendem a abordagem tradicional
Data warehouse
Business intelligence
OLTP ERP CRM LOB
• Dado Relacional e Não Relacional
• Escala deTBs–EBs
• Motores Analíticos Diversos
• Armazenamento de baixo custo &
Analytics
Dispositivos Web Sensores Social
Data lake
Processamento Big data,
real-time, machine learning
© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Dados crescem continuamente
• O volume de dados cresce mais
rápido que a habilidade de analisar
esses dados.
• Novos tipos de dados não
conseguem ser analisados no
mesmo contexto de um DW
• Alguns cenários de usuários e
aplicações precisam de uma
ingestão de dados e resultados de
maneira mais rápida
© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
What do the analysts say?
https://www.promptcloud.com
https://john-popelaars.blogspot.com
https://ww.signiant.com
https://www.linkedin.com/pulse/world-today-data-rich-information-poor-guru-p-mohapatra-pmp/
© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Sources:
Gartner: User Survey Analysis: Key Trends Shaping the Future of Data Center Infrastructure Through 2011
IDC: Worldwide Business Analytics Software 2012–2016 Forecast and 2011 Vendor Shares
Legacy Architecture Models Lead to Dark Data
Traditional data warehouses cannot keep pace with data growth
1990 2000 2010 2020
DataVolume
All Data Analyzed Data
Dark Data
is not available
for analysis
Data Lakes na AWS
Analytics
• Incomparável durabilidade, e disponibilidade na escala de EB
• Melhor capacidade de segurança, conformidade regulatória e
auditoria
• Controle granular de acesso ao nível de objeto
• Performance mais rápida recuperando subconjunto de dados
• Muitas maneiras de trazer os dados
• 2x mais integrações com parceiros
• Análise com um amplo conjunto de serviços
Machine
learning
Dados
Real-time
Dados
On-premises
Data Lake
na AWS
Data Lakes na AWS
Analytics
• Incomparável durabilidade, e disponibilidade na escala de EB
• Melhor capacidade de segurança, conformidade regulatória e
auditoria
• Controle granular de acesso ao nível de objeto
• Performance mais rápida recuperando subconjunto de dados
• Muitas maneiras de trazer os dados
• 2x mais integrações com parceiros
• Análise com um amplo conjunto de serviços
Machine
learning
Dados
Real-time
Dados
On-premises
S3
Adoção de Datalakes na AWS
Mais de10,000 data lakes na AWS
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Por onde começo o meu Datalake?
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Amplo portifólio para uma variedade de casos de uso
Serviços de migração & streaming de dados
Infraestrutura Catálogo de dados
& ETL
Segurança e
gerenciamento
Dashboards Análises preditivas
Data
warehousing
Processamento
em Big data
Consultas
interativas
Análises
operacionais
Análises em
tempo real
Precessamento de
dados Serverless
Visualização & machine learning
Movimentação de dados
Analytics
Infraestrutura e gerenciamento de data lakes
Movimentação de dados
Analytics
Amplo portifólio para uma variedade de casos de uso
+ 10 more
Amazon
Redshift
Amazon EMR (Spark
& Hadoop)
Amazon
Athena
Amazon
Elasticsearch
Service
Amazon
Kinesis Data
Analytics
AWS Glue (Spark &
Python)
Amazon S3 & Amazon
S3 Glacier
AWS GlueAWS Lake
Formation
Visualização & machine learning
Amazon
QuickSight
Amazon
SageMaker
Amazon
Comprehend
Amazon
Lex
Amazon
Polly
Amazon
Rekognition
Amazon
Translate
Amazon
Transcribe
Deep learning
AMIs
AWS Database Migration Service | AWS Snowball | AWS Snowmobile | Kinesis Data Firehose | Kinesis Data Streams | Managed Streaming for Kafka
Infraestrutura e gerenciamento de data lakes
Source:
https://commons.wikimedia.org/wiki/File:Regras_para_conceder_novas_autorizações_a_taxistas_serão_definidas_por_grupo_de_trabalho_(23132751631).jpg
Uso de Datalakes para planejamento de cidades
Arquitetura Proposta para uma Solução
Dados on-premise
Web app data
Amazon RDS
Outros Banco de
Dados
Streaming data
AMAZON QUICKSIGHTAMAZON SAGEMAKER
AMAZON S3
SIMPLE STORAGE SERVICE
Amazon S3
YOUR-BUCKET-NAME
Tipos de dados para a ingestão
Transacionais
• RDBMS
Arquivos
• Click-stream logs
• Texto livre
Stream
• IoT devices
• Tweets
Database
Cloud
Storage
Stream
Storage
Arquitetura Proposta para uma Solução
Dados on-premise
Web app data
Amazon RDS
Outros Banco de
Dados
Streaming data
AMAZON QUICKSIGHTAMAZON SAGEMAKER
AMAZON KINESIS
REAL TIME DATA STREAMING
Ingestão de dados no Kinesis Firehose
Faremos uma ingestão baseado em dados que estão sendo
coletados de um sistema transacional
aws firehose put-record
--delivery-stream-name STREAM-NAME
--record Data=”2, 2016-01-01 00:00:00, 7.5”
Exemplo de dado enviado
© 2019, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Descobrindo dados com AWS Glue
Dados on-premise
Web app data
Amazon RDS
Outros Banco de
Dados
Streaming data
AMAZON QUICKSIGHTAMAZON SAGEMAKER
Autoria de JobCatálogo de Dados Execução de Job
Compatível Apache Hive Metastore
Integrado com serviços AWS
Crawling automático
Descobrir
Gerar ETL automaticamente
Python and Apache Spark
Edite, debug, e compartilhe
Desenvolver
Execução Serverless
Agendamento flexível
Monitoramento e alarmes
Implantar
AWS Glue
Explorando dados com Amazon Athena
Dados on-premise
Web app data
Amazon RDS
Outros Banco de
Dados
Streaming data
AMAZON QUICKSIGHTAMAZON SAGEMAKER
Amazon Athena
Serviço de consulta interativa que facilita a análise de
dados diretamente do Amazon S3 utilizando SQL padrão
Familiaridade com tecnologias utilizadas
Utilizada para consultas SQL
In-memory distributed query engine
ANSI-SQL compatível com extensões
Utilizado para funcionalidade de DDL
Tipos de Dados complexos
Múltiplos formatos
Suporte a particionamento de dados
Mas eu quero ver dados de forma
amigável?
Explorando dados com Amazon Athena
Dados on-premise
Web app data
Amazon RDS
Outros Banco de
Dados
Streaming data
AMAZON QUICKSIGHTAMAZON SAGEMAKER
AMAZON
QUICKSIGHT
CLOUD-POWERED BUSINESS INTELLIGENCE
Quero visualizar perguntas complexas?
Este trânsito é normal?
Machine Learning com Amazon
Sagemaker
Dados on-premise
Web app data
Amazon RDS
Outros Banco de
Dados
Streaming data
AMAZON QUICKSIGHTAMAZON SAGEMAKER
AMAZON
SAGEMAKER
Habilidade de criar, treinar e implantar modelos de machine
learning
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Amazon SageMaker
1 2 3 4
I I I I
Instâncias Notebook Algoritmos Treinamento Hospedagem do
Serviço
Data Lakes por um Governo cada vez melhor
Analytics
Machine
learning
Dados
Real-time
Dados
On-premises
Data Lake
na AWS
Precisamos de um
governo que seja o nosso
melhor. Inteligente,
eficiente, pragmático e
compassivo.
Deval Laurdine Patrick
Político Americano, advogado de direitos civis
“A AWS permite que nosso time se concentre no core do
problema que estamos resolvendo”
O QEdu é uma empresa de tecnologia
investida pela Fundação Lemann que tem
o propósito de transformar a educação
pública no Brasil por meio de tecnologia,
dados e análises
Atualmente servimos nossos clientes por
meio de uma plataforma web para
visualização de dados
INSERIR LOGO
Com AWS sabemos que
podemos sonhar
grande e que teremos
todo o apoio para escalar
nosso sonho de garantir o
aprendizado
adequado para todos
os alunos do Brasil”
[César Wedemann, CEO]
Data Lake para Educação do País INSERIR LOGO
MuitoObrigado
© 2019, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Mv – Marcus Ferreira
Arquiteto de Soluções para Governo, Saúde e Educação
mvferr@amazon.com

Mais conteúdo relacionado

Mais procurados

A Cultura de Inovação na Amazon: Impulsionando o Sucesso com os Clientes
A Cultura de Inovação na Amazon: Impulsionando o Sucesso com os ClientesA Cultura de Inovação na Amazon: Impulsionando o Sucesso com os Clientes
A Cultura de Inovação na Amazon: Impulsionando o Sucesso com os Clientes
Amazon Web Services LATAM
 
Threat detection and mitigation at AWS - SEC301 - São Paulo AWS Summit
Threat detection and mitigation at AWS - SEC301 - São Paulo AWS SummitThreat detection and mitigation at AWS - SEC301 - São Paulo AWS Summit
Threat detection and mitigation at AWS - SEC301 - São Paulo AWS Summit
Amazon Web Services
 
Webinar: Ask the Experts - Big Data (Português)
Webinar: Ask the Experts - Big Data (Português)Webinar: Ask the Experts - Big Data (Português)
Webinar: Ask the Experts - Big Data (Português)
Amazon Web Services LATAM
 
Os Principais Mitos sobre a Segurança da Nuvem - Desmitificados!
Os Principais Mitos sobre a Segurança da Nuvem - Desmitificados! Os Principais Mitos sobre a Segurança da Nuvem - Desmitificados!
Os Principais Mitos sobre a Segurança da Nuvem - Desmitificados!
Amazon Web Services LATAM
 
Building Internet-of-Things (IoT) applications for a connected home - SVC205 ...
Building Internet-of-Things (IoT) applications for a connected home - SVC205 ...Building Internet-of-Things (IoT) applications for a connected home - SVC205 ...
Building Internet-of-Things (IoT) applications for a connected home - SVC205 ...
Amazon Web Services
 
Recomendações para Contratação de Nuvem -PT-BR+Jul-2020.pdf
Recomendações para Contratação de Nuvem -PT-BR+Jul-2020.pdfRecomendações para Contratação de Nuvem -PT-BR+Jul-2020.pdf
Recomendações para Contratação de Nuvem -PT-BR+Jul-2020.pdf
Amazon Web Services LATAM
 
Drive digital transformation with artificial intelligence - AIM204 - São Paul...
Drive digital transformation with artificial intelligence - AIM204 - São Paul...Drive digital transformation with artificial intelligence - AIM204 - São Paul...
Drive digital transformation with artificial intelligence - AIM204 - São Paul...
Amazon Web Services
 
Usando Containers e Serverless para acelerar o desenvolvimento de aplicações ...
Usando Containers e Serverless para acelerar o desenvolvimento de aplicações ...Usando Containers e Serverless para acelerar o desenvolvimento de aplicações ...
Usando Containers e Serverless para acelerar o desenvolvimento de aplicações ...
Amazon Web Services LATAM
 
AWS Webinar Series Brasil: AWS AI/ML Hands-on Workshop
AWS Webinar Series Brasil: AWS AI/ML Hands-on WorkshopAWS Webinar Series Brasil: AWS AI/ML Hands-on Workshop
AWS Webinar Series Brasil: AWS AI/ML Hands-on Workshop
Amazon Web Services LATAM
 
Webinar - An Introduction to Building and Optimizing a Hybrid Cloud on AWS.pptx
Webinar - An Introduction to Building and Optimizing a Hybrid Cloud on AWS.pptxWebinar - An Introduction to Building and Optimizing a Hybrid Cloud on AWS.pptx
Webinar - An Introduction to Building and Optimizing a Hybrid Cloud on AWS.pptx
Amazon Web Services LATAM
 
AWS Webinar Series Brasil: Inteligência Artificial em Serviços Financeiros
AWS Webinar Series Brasil: Inteligência Artificial em Serviços FinanceirosAWS Webinar Series Brasil: Inteligência Artificial em Serviços Financeiros
AWS Webinar Series Brasil: Inteligência Artificial em Serviços Financeiros
Amazon Web Services LATAM
 
Databases on AWS- Using the right tool for the job - ADB203 - São Paulo AWS S...
Databases on AWS- Using the right tool for the job - ADB203 - São Paulo AWS S...Databases on AWS- Using the right tool for the job - ADB203 - São Paulo AWS S...
Databases on AWS- Using the right tool for the job - ADB203 - São Paulo AWS S...
Amazon Web Services
 
Cost-management journey- Where did Nubank start - CMP202 - São Paulo AWS Summit
Cost-management journey- Where did Nubank start - CMP202 - São Paulo AWS SummitCost-management journey- Where did Nubank start - CMP202 - São Paulo AWS Summit
Cost-management journey- Where did Nubank start - CMP202 - São Paulo AWS Summit
Amazon Web Services
 
IA/ML para análise de fraude e gerenciamento de riscos
IA/ML para análise de fraude e gerenciamento de riscosIA/ML para análise de fraude e gerenciamento de riscos
IA/ML para análise de fraude e gerenciamento de riscos
Amazon Web Services LATAM
 
O Impacto de uma Cultura Cloud na Adoção de Computação em Nuvem - ENT201 - S...
O Impacto de uma Cultura Cloud na Adoção de Computação em Nuvem -  ENT201 - S...O Impacto de uma Cultura Cloud na Adoção de Computação em Nuvem -  ENT201 - S...
O Impacto de uma Cultura Cloud na Adoção de Computação em Nuvem - ENT201 - S...
Amazon Web Services
 
Build sophisticated forecasting and recommendation models - AIM203 - São Paul...
Build sophisticated forecasting and recommendation models - AIM203 - São Paul...Build sophisticated forecasting and recommendation models - AIM203 - São Paul...
Build sophisticated forecasting and recommendation models - AIM203 - São Paul...
Amazon Web Services
 
AWS Initiate Brasil 2021 - Segurança e Privacidade de Dados - Ernesto dos San...
AWS Initiate Brasil 2021 - Segurança e Privacidade de Dados - Ernesto dos San...AWS Initiate Brasil 2021 - Segurança e Privacidade de Dados - Ernesto dos San...
AWS Initiate Brasil 2021 - Segurança e Privacidade de Dados - Ernesto dos San...
Amazon Web Services LATAM
 
Melhorando resultados educacionais com AIML
Melhorando resultados educacionais com AIMLMelhorando resultados educacionais com AIML
Melhorando resultados educacionais com AIML
Amazon Web Services LATAM
 
Twelve-Factor serverless applications - MAD302 - São Paulo AWS Summit
Twelve-Factor serverless applications - MAD302 - São Paulo AWS SummitTwelve-Factor serverless applications - MAD302 - São Paulo AWS Summit
Twelve-Factor serverless applications - MAD302 - São Paulo AWS Summit
Amazon Web Services
 
IA/ML melhorando a saúde pública
IA/ML melhorando a saúde públicaIA/ML melhorando a saúde pública
IA/ML melhorando a saúde pública
Amazon Web Services LATAM
 

Mais procurados (20)

A Cultura de Inovação na Amazon: Impulsionando o Sucesso com os Clientes
A Cultura de Inovação na Amazon: Impulsionando o Sucesso com os ClientesA Cultura de Inovação na Amazon: Impulsionando o Sucesso com os Clientes
A Cultura de Inovação na Amazon: Impulsionando o Sucesso com os Clientes
 
Threat detection and mitigation at AWS - SEC301 - São Paulo AWS Summit
Threat detection and mitigation at AWS - SEC301 - São Paulo AWS SummitThreat detection and mitigation at AWS - SEC301 - São Paulo AWS Summit
Threat detection and mitigation at AWS - SEC301 - São Paulo AWS Summit
 
Webinar: Ask the Experts - Big Data (Português)
Webinar: Ask the Experts - Big Data (Português)Webinar: Ask the Experts - Big Data (Português)
Webinar: Ask the Experts - Big Data (Português)
 
Os Principais Mitos sobre a Segurança da Nuvem - Desmitificados!
Os Principais Mitos sobre a Segurança da Nuvem - Desmitificados! Os Principais Mitos sobre a Segurança da Nuvem - Desmitificados!
Os Principais Mitos sobre a Segurança da Nuvem - Desmitificados!
 
Building Internet-of-Things (IoT) applications for a connected home - SVC205 ...
Building Internet-of-Things (IoT) applications for a connected home - SVC205 ...Building Internet-of-Things (IoT) applications for a connected home - SVC205 ...
Building Internet-of-Things (IoT) applications for a connected home - SVC205 ...
 
Recomendações para Contratação de Nuvem -PT-BR+Jul-2020.pdf
Recomendações para Contratação de Nuvem -PT-BR+Jul-2020.pdfRecomendações para Contratação de Nuvem -PT-BR+Jul-2020.pdf
Recomendações para Contratação de Nuvem -PT-BR+Jul-2020.pdf
 
Drive digital transformation with artificial intelligence - AIM204 - São Paul...
Drive digital transformation with artificial intelligence - AIM204 - São Paul...Drive digital transformation with artificial intelligence - AIM204 - São Paul...
Drive digital transformation with artificial intelligence - AIM204 - São Paul...
 
Usando Containers e Serverless para acelerar o desenvolvimento de aplicações ...
Usando Containers e Serverless para acelerar o desenvolvimento de aplicações ...Usando Containers e Serverless para acelerar o desenvolvimento de aplicações ...
Usando Containers e Serverless para acelerar o desenvolvimento de aplicações ...
 
AWS Webinar Series Brasil: AWS AI/ML Hands-on Workshop
AWS Webinar Series Brasil: AWS AI/ML Hands-on WorkshopAWS Webinar Series Brasil: AWS AI/ML Hands-on Workshop
AWS Webinar Series Brasil: AWS AI/ML Hands-on Workshop
 
Webinar - An Introduction to Building and Optimizing a Hybrid Cloud on AWS.pptx
Webinar - An Introduction to Building and Optimizing a Hybrid Cloud on AWS.pptxWebinar - An Introduction to Building and Optimizing a Hybrid Cloud on AWS.pptx
Webinar - An Introduction to Building and Optimizing a Hybrid Cloud on AWS.pptx
 
AWS Webinar Series Brasil: Inteligência Artificial em Serviços Financeiros
AWS Webinar Series Brasil: Inteligência Artificial em Serviços FinanceirosAWS Webinar Series Brasil: Inteligência Artificial em Serviços Financeiros
AWS Webinar Series Brasil: Inteligência Artificial em Serviços Financeiros
 
Databases on AWS- Using the right tool for the job - ADB203 - São Paulo AWS S...
Databases on AWS- Using the right tool for the job - ADB203 - São Paulo AWS S...Databases on AWS- Using the right tool for the job - ADB203 - São Paulo AWS S...
Databases on AWS- Using the right tool for the job - ADB203 - São Paulo AWS S...
 
Cost-management journey- Where did Nubank start - CMP202 - São Paulo AWS Summit
Cost-management journey- Where did Nubank start - CMP202 - São Paulo AWS SummitCost-management journey- Where did Nubank start - CMP202 - São Paulo AWS Summit
Cost-management journey- Where did Nubank start - CMP202 - São Paulo AWS Summit
 
IA/ML para análise de fraude e gerenciamento de riscos
IA/ML para análise de fraude e gerenciamento de riscosIA/ML para análise de fraude e gerenciamento de riscos
IA/ML para análise de fraude e gerenciamento de riscos
 
O Impacto de uma Cultura Cloud na Adoção de Computação em Nuvem - ENT201 - S...
O Impacto de uma Cultura Cloud na Adoção de Computação em Nuvem -  ENT201 - S...O Impacto de uma Cultura Cloud na Adoção de Computação em Nuvem -  ENT201 - S...
O Impacto de uma Cultura Cloud na Adoção de Computação em Nuvem - ENT201 - S...
 
Build sophisticated forecasting and recommendation models - AIM203 - São Paul...
Build sophisticated forecasting and recommendation models - AIM203 - São Paul...Build sophisticated forecasting and recommendation models - AIM203 - São Paul...
Build sophisticated forecasting and recommendation models - AIM203 - São Paul...
 
AWS Initiate Brasil 2021 - Segurança e Privacidade de Dados - Ernesto dos San...
AWS Initiate Brasil 2021 - Segurança e Privacidade de Dados - Ernesto dos San...AWS Initiate Brasil 2021 - Segurança e Privacidade de Dados - Ernesto dos San...
AWS Initiate Brasil 2021 - Segurança e Privacidade de Dados - Ernesto dos San...
 
Melhorando resultados educacionais com AIML
Melhorando resultados educacionais com AIMLMelhorando resultados educacionais com AIML
Melhorando resultados educacionais com AIML
 
Twelve-Factor serverless applications - MAD302 - São Paulo AWS Summit
Twelve-Factor serverless applications - MAD302 - São Paulo AWS SummitTwelve-Factor serverless applications - MAD302 - São Paulo AWS Summit
Twelve-Factor serverless applications - MAD302 - São Paulo AWS Summit
 
IA/ML melhorando a saúde pública
IA/ML melhorando a saúde públicaIA/ML melhorando a saúde pública
IA/ML melhorando a saúde pública
 

Semelhante a AWS Initiate - Construindo Data Lakes e Analytics com AWS

Data Lakes - EBC on the road Brazil Edition [Portuguese]
Data Lakes - EBC on the road Brazil Edition [Portuguese]Data Lakes - EBC on the road Brazil Edition [Portuguese]
Data Lakes - EBC on the road Brazil Edition [Portuguese]
Amazon Web Services
 
Construindo Data Lakes e Analytics na AWS - BDA301 - Sao Paulo Summit
Construindo Data Lakes e Analytics na AWS -  BDA301 - Sao Paulo SummitConstruindo Data Lakes e Analytics na AWS -  BDA301 - Sao Paulo Summit
Construindo Data Lakes e Analytics na AWS - BDA301 - Sao Paulo Summit
Amazon Web Services
 
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
Amazon Web Services LATAM
 
Aplicando uma Estratégia de Banco de Dados AWS Personalizada: Encontre o Banc...
Aplicando uma Estratégia de Banco de Dados AWS Personalizada: Encontre o Banc...Aplicando uma Estratégia de Banco de Dados AWS Personalizada: Encontre o Banc...
Aplicando uma Estratégia de Banco de Dados AWS Personalizada: Encontre o Banc...
Amazon Web Services
 
É Tudo sobre Dados - ARC202 - Sao Paulo Summit
É Tudo sobre Dados -  ARC202 - Sao Paulo SummitÉ Tudo sobre Dados -  ARC202 - Sao Paulo Summit
É Tudo sobre Dados - ARC202 - Sao Paulo Summit
Amazon Web Services
 
Sessão Avançada: Construindo um Data Warehouse Moderno com Amazon Redshift - ...
Sessão Avançada: Construindo um Data Warehouse Moderno com Amazon Redshift - ...Sessão Avançada: Construindo um Data Warehouse Moderno com Amazon Redshift - ...
Sessão Avançada: Construindo um Data Warehouse Moderno com Amazon Redshift - ...
Amazon Web Services
 
Construindo um Data Warehouse moderno com Amazon Redshift
Construindo um Data Warehouse moderno com Amazon RedshiftConstruindo um Data Warehouse moderno com Amazon Redshift
Construindo um Data Warehouse moderno com Amazon Redshift
Amazon Web Services LATAM
 
Construindo um Data Lake na AWS
Construindo um Data Lake na AWSConstruindo um Data Lake na AWS
Construindo um Data Lake na AWS
Amazon Web Services LATAM
 
Construindo um data lake na nuvem aws
Construindo um data lake na nuvem awsConstruindo um data lake na nuvem aws
Construindo um data lake na nuvem aws
Amazon Web Services LATAM
 
Construindo Data Lakes e Analytics na AWS
Construindo Data Lakes e Analytics na AWSConstruindo Data Lakes e Analytics na AWS
Construindo Data Lakes e Analytics na AWS
Amazon Web Services LATAM
 
AWS Innovate 2020 - Entenda como o Data Flywheel pode apoiá-lo em sua estraté...
AWS Innovate 2020 - Entenda como o Data Flywheel pode apoiá-lo em sua estraté...AWS Innovate 2020 - Entenda como o Data Flywheel pode apoiá-lo em sua estraté...
AWS Innovate 2020 - Entenda como o Data Flywheel pode apoiá-lo em sua estraté...
Amazon Web Services LATAM
 
Tendências de Big Data
Tendências de Big DataTendências de Big Data
Tendências de Big Data
Amazon Web Services LATAM
 
Tendências de Big Data
Tendências de Big DataTendências de Big Data
Tendências de Big Data
Amazon Web Services LATAM
 
Liberte-se dos bancos de dados comerciais para economizar, crescer e inovar
Liberte-se dos bancos de dados comerciais para economizar, crescer e inovarLiberte-se dos bancos de dados comerciais para economizar, crescer e inovar
Liberte-se dos bancos de dados comerciais para economizar, crescer e inovar
Amazon Web Services LATAM
 
Tendências de Big Data
Tendências de Big DataTendências de Big Data
Tendências de Big Data
Amazon Web Services LATAM
 
Encontre o Banco de Dados certo para sua Carga de Trabalho
Encontre o Banco de Dados certo para sua Carga de TrabalhoEncontre o Banco de Dados certo para sua Carga de Trabalho
Encontre o Banco de Dados certo para sua Carga de Trabalho
Amazon Web Services LATAM
 
Path to the Future #1 - Tendências de Big Data
Path to the Future #1 - Tendências de Big DataPath to the Future #1 - Tendências de Big Data
Path to the Future #1 - Tendências de Big Data
Amazon Web Services LATAM
 
Performing real-time ETL into data lakes - ADB202 - São Paulo AWS Summit
Performing real-time ETL into data lakes - ADB202 - São Paulo AWS SummitPerforming real-time ETL into data lakes - ADB202 - São Paulo AWS Summit
Performing real-time ETL into data lakes - ADB202 - São Paulo AWS Summit
Amazon Web Services
 
Big Data na Nuvem
Big Data na NuvemBig Data na Nuvem
Big Data na Nuvem
Amazon Web Services LATAM
 
Secure your data lake- A Financial industry perspective - SVC203 - São Paulo ...
Secure your data lake- A Financial industry perspective - SVC203 - São Paulo ...Secure your data lake- A Financial industry perspective - SVC203 - São Paulo ...
Secure your data lake- A Financial industry perspective - SVC203 - São Paulo ...
Amazon Web Services
 

Semelhante a AWS Initiate - Construindo Data Lakes e Analytics com AWS (20)

Data Lakes - EBC on the road Brazil Edition [Portuguese]
Data Lakes - EBC on the road Brazil Edition [Portuguese]Data Lakes - EBC on the road Brazil Edition [Portuguese]
Data Lakes - EBC on the road Brazil Edition [Portuguese]
 
Construindo Data Lakes e Analytics na AWS - BDA301 - Sao Paulo Summit
Construindo Data Lakes e Analytics na AWS -  BDA301 - Sao Paulo SummitConstruindo Data Lakes e Analytics na AWS -  BDA301 - Sao Paulo Summit
Construindo Data Lakes e Analytics na AWS - BDA301 - Sao Paulo Summit
 
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
 
Aplicando uma Estratégia de Banco de Dados AWS Personalizada: Encontre o Banc...
Aplicando uma Estratégia de Banco de Dados AWS Personalizada: Encontre o Banc...Aplicando uma Estratégia de Banco de Dados AWS Personalizada: Encontre o Banc...
Aplicando uma Estratégia de Banco de Dados AWS Personalizada: Encontre o Banc...
 
É Tudo sobre Dados - ARC202 - Sao Paulo Summit
É Tudo sobre Dados -  ARC202 - Sao Paulo SummitÉ Tudo sobre Dados -  ARC202 - Sao Paulo Summit
É Tudo sobre Dados - ARC202 - Sao Paulo Summit
 
Sessão Avançada: Construindo um Data Warehouse Moderno com Amazon Redshift - ...
Sessão Avançada: Construindo um Data Warehouse Moderno com Amazon Redshift - ...Sessão Avançada: Construindo um Data Warehouse Moderno com Amazon Redshift - ...
Sessão Avançada: Construindo um Data Warehouse Moderno com Amazon Redshift - ...
 
Construindo um Data Warehouse moderno com Amazon Redshift
Construindo um Data Warehouse moderno com Amazon RedshiftConstruindo um Data Warehouse moderno com Amazon Redshift
Construindo um Data Warehouse moderno com Amazon Redshift
 
Construindo um Data Lake na AWS
Construindo um Data Lake na AWSConstruindo um Data Lake na AWS
Construindo um Data Lake na AWS
 
Construindo um data lake na nuvem aws
Construindo um data lake na nuvem awsConstruindo um data lake na nuvem aws
Construindo um data lake na nuvem aws
 
Construindo Data Lakes e Analytics na AWS
Construindo Data Lakes e Analytics na AWSConstruindo Data Lakes e Analytics na AWS
Construindo Data Lakes e Analytics na AWS
 
AWS Innovate 2020 - Entenda como o Data Flywheel pode apoiá-lo em sua estraté...
AWS Innovate 2020 - Entenda como o Data Flywheel pode apoiá-lo em sua estraté...AWS Innovate 2020 - Entenda como o Data Flywheel pode apoiá-lo em sua estraté...
AWS Innovate 2020 - Entenda como o Data Flywheel pode apoiá-lo em sua estraté...
 
Tendências de Big Data
Tendências de Big DataTendências de Big Data
Tendências de Big Data
 
Tendências de Big Data
Tendências de Big DataTendências de Big Data
Tendências de Big Data
 
Liberte-se dos bancos de dados comerciais para economizar, crescer e inovar
Liberte-se dos bancos de dados comerciais para economizar, crescer e inovarLiberte-se dos bancos de dados comerciais para economizar, crescer e inovar
Liberte-se dos bancos de dados comerciais para economizar, crescer e inovar
 
Tendências de Big Data
Tendências de Big DataTendências de Big Data
Tendências de Big Data
 
Encontre o Banco de Dados certo para sua Carga de Trabalho
Encontre o Banco de Dados certo para sua Carga de TrabalhoEncontre o Banco de Dados certo para sua Carga de Trabalho
Encontre o Banco de Dados certo para sua Carga de Trabalho
 
Path to the Future #1 - Tendências de Big Data
Path to the Future #1 - Tendências de Big DataPath to the Future #1 - Tendências de Big Data
Path to the Future #1 - Tendências de Big Data
 
Performing real-time ETL into data lakes - ADB202 - São Paulo AWS Summit
Performing real-time ETL into data lakes - ADB202 - São Paulo AWS SummitPerforming real-time ETL into data lakes - ADB202 - São Paulo AWS Summit
Performing real-time ETL into data lakes - ADB202 - São Paulo AWS Summit
 
Big Data na Nuvem
Big Data na NuvemBig Data na Nuvem
Big Data na Nuvem
 
Secure your data lake- A Financial industry perspective - SVC203 - São Paulo ...
Secure your data lake- A Financial industry perspective - SVC203 - São Paulo ...Secure your data lake- A Financial industry perspective - SVC203 - São Paulo ...
Secure your data lake- A Financial industry perspective - SVC203 - São Paulo ...
 

Mais de Amazon Web Services LATAM

AWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvemAWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvem
Amazon Web Services LATAM
 
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e BackupAWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
Amazon Web Services LATAM
 
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
Amazon Web Services LATAM
 
AWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvemAWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvem
Amazon Web Services LATAM
 
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e BackupAWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
Amazon Web Services LATAM
 
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
Amazon Web Services LATAM
 
Automatice el proceso de entrega con CI/CD en AWS
Automatice el proceso de entrega con CI/CD en AWSAutomatice el proceso de entrega con CI/CD en AWS
Automatice el proceso de entrega con CI/CD en AWS
Amazon Web Services LATAM
 
Automatize seu processo de entrega de software com CI/CD na AWS
Automatize seu processo de entrega de software com CI/CD na AWSAutomatize seu processo de entrega de software com CI/CD na AWS
Automatize seu processo de entrega de software com CI/CD na AWS
Amazon Web Services LATAM
 
Cómo empezar con Amazon EKS
Cómo empezar con Amazon EKSCómo empezar con Amazon EKS
Cómo empezar con Amazon EKS
Amazon Web Services LATAM
 
Como começar com Amazon EKS
Como começar com Amazon EKSComo começar com Amazon EKS
Como começar com Amazon EKS
Amazon Web Services LATAM
 
Ransomware: como recuperar os seus dados na nuvem AWS
Ransomware: como recuperar os seus dados na nuvem AWSRansomware: como recuperar os seus dados na nuvem AWS
Ransomware: como recuperar os seus dados na nuvem AWS
Amazon Web Services LATAM
 
Ransomware: cómo recuperar sus datos en la nube de AWS
Ransomware: cómo recuperar sus datos en la nube de AWSRansomware: cómo recuperar sus datos en la nube de AWS
Ransomware: cómo recuperar sus datos en la nube de AWS
Amazon Web Services LATAM
 
Ransomware: Estratégias de Mitigação
Ransomware: Estratégias de MitigaçãoRansomware: Estratégias de Mitigação
Ransomware: Estratégias de Mitigação
Amazon Web Services LATAM
 
Ransomware: Estratégias de Mitigación
Ransomware: Estratégias de MitigaciónRansomware: Estratégias de Mitigación
Ransomware: Estratégias de Mitigación
Amazon Web Services LATAM
 
Aprenda a migrar y transferir datos al usar la nube de AWS
Aprenda a migrar y transferir datos al usar la nube de AWSAprenda a migrar y transferir datos al usar la nube de AWS
Aprenda a migrar y transferir datos al usar la nube de AWS
Amazon Web Services LATAM
 
Aprenda como migrar e transferir dados ao utilizar a nuvem da AWS
Aprenda como migrar e transferir dados ao utilizar a nuvem da AWSAprenda como migrar e transferir dados ao utilizar a nuvem da AWS
Aprenda como migrar e transferir dados ao utilizar a nuvem da AWS
Amazon Web Services LATAM
 
Cómo mover a un almacenamiento de archivos administrados
Cómo mover a un almacenamiento de archivos administradosCómo mover a un almacenamiento de archivos administrados
Cómo mover a un almacenamiento de archivos administrados
Amazon Web Services LATAM
 
Simplifique su BI con AWS
Simplifique su BI con AWSSimplifique su BI con AWS
Simplifique su BI con AWS
Amazon Web Services LATAM
 
Simplifique o seu BI com a AWS
Simplifique o seu BI com a AWSSimplifique o seu BI com a AWS
Simplifique o seu BI com a AWS
Amazon Web Services LATAM
 
Os benefícios de migrar seus workloads de Big Data para a AWS
Os benefícios de migrar seus workloads de Big Data para a AWSOs benefícios de migrar seus workloads de Big Data para a AWS
Os benefícios de migrar seus workloads de Big Data para a AWS
Amazon Web Services LATAM
 

Mais de Amazon Web Services LATAM (20)

AWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvemAWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvem
 
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e BackupAWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
 
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
 
AWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvemAWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvem
 
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e BackupAWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
 
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
 
Automatice el proceso de entrega con CI/CD en AWS
Automatice el proceso de entrega con CI/CD en AWSAutomatice el proceso de entrega con CI/CD en AWS
Automatice el proceso de entrega con CI/CD en AWS
 
Automatize seu processo de entrega de software com CI/CD na AWS
Automatize seu processo de entrega de software com CI/CD na AWSAutomatize seu processo de entrega de software com CI/CD na AWS
Automatize seu processo de entrega de software com CI/CD na AWS
 
Cómo empezar con Amazon EKS
Cómo empezar con Amazon EKSCómo empezar con Amazon EKS
Cómo empezar con Amazon EKS
 
Como começar com Amazon EKS
Como começar com Amazon EKSComo começar com Amazon EKS
Como começar com Amazon EKS
 
Ransomware: como recuperar os seus dados na nuvem AWS
Ransomware: como recuperar os seus dados na nuvem AWSRansomware: como recuperar os seus dados na nuvem AWS
Ransomware: como recuperar os seus dados na nuvem AWS
 
Ransomware: cómo recuperar sus datos en la nube de AWS
Ransomware: cómo recuperar sus datos en la nube de AWSRansomware: cómo recuperar sus datos en la nube de AWS
Ransomware: cómo recuperar sus datos en la nube de AWS
 
Ransomware: Estratégias de Mitigação
Ransomware: Estratégias de MitigaçãoRansomware: Estratégias de Mitigação
Ransomware: Estratégias de Mitigação
 
Ransomware: Estratégias de Mitigación
Ransomware: Estratégias de MitigaciónRansomware: Estratégias de Mitigación
Ransomware: Estratégias de Mitigación
 
Aprenda a migrar y transferir datos al usar la nube de AWS
Aprenda a migrar y transferir datos al usar la nube de AWSAprenda a migrar y transferir datos al usar la nube de AWS
Aprenda a migrar y transferir datos al usar la nube de AWS
 
Aprenda como migrar e transferir dados ao utilizar a nuvem da AWS
Aprenda como migrar e transferir dados ao utilizar a nuvem da AWSAprenda como migrar e transferir dados ao utilizar a nuvem da AWS
Aprenda como migrar e transferir dados ao utilizar a nuvem da AWS
 
Cómo mover a un almacenamiento de archivos administrados
Cómo mover a un almacenamiento de archivos administradosCómo mover a un almacenamiento de archivos administrados
Cómo mover a un almacenamiento de archivos administrados
 
Simplifique su BI con AWS
Simplifique su BI con AWSSimplifique su BI con AWS
Simplifique su BI con AWS
 
Simplifique o seu BI com a AWS
Simplifique o seu BI com a AWSSimplifique o seu BI com a AWS
Simplifique o seu BI com a AWS
 
Os benefícios de migrar seus workloads de Big Data para a AWS
Os benefícios de migrar seus workloads de Big Data para a AWSOs benefícios de migrar seus workloads de Big Data para a AWS
Os benefícios de migrar seus workloads de Big Data para a AWS
 

Último

Logica de Progamacao - Aula (1) (1).pptx
Logica de Progamacao - Aula (1) (1).pptxLogica de Progamacao - Aula (1) (1).pptx
Logica de Progamacao - Aula (1) (1).pptx
Momento da Informática
 
Certificado Jornada Python Da Hashtag.pdf
Certificado Jornada Python Da Hashtag.pdfCertificado Jornada Python Da Hashtag.pdf
Certificado Jornada Python Da Hashtag.pdf
joaovmp3
 
Manual-de-Credenciamento ANATER 2023.pdf
Manual-de-Credenciamento ANATER 2023.pdfManual-de-Credenciamento ANATER 2023.pdf
Manual-de-Credenciamento ANATER 2023.pdf
WELITONNOGUEIRA3
 
DESENVOLVIMENTO DE SOFTWARE I_aula1-2.pdf
DESENVOLVIMENTO DE SOFTWARE I_aula1-2.pdfDESENVOLVIMENTO DE SOFTWARE I_aula1-2.pdf
DESENVOLVIMENTO DE SOFTWARE I_aula1-2.pdf
Momento da Informática
 
Segurança Digital Pessoal e Boas Práticas
Segurança Digital Pessoal e Boas PráticasSegurança Digital Pessoal e Boas Práticas
Segurança Digital Pessoal e Boas Práticas
Danilo Pinotti
 
TOO - TÉCNICAS DE ORIENTAÇÃO A OBJETOS aula 1.pdf
TOO - TÉCNICAS DE ORIENTAÇÃO A OBJETOS aula 1.pdfTOO - TÉCNICAS DE ORIENTAÇÃO A OBJETOS aula 1.pdf
TOO - TÉCNICAS DE ORIENTAÇÃO A OBJETOS aula 1.pdf
Momento da Informática
 
História da Rádio- 1936-1970 século XIX .2.pptx
História da Rádio- 1936-1970 século XIX   .2.pptxHistória da Rádio- 1936-1970 século XIX   .2.pptx
História da Rádio- 1936-1970 século XIX .2.pptx
TomasSousa7
 
PRODUÇÃO E CONSUMO DE ENERGIA DA PRÉ-HISTÓRIA À ERA CONTEMPORÂNEA E SUA EVOLU...
PRODUÇÃO E CONSUMO DE ENERGIA DA PRÉ-HISTÓRIA À ERA CONTEMPORÂNEA E SUA EVOLU...PRODUÇÃO E CONSUMO DE ENERGIA DA PRÉ-HISTÓRIA À ERA CONTEMPORÂNEA E SUA EVOLU...
PRODUÇÃO E CONSUMO DE ENERGIA DA PRÉ-HISTÓRIA À ERA CONTEMPORÂNEA E SUA EVOLU...
Faga1939
 

Último (8)

Logica de Progamacao - Aula (1) (1).pptx
Logica de Progamacao - Aula (1) (1).pptxLogica de Progamacao - Aula (1) (1).pptx
Logica de Progamacao - Aula (1) (1).pptx
 
Certificado Jornada Python Da Hashtag.pdf
Certificado Jornada Python Da Hashtag.pdfCertificado Jornada Python Da Hashtag.pdf
Certificado Jornada Python Da Hashtag.pdf
 
Manual-de-Credenciamento ANATER 2023.pdf
Manual-de-Credenciamento ANATER 2023.pdfManual-de-Credenciamento ANATER 2023.pdf
Manual-de-Credenciamento ANATER 2023.pdf
 
DESENVOLVIMENTO DE SOFTWARE I_aula1-2.pdf
DESENVOLVIMENTO DE SOFTWARE I_aula1-2.pdfDESENVOLVIMENTO DE SOFTWARE I_aula1-2.pdf
DESENVOLVIMENTO DE SOFTWARE I_aula1-2.pdf
 
Segurança Digital Pessoal e Boas Práticas
Segurança Digital Pessoal e Boas PráticasSegurança Digital Pessoal e Boas Práticas
Segurança Digital Pessoal e Boas Práticas
 
TOO - TÉCNICAS DE ORIENTAÇÃO A OBJETOS aula 1.pdf
TOO - TÉCNICAS DE ORIENTAÇÃO A OBJETOS aula 1.pdfTOO - TÉCNICAS DE ORIENTAÇÃO A OBJETOS aula 1.pdf
TOO - TÉCNICAS DE ORIENTAÇÃO A OBJETOS aula 1.pdf
 
História da Rádio- 1936-1970 século XIX .2.pptx
História da Rádio- 1936-1970 século XIX   .2.pptxHistória da Rádio- 1936-1970 século XIX   .2.pptx
História da Rádio- 1936-1970 século XIX .2.pptx
 
PRODUÇÃO E CONSUMO DE ENERGIA DA PRÉ-HISTÓRIA À ERA CONTEMPORÂNEA E SUA EVOLU...
PRODUÇÃO E CONSUMO DE ENERGIA DA PRÉ-HISTÓRIA À ERA CONTEMPORÂNEA E SUA EVOLU...PRODUÇÃO E CONSUMO DE ENERGIA DA PRÉ-HISTÓRIA À ERA CONTEMPORÂNEA E SUA EVOLU...
PRODUÇÃO E CONSUMO DE ENERGIA DA PRÉ-HISTÓRIA À ERA CONTEMPORÂNEA E SUA EVOLU...
 

AWS Initiate - Construindo Data Lakes e Analytics com AWS

  • 1.
  • 2. © 2019, Amazon Web Services, Inc. or its affiliates. All rights reserved. Construindo Data Lakes para o Governo Mv – Marcus Ferreira Arquiteto de Soluções para Governo, Saúde e Educação
  • 3.
  • 4. © 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved. The world’s most valuable resource is no longer oil, but data.* “ ” *Copyright:The Economist, 2017, David Parkins
  • 5. Visão Tradicional da Arquitetura Corporativa de Dados OLTP ERP CRM LOB Data warehouse Business intelligence • Dado Relacional • Escala deTBs–PBs • Esquema definido antes do acúmulo de dados • Relatórios Operacionais e ad-hoc
  • 6. Data Lakes estendem a abordagem tradicional Data warehouse Business intelligence OLTP ERP CRM LOB • Dado Relacional e Não Relacional • Escala deTBs–EBs • Motores Analíticos Diversos • Armazenamento de baixo custo & Analytics Dispositivos Web Sensores Social Data lake Processamento Big data, real-time, machine learning
  • 7. © 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved. Dados crescem continuamente • O volume de dados cresce mais rápido que a habilidade de analisar esses dados. • Novos tipos de dados não conseguem ser analisados no mesmo contexto de um DW • Alguns cenários de usuários e aplicações precisam de uma ingestão de dados e resultados de maneira mais rápida
  • 8. © 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved. What do the analysts say? https://www.promptcloud.com https://john-popelaars.blogspot.com https://ww.signiant.com https://www.linkedin.com/pulse/world-today-data-rich-information-poor-guru-p-mohapatra-pmp/
  • 9. © 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved. Sources: Gartner: User Survey Analysis: Key Trends Shaping the Future of Data Center Infrastructure Through 2011 IDC: Worldwide Business Analytics Software 2012–2016 Forecast and 2011 Vendor Shares Legacy Architecture Models Lead to Dark Data Traditional data warehouses cannot keep pace with data growth 1990 2000 2010 2020 DataVolume All Data Analyzed Data Dark Data is not available for analysis
  • 10. Data Lakes na AWS Analytics • Incomparável durabilidade, e disponibilidade na escala de EB • Melhor capacidade de segurança, conformidade regulatória e auditoria • Controle granular de acesso ao nível de objeto • Performance mais rápida recuperando subconjunto de dados • Muitas maneiras de trazer os dados • 2x mais integrações com parceiros • Análise com um amplo conjunto de serviços Machine learning Dados Real-time Dados On-premises Data Lake na AWS
  • 11. Data Lakes na AWS Analytics • Incomparável durabilidade, e disponibilidade na escala de EB • Melhor capacidade de segurança, conformidade regulatória e auditoria • Controle granular de acesso ao nível de objeto • Performance mais rápida recuperando subconjunto de dados • Muitas maneiras de trazer os dados • 2x mais integrações com parceiros • Análise com um amplo conjunto de serviços Machine learning Dados Real-time Dados On-premises S3
  • 12. Adoção de Datalakes na AWS Mais de10,000 data lakes na AWS
  • 13. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Por onde começo o meu Datalake? © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
  • 14. Amplo portifólio para uma variedade de casos de uso Serviços de migração & streaming de dados Infraestrutura Catálogo de dados & ETL Segurança e gerenciamento Dashboards Análises preditivas Data warehousing Processamento em Big data Consultas interativas Análises operacionais Análises em tempo real Precessamento de dados Serverless Visualização & machine learning Movimentação de dados Analytics Infraestrutura e gerenciamento de data lakes
  • 15. Movimentação de dados Analytics Amplo portifólio para uma variedade de casos de uso + 10 more Amazon Redshift Amazon EMR (Spark & Hadoop) Amazon Athena Amazon Elasticsearch Service Amazon Kinesis Data Analytics AWS Glue (Spark & Python) Amazon S3 & Amazon S3 Glacier AWS GlueAWS Lake Formation Visualização & machine learning Amazon QuickSight Amazon SageMaker Amazon Comprehend Amazon Lex Amazon Polly Amazon Rekognition Amazon Translate Amazon Transcribe Deep learning AMIs AWS Database Migration Service | AWS Snowball | AWS Snowmobile | Kinesis Data Firehose | Kinesis Data Streams | Managed Streaming for Kafka Infraestrutura e gerenciamento de data lakes
  • 17. Arquitetura Proposta para uma Solução Dados on-premise Web app data Amazon RDS Outros Banco de Dados Streaming data AMAZON QUICKSIGHTAMAZON SAGEMAKER
  • 20. Tipos de dados para a ingestão Transacionais • RDBMS Arquivos • Click-stream logs • Texto livre Stream • IoT devices • Tweets Database Cloud Storage Stream Storage
  • 21. Arquitetura Proposta para uma Solução Dados on-premise Web app data Amazon RDS Outros Banco de Dados Streaming data AMAZON QUICKSIGHTAMAZON SAGEMAKER
  • 22. AMAZON KINESIS REAL TIME DATA STREAMING
  • 23. Ingestão de dados no Kinesis Firehose Faremos uma ingestão baseado em dados que estão sendo coletados de um sistema transacional aws firehose put-record --delivery-stream-name STREAM-NAME --record Data=”2, 2016-01-01 00:00:00, 7.5”
  • 24. Exemplo de dado enviado
  • 25. © 2019, Amazon Web Services, Inc. or its affiliates. All rights reserved.
  • 26. Descobrindo dados com AWS Glue Dados on-premise Web app data Amazon RDS Outros Banco de Dados Streaming data AMAZON QUICKSIGHTAMAZON SAGEMAKER
  • 27. Autoria de JobCatálogo de Dados Execução de Job Compatível Apache Hive Metastore Integrado com serviços AWS Crawling automático Descobrir Gerar ETL automaticamente Python and Apache Spark Edite, debug, e compartilhe Desenvolver Execução Serverless Agendamento flexível Monitoramento e alarmes Implantar AWS Glue
  • 28. Explorando dados com Amazon Athena Dados on-premise Web app data Amazon RDS Outros Banco de Dados Streaming data AMAZON QUICKSIGHTAMAZON SAGEMAKER
  • 29. Amazon Athena Serviço de consulta interativa que facilita a análise de dados diretamente do Amazon S3 utilizando SQL padrão
  • 30. Familiaridade com tecnologias utilizadas Utilizada para consultas SQL In-memory distributed query engine ANSI-SQL compatível com extensões Utilizado para funcionalidade de DDL Tipos de Dados complexos Múltiplos formatos Suporte a particionamento de dados
  • 31. Mas eu quero ver dados de forma amigável?
  • 32. Explorando dados com Amazon Athena Dados on-premise Web app data Amazon RDS Outros Banco de Dados Streaming data AMAZON QUICKSIGHTAMAZON SAGEMAKER
  • 34.
  • 35. Quero visualizar perguntas complexas? Este trânsito é normal?
  • 36. Machine Learning com Amazon Sagemaker Dados on-premise Web app data Amazon RDS Outros Banco de Dados Streaming data AMAZON QUICKSIGHTAMAZON SAGEMAKER
  • 37. AMAZON SAGEMAKER Habilidade de criar, treinar e implantar modelos de machine learning
  • 38. © 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved. Amazon SageMaker 1 2 3 4 I I I I Instâncias Notebook Algoritmos Treinamento Hospedagem do Serviço
  • 39. Data Lakes por um Governo cada vez melhor Analytics Machine learning Dados Real-time Dados On-premises Data Lake na AWS Precisamos de um governo que seja o nosso melhor. Inteligente, eficiente, pragmático e compassivo. Deval Laurdine Patrick Político Americano, advogado de direitos civis
  • 40. “A AWS permite que nosso time se concentre no core do problema que estamos resolvendo” O QEdu é uma empresa de tecnologia investida pela Fundação Lemann que tem o propósito de transformar a educação pública no Brasil por meio de tecnologia, dados e análises Atualmente servimos nossos clientes por meio de uma plataforma web para visualização de dados INSERIR LOGO Com AWS sabemos que podemos sonhar grande e que teremos todo o apoio para escalar nosso sonho de garantir o aprendizado adequado para todos os alunos do Brasil” [César Wedemann, CEO]
  • 41. Data Lake para Educação do País INSERIR LOGO
  • 42. MuitoObrigado © 2019, Amazon Web Services, Inc. or its affiliates. All rights reserved. Mv – Marcus Ferreira Arquiteto de Soluções para Governo, Saúde e Educação mvferr@amazon.com

Notas do Editor

  1. While I know this is nothing new to you, or nothing new to understand We are on the precipice of a point where a part of an organizations value will be determined by the quality of it’s data, and many are calling the data as the new oil. If data is the new oil, then machine learning is the refinery
  2. Timing: 10 seconds So 7 years later, world agree that data matters. In fact it’s the most important asset for a company. This thought has gone mainstream with The Economist saying it too.
  3. The volume, variety, and velocity of data continues to escalate. Data volumes are growing fast. With on-premises data warehouses, capacity planning needs to occur far in advance of data growth. Once new capacity is purchased, utilization remains low until the data grows. As the data volume approaches capacity, then performance slows, and users become unhappy. Unstructured data is growing even faster than structured data. With the structured nature of a data warehouse, analyzing unstructured data becomes a big challenge. The pace of business continues to accelerate, and business users want analytics results as soon as possible. They don’t want to wait for daily ingest, or longer for new data sources. Also, business applications need to query data in near real-time.
  4. You don’t have to take my word for it… reports on the growth of data are readily available most everywhere you look. Top-Left – growth of unstructured data is vastly outpacing structured data Top-Right – the amount of data will grow 50x between 2010 and 2020 Bottom-Left – We already have PB/day customers. We’re trending towards EB and ZB data sets Bottom-Right – Data from sensors/connected-devices and social media are now described in multiples of the global population
  5. Data is a powerful and pervasive resource – it is everywhere, and it is used in every aspect of your business. including back-office systems of record, systems of insight that inform decision making and systems of engagement that shape customer relationships. However, few organizations have the ability to harness its full potential. The mismatch between “all data” and the subset of data available for analysis has always existed. But as you can see, the gap is widening at an accelerating pace – the vast majority of data is just not available, so it is not analyzed. That means that your business is making decisions based on incomplete data and incomplete analysis.
  6. Create an Amazon S3 bucket to hold the files for Amazon EMR processing, and input files for Amazon Redshift Replace the highlighted value with a globally unique bucket name of your choice
  7. Vamos receber dados de sistemas transacionais baseados em bancos relacionais Vamos receber arquivos de logs com formatação variada Vamos receber textos livre, imagens Vamos receber sinais de dispositivos de IoT Vamos receber streams de dados das redes sociais A próxima questão é que tipo de storage a gente tem que usar
  8. Serviço gerenciado de ingestão de streaming de dados que pode capturar terabytes de dados por hora a partir de centrenas de fontes como websites clickstreams, transações financeiras, logs e eventos de localização
  9. You simply put your Data in S3 and submit SQL against it
  10. Serviço de BI baseado em cloud de alta velocidade, simples de utilizar que permite que qualquer um construa visualizações, execute anaálises ad-hoc e consiga rapidamente extrais insights dos seus dados. Ele é baseado em em um motor chamado SPICE S-> Super fast P - > Parallel I -> In memory CE – optimized calculation engine
  11. Serviço de BI baseado em cloud de alta velocidade, simples de utilizar que permite que qualquer um construa visualizações, execute anaálises ad-hoc e consiga rapidamente extrais insights dos seus dados. Ele é baseado em em um motor chamado SPICE S-> Super fast P - > Parallel I -> In memory CE – optimized calculation engine
  12. 30 segundos para apresentar a empresa, rapidamente
  13. Prover informações de educação de nível municipal, estadual e federal para pais, alunos e educadores.