SlideShare uma empresa Scribd logo
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Claudia Charro
Arquiteta de Soluções
AWS
Construindo um Data Warehouse
moderno com Amazon Redshift
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
• Data Warehouse e Data Lake: Do modelo tradicional ao
moderno
• Como funciona o Amazon Redshift
• Casos de Clientes
Agenda
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Data Warehouse e Data Lake:
Do modelo tradicional ao moderno
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Data Warehouse Tradicional
OLTP ERP CRM LOB
Data Warehouse
Business Intelligence
Dados relacionais
Terabytes a petabytes de escala
Schema definido antes da carga
Relatórios Operacionais
Investimento inicial
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Data warehouse tradicional Data warehouse moderno
Inclua todos os dados nas queries para melhorar os resultados
Um Approach Melhor: Pesquise Todos os seus dados
Analise o que é carregado
no seu data warehouse
Analise todos os dados no
seu
data warehouse e data lake
Evolução das plataformas tecnológicas de análise de
dados
Appliances de
Data warehouse
1985 2006
Clusters
Hadoop
2009
Clusters EMR
desacoplados
2012
Cloud DWH
Redshift
Today
Clusterless
Athena Glue
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Sources:
Gartner: User Survey Analysis: Key Trends Shaping the Future of Data Center Infrastructure Through 2011
IDC: Worldwide Business Analytics Software 2012–2016 Forecast and 2011 Vendor Shares
1990 2000 2010 2020
VolumedeDados All Data
Analyzed Data
Dados
Obscuros não
disponíveis
para análise
Este modelo pode levar a “Dados Obscuros”
Dados Gerados
Dados Analisados
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Data Lakes Extendem o Approach Tradicional
Dados relacionais e não-relacionais
Escala de Terabytes a exabytes
Schema definido durante a análise
Vários engines analíticos para gerar insights
Desenhado para baixo custo de storage e análise
OLTP ERP CRM LOB
Data warehouse
Business
Intelligence
Data lake
1001100001001010111
0010101011100101010
0001011111011010
0011110010110010110
0100011000010
Devices Web Sensors Social
Catalog
Machine
Learning
DW
Queries
Big data
processing
Interactive Real-time
OLTP ERP CRM LOB
Data Warehouse
Business Intelligence • Dados relacionais
• Escala de TBs–PBs
• Esquema on-write
• Relatórios operacionais e ad hoc
• Investimentos iniciais
Tradicionalmente, Analytics parecia-se com isso
Data Lake amplia a abordagem tradicional
Data Warehouse
Business Intelligence
OLTP ERP CRM LOB
• Dados relacionais e não-relacionais
• Escala de TBs–EBs
• Diversidade de engines de análise
• Baixo custo de storage e processamento
Devices Web Sensors Social
Big Data processing,
real-time, Machine Learning
Data Lake
Amazon S3
Amazon Glacier
AWS Glue
Armazene os dados em diversos formatos
• Arquivos texto como CSV
• Colunares como Apache Parquet e Apache ORC
• Logstash como Grok
• JSON (simple, nested), AVRO
• E mais…
CSV
ORC
Grok
Avro
Parquet
JSON
Data lake com Amazon S3 e AWS Glue
On premises data
Web app data
Amazon RDS
Other databases
Streaming data
Your data
AMAZON
QUICKSIGHT
AWS GLUE ETL
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Evolução e Modernização Gradativa
da Arquitetura
Speed (Processamento em Real-time)
Ingestão Camada de entregaData
sources
Scale (Processamento em Batch)
Usuários de negócio
Solução de ETL
ETL
Amazon
QuickSight
BI Clásico com processamento batch
Banco Relacional
Tradicional
ERP Sist1
Outros
Sistemas
Speed (Processamento em Real-time)
Ingestão Camada de entregaData
sources
Scale (Processamento em Batch)
Data Warehouse
Amazon Redshift
Queries Interativas
Amazon Athena
EMR com PrestoStaged Data
(Data Lake)
Amazon S3
Raw Data
(Data Lake)
Amazon S3
ETL/Processamento
Amazon EMR
Ingestão de
Databases
AWS DMS
Evoluindo o cenário atual – Processamento Batch com EMR
Usuários de negócio
Cientistas de Dados
Analistas de Dados
ERP Sist1
Outros
Sistemas
Ingestão
Apache Flume
Apache Sqoop
Amazon
QuickSight
Speed (Processamento em Real-time)
Ingestão Camada de entregaData
sources
Scale (Processamento em Batch)
Data Warehouse
Amazon Redshift
Queries Interativas
Amazon Athena
EMR com PrestoStaged Data
(Data Lake)
Amazon S3
Raw Data
(Data Lake)
Amazon S3
ETL/Processamento
Amazon EMR
Deep Learning
AI Frameworks
Advanced Analytics
Amazon EMR
Ingestão de
Databases
AWS DMS
Evolução – Novas capacidades analíticas para novos usuários (IA e ML)
Usuários de negócio
Cientistas de Dados
Analistas de Dados
ERP Sist1
Outros
Sistemas Modelagem analítica/AI
Amazon EMRIngestão
Apache Flume
Apache Sqoop
Amazon
QuickSight
Speed (Processamento em Real-time)
Ingestão Camada de entregaData
sources
Scale (Processamento em Batch)
Web logs /
cookies
Dispositivos
conectados
Midias sociais
Data Warehouse
Amazon Redshift
Real-time Dashboards
Amazon ElasticSearch
Queries Interativas
Amazon Athena
EMR com Presto
Near-Zero Latency
Amazon DynamoDB
Staged Data
(Data Lake)
Amazon S3
Raw Data
(Data Lake)
Amazon S3
ETL/Processamento
Amazon EMR
Deep Learning
AI Frameworks
Advanced Analytics
Amazon EMR
Processamento
de eventos
AWS Lambda
Ingestão de
Databases
AWS DMS
Captura de
Eventos
Amazon Kinesis
Processamento em
tempo real
EMR Spark Streaming
Cenário Futuro – Incluindo Processamento em Tempo Real com IA e ML
Captura de
Eventos
Apache Kafka Amazon AI
Services
Usuários de negócio
Plataformas de
engajamento
Automação / Eventos
Cientistas de Dados
Analistas de Dados
ERP Sist1
Outros
Sistemas Modelagem analítica/AI
Amazon EMRIngestão
Apache Flume
Apache Sqoop
Amazon
QuickSight
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Como funciona o Amazon Redshift
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Amazon Redshift
Rápido
Entrega resultados rápidos
para todos os tipos de
workloads
Custo-benefício
Sem custos custos iniciais,
começe pequeno, e pague o
que utilizar
Integrado Seguro
Audite tudo, criptografe os
dados de ponta a ponta,
certificação e compliance
extensivo
Integrado com data lakes no
Amazon S3, serviços AWS, e
ferramentas de terceiros
$
Simples
Crie e comece a usar um
data warehouse em minutos
Escalável
Gigabytes a petabytes,
a exabytes
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Redshift Spectrum
Extenda o data warehouse para o seu data lake no Amazon S3
Escale computação e storage separadamente
Cruze dados entre o Amazon Redshift e Amazon S3
Amazon Redshift SQL pesquisa exabytes de dados
no Amazon S3
Formatos: Parquet, ORC, Grok, Avro, & CSV
Pague somente de acordo com a quantidade de
dados processados
Amazon S3
data lake
Amazon
Redshift data
Redshift Spectrum
query engine
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Amazon
Redshift
JDBC/ODBC
...
1 2 3 4 N
Amazon S3
Storage de objetos
em escala de
Exabytes
AWS Glue
Catálogo de
Dados
Amazon
Redshift Spectrum
Computação com
escalabilidade horizontal
Query
SELECT COUNT(*)
FROM S3.EXT_TABLE
GROUP BY …
Arquitetura do
Amazon Redshift
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Amazon Redshift está disponível Globalmente
Ireland
Frankfurt
London
Beijing
Mumbai
Seoul
Singapore
Sydney
Tokyo
Sao Paulo
US East – N Virginia
US East – Ohio
US West – Oregon
US West – N California
AWS GovCloud (US)
Canada – Central, Montreal
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Parceiros Selecionados Amazon Redshift
Data Integration Systems IntegratorsBusiness Intelligence
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Aceleração para Queries rápidas
Via Expressa para Queries rápidas
• Machine learning prevê o
tempo de execução das
queries
• Queries rápidas são roteadas
para uma fila expressa
• Recursos dinamicamente
dedicados para servir um
burst de queries curtas
Como funciona:
Analytics e
BI / Ferramentas e
Dashboards
Amazon
Redshift Machine Learning
Classifier
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
BI / Dashboard tools
Analytics and
Amazon
Redshift
Queries vão para o nó lider1
Se o cache contém o resultado da
query, o valor é retornado
2
Se o resultado não está no cache, ele
é então executado, e o resultado é
cacheado
3
RESULTS CACHE
QUERY_ID RESULT
QUERY_ID RESULT
Caching de Resultados
Queries repetidas em menos de 1 segundo
Como funciona:
Result
cache
Caching libera recursos no cluster, melhorando
a performance de todas as queries
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Ingestão de Arquivos Parquet e ORC (Novo)
• Parquet
• Avro
• Json
• TXT
• ORC
• CSV
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Algumas dicas para trabalhar com Spectrum
1. Use Amazon Redshift Spectrum para melhorar workloads “scan-
intensive” e com muita concorrência.
2. Use múltiplos clusters on-demand do Amazon Redshift clusters
para escalar concorrência.
3. Use arquivos Apache Parquet para melhor performance e menor
custo.
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Casos de Clientes
Amazon.com tem a visão de ser
a empresa com mais foco no
cliente do mundo, em que
pessoas podem encontrar o
que quiserem e comprar online
Challenge:
Carregar alto volume de e
queries/extrações todos os dias
(Amazon.com, Amazon Prime, Amazon
Music, Amazon Alexa, Amazon Video,
and Twitch).
Solution:
• Data lake no S3
• Usa Redshift para análises baseadas
em SQL por usuários de negócio,
EMR e Machine Learning
• DynamoDB capturando
todas as transações da
Amazon.com
• Dados do DynamoDB, RDS
PostgreSQL e Kinesis
alimentam o data lake no
S3
• Glue usado como catálogo
de meta dados
• Redshift usado para queries
baseadas em SQL e EMR
para machine learning e
processamento big data
• Usuários usam QuickSight
para visualizações
AWS Glue
Catálogo
QuickSight
S3 Athena
EMR
DynamoDB
PostgreSQL
Kinesis
Redshift
Machine
Learning
Amazon.com Data Lake e Analytics
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Líder mundial na área de automação bancária
e comércio conectado. Atuam na área de
online fraud detection.
Desafio:
Recebem informações de diversos canais e
instituções (mobile, desktop, ATM).
Informações são correlacionadas para gerar
um score de risco em menos de 1 segundo.
Solução:
• Redshift
• Data Lake no S3.
Caso público:
https://aws.amazon.com/pt/solutions/case-
studies/diebold-gas/
Vídeo “This is my architecture”:
https://www.youtube.com/watch?v=7HXTEewn
5bE
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Amazon
EC2
Mongo DB
Amazon Kinesis
Firehose
Amazon Kinesis
Analytics
Amazon
EMR
Amazon
EMR
Amazon
Redshift*
S3 bucket
S3 bucket
Transformação
Parquet
Machine
Learning
Amazon
EC2
ETL
API
Diebold Nixdorf
https://www.youtube.com/watch?v=7HXTEewn5bE
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Mais informações:
https://aws.amazon.com/redshift/
Experimente o Amazon Redshift:
https://aws.amazon.com/redshift/free-trial/
Leia os blog posts sobre o Amazon Redshift:
https://aws.amazon.com/redshift/blog-posts/
Comece com o Amazon Redshift
Amazon
Redshift
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Obrigada!

Mais conteúdo relacionado

Mais procurados

Fast federated SQL with Apache Calcite
Fast federated SQL with Apache CalciteFast federated SQL with Apache Calcite
Fast federated SQL with Apache Calcite
Chris Baynes
 
Oracle Application Express as add-on for Google Apps
Oracle Application Express as add-on for Google AppsOracle Application Express as add-on for Google Apps
Oracle Application Express as add-on for Google Apps
Sergei Martens
 
Deep Dive: Building external auth plugins for Gloo Enterprise
Deep Dive: Building external auth plugins for Gloo EnterpriseDeep Dive: Building external auth plugins for Gloo Enterprise
Deep Dive: Building external auth plugins for Gloo Enterprise
Christian Posta
 
Spark SQL: Another 16x Faster After Tungsten: Spark Summit East talk by Brad ...
Spark SQL: Another 16x Faster After Tungsten: Spark Summit East talk by Brad ...Spark SQL: Another 16x Faster After Tungsten: Spark Summit East talk by Brad ...
Spark SQL: Another 16x Faster After Tungsten: Spark Summit East talk by Brad ...
Spark Summit
 
Kong API Gateway
Kong API Gateway Kong API Gateway
Kong API Gateway
Chris Mague
 
Keeping Spark on Track: Productionizing Spark for ETL
Keeping Spark on Track: Productionizing Spark for ETLKeeping Spark on Track: Productionizing Spark for ETL
Keeping Spark on Track: Productionizing Spark for ETL
Databricks
 
Flexible, hybrid API-led software architectures with Kong
Flexible, hybrid API-led software architectures with KongFlexible, hybrid API-led software architectures with Kong
Flexible, hybrid API-led software architectures with Kong
Sven Bernhardt
 
De Java 8 a Java 17
De Java 8 a Java 17De Java 8 a Java 17
De Java 8 a Java 17
Víctor Leonel Orozco López
 
Deep Dive on Amazon Neptune - AWS Online Tech Talks
Deep Dive on Amazon Neptune - AWS Online Tech TalksDeep Dive on Amazon Neptune - AWS Online Tech Talks
Deep Dive on Amazon Neptune - AWS Online Tech Talks
Amazon Web Services
 
ReadConcern and WriteConcern
ReadConcern and WriteConcernReadConcern and WriteConcern
ReadConcern and WriteConcern
MongoDB
 
Introduction to Scala
Introduction to ScalaIntroduction to Scala
Introduction to Scala
Rahul Jain
 
Ansible tips & tricks
Ansible tips & tricksAnsible tips & tricks
Ansible tips & tricks
bcoca
 
Debugging ansible modules
Debugging ansible modulesDebugging ansible modules
Debugging ansible modules
aleonhardt
 
PORTFOLIO CRUD MENGGUNAKAN PHP + CODEIGNITER 4
PORTFOLIO CRUD MENGGUNAKAN PHP + CODEIGNITER 4PORTFOLIO CRUD MENGGUNAKAN PHP + CODEIGNITER 4
PORTFOLIO CRUD MENGGUNAKAN PHP + CODEIGNITER 4
IndraMaulanaYasya
 
Postman Collection Format v2.0 (pre-draft)
Postman Collection Format v2.0 (pre-draft)Postman Collection Format v2.0 (pre-draft)
Postman Collection Format v2.0 (pre-draft)
Postman
 
Introduction to Apache Calcite
Introduction to Apache CalciteIntroduction to Apache Calcite
Introduction to Apache Calcite
Jordan Halterman
 
Lessons learned from operating Data Platform on Kubernetes(EKS)
Lessons learned from operating Data Platform on Kubernetes(EKS)Lessons learned from operating Data Platform on Kubernetes(EKS)
Lessons learned from operating Data Platform on Kubernetes(EKS)
창언 정
 
Extending Flink SQL for stream processing use cases
Extending Flink SQL for stream processing use casesExtending Flink SQL for stream processing use cases
Extending Flink SQL for stream processing use cases
Flink Forward
 
Intro to Apache Spark
Intro to Apache SparkIntro to Apache Spark
Intro to Apache Spark
Cloudera, Inc.
 
Apache Spark Data Source V2 with Wenchen Fan and Gengliang Wang
Apache Spark Data Source V2 with Wenchen Fan and Gengliang WangApache Spark Data Source V2 with Wenchen Fan and Gengliang Wang
Apache Spark Data Source V2 with Wenchen Fan and Gengliang Wang
Databricks
 

Mais procurados (20)

Fast federated SQL with Apache Calcite
Fast federated SQL with Apache CalciteFast federated SQL with Apache Calcite
Fast federated SQL with Apache Calcite
 
Oracle Application Express as add-on for Google Apps
Oracle Application Express as add-on for Google AppsOracle Application Express as add-on for Google Apps
Oracle Application Express as add-on for Google Apps
 
Deep Dive: Building external auth plugins for Gloo Enterprise
Deep Dive: Building external auth plugins for Gloo EnterpriseDeep Dive: Building external auth plugins for Gloo Enterprise
Deep Dive: Building external auth plugins for Gloo Enterprise
 
Spark SQL: Another 16x Faster After Tungsten: Spark Summit East talk by Brad ...
Spark SQL: Another 16x Faster After Tungsten: Spark Summit East talk by Brad ...Spark SQL: Another 16x Faster After Tungsten: Spark Summit East talk by Brad ...
Spark SQL: Another 16x Faster After Tungsten: Spark Summit East talk by Brad ...
 
Kong API Gateway
Kong API Gateway Kong API Gateway
Kong API Gateway
 
Keeping Spark on Track: Productionizing Spark for ETL
Keeping Spark on Track: Productionizing Spark for ETLKeeping Spark on Track: Productionizing Spark for ETL
Keeping Spark on Track: Productionizing Spark for ETL
 
Flexible, hybrid API-led software architectures with Kong
Flexible, hybrid API-led software architectures with KongFlexible, hybrid API-led software architectures with Kong
Flexible, hybrid API-led software architectures with Kong
 
De Java 8 a Java 17
De Java 8 a Java 17De Java 8 a Java 17
De Java 8 a Java 17
 
Deep Dive on Amazon Neptune - AWS Online Tech Talks
Deep Dive on Amazon Neptune - AWS Online Tech TalksDeep Dive on Amazon Neptune - AWS Online Tech Talks
Deep Dive on Amazon Neptune - AWS Online Tech Talks
 
ReadConcern and WriteConcern
ReadConcern and WriteConcernReadConcern and WriteConcern
ReadConcern and WriteConcern
 
Introduction to Scala
Introduction to ScalaIntroduction to Scala
Introduction to Scala
 
Ansible tips & tricks
Ansible tips & tricksAnsible tips & tricks
Ansible tips & tricks
 
Debugging ansible modules
Debugging ansible modulesDebugging ansible modules
Debugging ansible modules
 
PORTFOLIO CRUD MENGGUNAKAN PHP + CODEIGNITER 4
PORTFOLIO CRUD MENGGUNAKAN PHP + CODEIGNITER 4PORTFOLIO CRUD MENGGUNAKAN PHP + CODEIGNITER 4
PORTFOLIO CRUD MENGGUNAKAN PHP + CODEIGNITER 4
 
Postman Collection Format v2.0 (pre-draft)
Postman Collection Format v2.0 (pre-draft)Postman Collection Format v2.0 (pre-draft)
Postman Collection Format v2.0 (pre-draft)
 
Introduction to Apache Calcite
Introduction to Apache CalciteIntroduction to Apache Calcite
Introduction to Apache Calcite
 
Lessons learned from operating Data Platform on Kubernetes(EKS)
Lessons learned from operating Data Platform on Kubernetes(EKS)Lessons learned from operating Data Platform on Kubernetes(EKS)
Lessons learned from operating Data Platform on Kubernetes(EKS)
 
Extending Flink SQL for stream processing use cases
Extending Flink SQL for stream processing use casesExtending Flink SQL for stream processing use cases
Extending Flink SQL for stream processing use cases
 
Intro to Apache Spark
Intro to Apache SparkIntro to Apache Spark
Intro to Apache Spark
 
Apache Spark Data Source V2 with Wenchen Fan and Gengliang Wang
Apache Spark Data Source V2 with Wenchen Fan and Gengliang WangApache Spark Data Source V2 with Wenchen Fan and Gengliang Wang
Apache Spark Data Source V2 with Wenchen Fan and Gengliang Wang
 

Semelhante a Construindo um Data Warehouse moderno com Amazon Redshift

Construindo Data Lakes e Analytics na AWS - BDA301 - Sao Paulo Summit
Construindo Data Lakes e Analytics na AWS -  BDA301 - Sao Paulo SummitConstruindo Data Lakes e Analytics na AWS -  BDA301 - Sao Paulo Summit
Construindo Data Lakes e Analytics na AWS - BDA301 - Sao Paulo Summit
Amazon Web Services
 
Aplicando uma Estratégia de Banco de Dados AWS Personalizada: Encontre o Banc...
Aplicando uma Estratégia de Banco de Dados AWS Personalizada: Encontre o Banc...Aplicando uma Estratégia de Banco de Dados AWS Personalizada: Encontre o Banc...
Aplicando uma Estratégia de Banco de Dados AWS Personalizada: Encontre o Banc...
Amazon Web Services
 
Sessão Avançada: Construindo um Data Warehouse Moderno com Amazon Redshift - ...
Sessão Avançada: Construindo um Data Warehouse Moderno com Amazon Redshift - ...Sessão Avançada: Construindo um Data Warehouse Moderno com Amazon Redshift - ...
Sessão Avançada: Construindo um Data Warehouse Moderno com Amazon Redshift - ...
Amazon Web Services
 
Tendências de Big Data
Tendências de Big DataTendências de Big Data
Tendências de Big Data
Amazon Web Services LATAM
 
Path to the Future #1 - Tendências de Big Data
Path to the Future #1 - Tendências de Big DataPath to the Future #1 - Tendências de Big Data
Path to the Future #1 - Tendências de Big Data
Amazon Web Services LATAM
 
Tendências de Big Data
Tendências de Big DataTendências de Big Data
Tendências de Big Data
Amazon Web Services LATAM
 
Tendências de Big Data
Tendências de Big DataTendências de Big Data
Tendências de Big Data
Amazon Web Services LATAM
 
Construindo um Data Lake na AWS
Construindo um Data Lake na AWSConstruindo um Data Lake na AWS
Construindo um Data Lake na AWS
Amazon Web Services LATAM
 
É Tudo sobre Dados - ARC202 - Sao Paulo Summit
É Tudo sobre Dados -  ARC202 - Sao Paulo SummitÉ Tudo sobre Dados -  ARC202 - Sao Paulo Summit
É Tudo sobre Dados - ARC202 - Sao Paulo Summit
Amazon Web Services
 
Data Lakes - EBC on the road Brazil Edition [Portuguese]
Data Lakes - EBC on the road Brazil Edition [Portuguese]Data Lakes - EBC on the road Brazil Edition [Portuguese]
Data Lakes - EBC on the road Brazil Edition [Portuguese]
Amazon Web Services
 
AWS Initiate - Construindo Data Lakes e Analytics com AWS
AWS Initiate - Construindo Data Lakes e Analytics com AWSAWS Initiate - Construindo Data Lakes e Analytics com AWS
AWS Initiate - Construindo Data Lakes e Analytics com AWS
Amazon Web Services LATAM
 
Aws summit arquitetura big data-v1.2
Aws summit arquitetura big data-v1.2Aws summit arquitetura big data-v1.2
Aws summit arquitetura big data-v1.2
Amazon Web Services LATAM
 
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
Amazon Web Services LATAM
 
Encontre o Banco de Dados certo para sua Carga de Trabalho
Encontre o Banco de Dados certo para sua Carga de TrabalhoEncontre o Banco de Dados certo para sua Carga de Trabalho
Encontre o Banco de Dados certo para sua Carga de Trabalho
Amazon Web Services LATAM
 
Construindo seu Data Lake na AWS
Construindo seu Data Lake na AWSConstruindo seu Data Lake na AWS
Construindo seu Data Lake na AWS
Amazon Web Services LATAM
 
AWS Database Day - Português
AWS Database Day - PortuguêsAWS Database Day - Português
AWS Database Day - Português
Amazon Web Services LATAM
 
Construindo Data Lakes e Analytics na AWS
Construindo Data Lakes e Analytics na AWSConstruindo Data Lakes e Analytics na AWS
Construindo Data Lakes e Analytics na AWS
Amazon Web Services LATAM
 
Arquiteturas de Software para o Século XXI
Arquiteturas de Software para o Século XXIArquiteturas de Software para o Século XXI
Arquiteturas de Software para o Século XXI
Amazon Web Services LATAM
 
Liberte-se dos bancos de dados comerciais para economizar, crescer e inovar
Liberte-se dos bancos de dados comerciais para economizar, crescer e inovarLiberte-se dos bancos de dados comerciais para economizar, crescer e inovar
Liberte-se dos bancos de dados comerciais para economizar, crescer e inovar
Amazon Web Services LATAM
 
Bancos de Dados gerenciados na nuvem AWS
Bancos de Dados gerenciados na nuvem AWSBancos de Dados gerenciados na nuvem AWS
Bancos de Dados gerenciados na nuvem AWS
Amazon Web Services LATAM
 

Semelhante a Construindo um Data Warehouse moderno com Amazon Redshift (20)

Construindo Data Lakes e Analytics na AWS - BDA301 - Sao Paulo Summit
Construindo Data Lakes e Analytics na AWS -  BDA301 - Sao Paulo SummitConstruindo Data Lakes e Analytics na AWS -  BDA301 - Sao Paulo Summit
Construindo Data Lakes e Analytics na AWS - BDA301 - Sao Paulo Summit
 
Aplicando uma Estratégia de Banco de Dados AWS Personalizada: Encontre o Banc...
Aplicando uma Estratégia de Banco de Dados AWS Personalizada: Encontre o Banc...Aplicando uma Estratégia de Banco de Dados AWS Personalizada: Encontre o Banc...
Aplicando uma Estratégia de Banco de Dados AWS Personalizada: Encontre o Banc...
 
Sessão Avançada: Construindo um Data Warehouse Moderno com Amazon Redshift - ...
Sessão Avançada: Construindo um Data Warehouse Moderno com Amazon Redshift - ...Sessão Avançada: Construindo um Data Warehouse Moderno com Amazon Redshift - ...
Sessão Avançada: Construindo um Data Warehouse Moderno com Amazon Redshift - ...
 
Tendências de Big Data
Tendências de Big DataTendências de Big Data
Tendências de Big Data
 
Path to the Future #1 - Tendências de Big Data
Path to the Future #1 - Tendências de Big DataPath to the Future #1 - Tendências de Big Data
Path to the Future #1 - Tendências de Big Data
 
Tendências de Big Data
Tendências de Big DataTendências de Big Data
Tendências de Big Data
 
Tendências de Big Data
Tendências de Big DataTendências de Big Data
Tendências de Big Data
 
Construindo um Data Lake na AWS
Construindo um Data Lake na AWSConstruindo um Data Lake na AWS
Construindo um Data Lake na AWS
 
É Tudo sobre Dados - ARC202 - Sao Paulo Summit
É Tudo sobre Dados -  ARC202 - Sao Paulo SummitÉ Tudo sobre Dados -  ARC202 - Sao Paulo Summit
É Tudo sobre Dados - ARC202 - Sao Paulo Summit
 
Data Lakes - EBC on the road Brazil Edition [Portuguese]
Data Lakes - EBC on the road Brazil Edition [Portuguese]Data Lakes - EBC on the road Brazil Edition [Portuguese]
Data Lakes - EBC on the road Brazil Edition [Portuguese]
 
AWS Initiate - Construindo Data Lakes e Analytics com AWS
AWS Initiate - Construindo Data Lakes e Analytics com AWSAWS Initiate - Construindo Data Lakes e Analytics com AWS
AWS Initiate - Construindo Data Lakes e Analytics com AWS
 
Aws summit arquitetura big data-v1.2
Aws summit arquitetura big data-v1.2Aws summit arquitetura big data-v1.2
Aws summit arquitetura big data-v1.2
 
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
 
Encontre o Banco de Dados certo para sua Carga de Trabalho
Encontre o Banco de Dados certo para sua Carga de TrabalhoEncontre o Banco de Dados certo para sua Carga de Trabalho
Encontre o Banco de Dados certo para sua Carga de Trabalho
 
Construindo seu Data Lake na AWS
Construindo seu Data Lake na AWSConstruindo seu Data Lake na AWS
Construindo seu Data Lake na AWS
 
AWS Database Day - Português
AWS Database Day - PortuguêsAWS Database Day - Português
AWS Database Day - Português
 
Construindo Data Lakes e Analytics na AWS
Construindo Data Lakes e Analytics na AWSConstruindo Data Lakes e Analytics na AWS
Construindo Data Lakes e Analytics na AWS
 
Arquiteturas de Software para o Século XXI
Arquiteturas de Software para o Século XXIArquiteturas de Software para o Século XXI
Arquiteturas de Software para o Século XXI
 
Liberte-se dos bancos de dados comerciais para economizar, crescer e inovar
Liberte-se dos bancos de dados comerciais para economizar, crescer e inovarLiberte-se dos bancos de dados comerciais para economizar, crescer e inovar
Liberte-se dos bancos de dados comerciais para economizar, crescer e inovar
 
Bancos de Dados gerenciados na nuvem AWS
Bancos de Dados gerenciados na nuvem AWSBancos de Dados gerenciados na nuvem AWS
Bancos de Dados gerenciados na nuvem AWS
 

Mais de Amazon Web Services LATAM

AWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvemAWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvem
Amazon Web Services LATAM
 
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e BackupAWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
Amazon Web Services LATAM
 
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
Amazon Web Services LATAM
 
AWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvemAWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvem
Amazon Web Services LATAM
 
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e BackupAWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
Amazon Web Services LATAM
 
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
Amazon Web Services LATAM
 
Automatice el proceso de entrega con CI/CD en AWS
Automatice el proceso de entrega con CI/CD en AWSAutomatice el proceso de entrega con CI/CD en AWS
Automatice el proceso de entrega con CI/CD en AWS
Amazon Web Services LATAM
 
Automatize seu processo de entrega de software com CI/CD na AWS
Automatize seu processo de entrega de software com CI/CD na AWSAutomatize seu processo de entrega de software com CI/CD na AWS
Automatize seu processo de entrega de software com CI/CD na AWS
Amazon Web Services LATAM
 
Cómo empezar con Amazon EKS
Cómo empezar con Amazon EKSCómo empezar con Amazon EKS
Cómo empezar con Amazon EKS
Amazon Web Services LATAM
 
Como começar com Amazon EKS
Como começar com Amazon EKSComo começar com Amazon EKS
Como começar com Amazon EKS
Amazon Web Services LATAM
 
Ransomware: como recuperar os seus dados na nuvem AWS
Ransomware: como recuperar os seus dados na nuvem AWSRansomware: como recuperar os seus dados na nuvem AWS
Ransomware: como recuperar os seus dados na nuvem AWS
Amazon Web Services LATAM
 
Ransomware: cómo recuperar sus datos en la nube de AWS
Ransomware: cómo recuperar sus datos en la nube de AWSRansomware: cómo recuperar sus datos en la nube de AWS
Ransomware: cómo recuperar sus datos en la nube de AWS
Amazon Web Services LATAM
 
Ransomware: Estratégias de Mitigação
Ransomware: Estratégias de MitigaçãoRansomware: Estratégias de Mitigação
Ransomware: Estratégias de Mitigação
Amazon Web Services LATAM
 
Ransomware: Estratégias de Mitigación
Ransomware: Estratégias de MitigaciónRansomware: Estratégias de Mitigación
Ransomware: Estratégias de Mitigación
Amazon Web Services LATAM
 
Aprenda a migrar y transferir datos al usar la nube de AWS
Aprenda a migrar y transferir datos al usar la nube de AWSAprenda a migrar y transferir datos al usar la nube de AWS
Aprenda a migrar y transferir datos al usar la nube de AWS
Amazon Web Services LATAM
 
Aprenda como migrar e transferir dados ao utilizar a nuvem da AWS
Aprenda como migrar e transferir dados ao utilizar a nuvem da AWSAprenda como migrar e transferir dados ao utilizar a nuvem da AWS
Aprenda como migrar e transferir dados ao utilizar a nuvem da AWS
Amazon Web Services LATAM
 
Cómo mover a un almacenamiento de archivos administrados
Cómo mover a un almacenamiento de archivos administradosCómo mover a un almacenamiento de archivos administrados
Cómo mover a un almacenamiento de archivos administrados
Amazon Web Services LATAM
 
Simplifique su BI con AWS
Simplifique su BI con AWSSimplifique su BI con AWS
Simplifique su BI con AWS
Amazon Web Services LATAM
 
Simplifique o seu BI com a AWS
Simplifique o seu BI com a AWSSimplifique o seu BI com a AWS
Simplifique o seu BI com a AWS
Amazon Web Services LATAM
 
Os benefícios de migrar seus workloads de Big Data para a AWS
Os benefícios de migrar seus workloads de Big Data para a AWSOs benefícios de migrar seus workloads de Big Data para a AWS
Os benefícios de migrar seus workloads de Big Data para a AWS
Amazon Web Services LATAM
 

Mais de Amazon Web Services LATAM (20)

AWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvemAWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvem
 
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e BackupAWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
 
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
 
AWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvemAWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 1 - Introdução à nuvem
 
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e BackupAWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
 
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
 
Automatice el proceso de entrega con CI/CD en AWS
Automatice el proceso de entrega con CI/CD en AWSAutomatice el proceso de entrega con CI/CD en AWS
Automatice el proceso de entrega con CI/CD en AWS
 
Automatize seu processo de entrega de software com CI/CD na AWS
Automatize seu processo de entrega de software com CI/CD na AWSAutomatize seu processo de entrega de software com CI/CD na AWS
Automatize seu processo de entrega de software com CI/CD na AWS
 
Cómo empezar con Amazon EKS
Cómo empezar con Amazon EKSCómo empezar con Amazon EKS
Cómo empezar con Amazon EKS
 
Como começar com Amazon EKS
Como começar com Amazon EKSComo começar com Amazon EKS
Como começar com Amazon EKS
 
Ransomware: como recuperar os seus dados na nuvem AWS
Ransomware: como recuperar os seus dados na nuvem AWSRansomware: como recuperar os seus dados na nuvem AWS
Ransomware: como recuperar os seus dados na nuvem AWS
 
Ransomware: cómo recuperar sus datos en la nube de AWS
Ransomware: cómo recuperar sus datos en la nube de AWSRansomware: cómo recuperar sus datos en la nube de AWS
Ransomware: cómo recuperar sus datos en la nube de AWS
 
Ransomware: Estratégias de Mitigação
Ransomware: Estratégias de MitigaçãoRansomware: Estratégias de Mitigação
Ransomware: Estratégias de Mitigação
 
Ransomware: Estratégias de Mitigación
Ransomware: Estratégias de MitigaciónRansomware: Estratégias de Mitigación
Ransomware: Estratégias de Mitigación
 
Aprenda a migrar y transferir datos al usar la nube de AWS
Aprenda a migrar y transferir datos al usar la nube de AWSAprenda a migrar y transferir datos al usar la nube de AWS
Aprenda a migrar y transferir datos al usar la nube de AWS
 
Aprenda como migrar e transferir dados ao utilizar a nuvem da AWS
Aprenda como migrar e transferir dados ao utilizar a nuvem da AWSAprenda como migrar e transferir dados ao utilizar a nuvem da AWS
Aprenda como migrar e transferir dados ao utilizar a nuvem da AWS
 
Cómo mover a un almacenamiento de archivos administrados
Cómo mover a un almacenamiento de archivos administradosCómo mover a un almacenamiento de archivos administrados
Cómo mover a un almacenamiento de archivos administrados
 
Simplifique su BI con AWS
Simplifique su BI con AWSSimplifique su BI con AWS
Simplifique su BI con AWS
 
Simplifique o seu BI com a AWS
Simplifique o seu BI com a AWSSimplifique o seu BI com a AWS
Simplifique o seu BI com a AWS
 
Os benefícios de migrar seus workloads de Big Data para a AWS
Os benefícios de migrar seus workloads de Big Data para a AWSOs benefícios de migrar seus workloads de Big Data para a AWS
Os benefícios de migrar seus workloads de Big Data para a AWS
 

Construindo um Data Warehouse moderno com Amazon Redshift

  • 1. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Claudia Charro Arquiteta de Soluções AWS Construindo um Data Warehouse moderno com Amazon Redshift
  • 2. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. • Data Warehouse e Data Lake: Do modelo tradicional ao moderno • Como funciona o Amazon Redshift • Casos de Clientes Agenda
  • 3. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Data Warehouse e Data Lake: Do modelo tradicional ao moderno
  • 4. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Data Warehouse Tradicional OLTP ERP CRM LOB Data Warehouse Business Intelligence Dados relacionais Terabytes a petabytes de escala Schema definido antes da carga Relatórios Operacionais Investimento inicial
  • 5. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Data warehouse tradicional Data warehouse moderno Inclua todos os dados nas queries para melhorar os resultados Um Approach Melhor: Pesquise Todos os seus dados Analise o que é carregado no seu data warehouse Analise todos os dados no seu data warehouse e data lake
  • 6. Evolução das plataformas tecnológicas de análise de dados Appliances de Data warehouse 1985 2006 Clusters Hadoop 2009 Clusters EMR desacoplados 2012 Cloud DWH Redshift Today Clusterless Athena Glue
  • 7. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Sources: Gartner: User Survey Analysis: Key Trends Shaping the Future of Data Center Infrastructure Through 2011 IDC: Worldwide Business Analytics Software 2012–2016 Forecast and 2011 Vendor Shares 1990 2000 2010 2020 VolumedeDados All Data Analyzed Data Dados Obscuros não disponíveis para análise Este modelo pode levar a “Dados Obscuros” Dados Gerados Dados Analisados
  • 8. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Data Lakes Extendem o Approach Tradicional Dados relacionais e não-relacionais Escala de Terabytes a exabytes Schema definido durante a análise Vários engines analíticos para gerar insights Desenhado para baixo custo de storage e análise OLTP ERP CRM LOB Data warehouse Business Intelligence Data lake 1001100001001010111 0010101011100101010 0001011111011010 0011110010110010110 0100011000010 Devices Web Sensors Social Catalog Machine Learning DW Queries Big data processing Interactive Real-time
  • 9. OLTP ERP CRM LOB Data Warehouse Business Intelligence • Dados relacionais • Escala de TBs–PBs • Esquema on-write • Relatórios operacionais e ad hoc • Investimentos iniciais Tradicionalmente, Analytics parecia-se com isso
  • 10. Data Lake amplia a abordagem tradicional Data Warehouse Business Intelligence OLTP ERP CRM LOB • Dados relacionais e não-relacionais • Escala de TBs–EBs • Diversidade de engines de análise • Baixo custo de storage e processamento Devices Web Sensors Social Big Data processing, real-time, Machine Learning Data Lake
  • 11. Amazon S3 Amazon Glacier AWS Glue Armazene os dados em diversos formatos • Arquivos texto como CSV • Colunares como Apache Parquet e Apache ORC • Logstash como Grok • JSON (simple, nested), AVRO • E mais… CSV ORC Grok Avro Parquet JSON
  • 12. Data lake com Amazon S3 e AWS Glue On premises data Web app data Amazon RDS Other databases Streaming data Your data AMAZON QUICKSIGHT AWS GLUE ETL
  • 13. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Evolução e Modernização Gradativa da Arquitetura
  • 14. Speed (Processamento em Real-time) Ingestão Camada de entregaData sources Scale (Processamento em Batch) Usuários de negócio Solução de ETL ETL Amazon QuickSight BI Clásico com processamento batch Banco Relacional Tradicional ERP Sist1 Outros Sistemas
  • 15. Speed (Processamento em Real-time) Ingestão Camada de entregaData sources Scale (Processamento em Batch) Data Warehouse Amazon Redshift Queries Interativas Amazon Athena EMR com PrestoStaged Data (Data Lake) Amazon S3 Raw Data (Data Lake) Amazon S3 ETL/Processamento Amazon EMR Ingestão de Databases AWS DMS Evoluindo o cenário atual – Processamento Batch com EMR Usuários de negócio Cientistas de Dados Analistas de Dados ERP Sist1 Outros Sistemas Ingestão Apache Flume Apache Sqoop Amazon QuickSight
  • 16. Speed (Processamento em Real-time) Ingestão Camada de entregaData sources Scale (Processamento em Batch) Data Warehouse Amazon Redshift Queries Interativas Amazon Athena EMR com PrestoStaged Data (Data Lake) Amazon S3 Raw Data (Data Lake) Amazon S3 ETL/Processamento Amazon EMR Deep Learning AI Frameworks Advanced Analytics Amazon EMR Ingestão de Databases AWS DMS Evolução – Novas capacidades analíticas para novos usuários (IA e ML) Usuários de negócio Cientistas de Dados Analistas de Dados ERP Sist1 Outros Sistemas Modelagem analítica/AI Amazon EMRIngestão Apache Flume Apache Sqoop Amazon QuickSight
  • 17. Speed (Processamento em Real-time) Ingestão Camada de entregaData sources Scale (Processamento em Batch) Web logs / cookies Dispositivos conectados Midias sociais Data Warehouse Amazon Redshift Real-time Dashboards Amazon ElasticSearch Queries Interativas Amazon Athena EMR com Presto Near-Zero Latency Amazon DynamoDB Staged Data (Data Lake) Amazon S3 Raw Data (Data Lake) Amazon S3 ETL/Processamento Amazon EMR Deep Learning AI Frameworks Advanced Analytics Amazon EMR Processamento de eventos AWS Lambda Ingestão de Databases AWS DMS Captura de Eventos Amazon Kinesis Processamento em tempo real EMR Spark Streaming Cenário Futuro – Incluindo Processamento em Tempo Real com IA e ML Captura de Eventos Apache Kafka Amazon AI Services Usuários de negócio Plataformas de engajamento Automação / Eventos Cientistas de Dados Analistas de Dados ERP Sist1 Outros Sistemas Modelagem analítica/AI Amazon EMRIngestão Apache Flume Apache Sqoop Amazon QuickSight
  • 18. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Como funciona o Amazon Redshift
  • 19. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Amazon Redshift Rápido Entrega resultados rápidos para todos os tipos de workloads Custo-benefício Sem custos custos iniciais, começe pequeno, e pague o que utilizar Integrado Seguro Audite tudo, criptografe os dados de ponta a ponta, certificação e compliance extensivo Integrado com data lakes no Amazon S3, serviços AWS, e ferramentas de terceiros $ Simples Crie e comece a usar um data warehouse em minutos Escalável Gigabytes a petabytes, a exabytes
  • 20. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Redshift Spectrum Extenda o data warehouse para o seu data lake no Amazon S3 Escale computação e storage separadamente Cruze dados entre o Amazon Redshift e Amazon S3 Amazon Redshift SQL pesquisa exabytes de dados no Amazon S3 Formatos: Parquet, ORC, Grok, Avro, & CSV Pague somente de acordo com a quantidade de dados processados Amazon S3 data lake Amazon Redshift data Redshift Spectrum query engine
  • 21. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Amazon Redshift JDBC/ODBC ... 1 2 3 4 N Amazon S3 Storage de objetos em escala de Exabytes AWS Glue Catálogo de Dados Amazon Redshift Spectrum Computação com escalabilidade horizontal Query SELECT COUNT(*) FROM S3.EXT_TABLE GROUP BY … Arquitetura do Amazon Redshift
  • 22. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Amazon Redshift está disponível Globalmente Ireland Frankfurt London Beijing Mumbai Seoul Singapore Sydney Tokyo Sao Paulo US East – N Virginia US East – Ohio US West – Oregon US West – N California AWS GovCloud (US) Canada – Central, Montreal
  • 23. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Parceiros Selecionados Amazon Redshift Data Integration Systems IntegratorsBusiness Intelligence
  • 24. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Aceleração para Queries rápidas Via Expressa para Queries rápidas • Machine learning prevê o tempo de execução das queries • Queries rápidas são roteadas para uma fila expressa • Recursos dinamicamente dedicados para servir um burst de queries curtas Como funciona: Analytics e BI / Ferramentas e Dashboards Amazon Redshift Machine Learning Classifier
  • 25. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. BI / Dashboard tools Analytics and Amazon Redshift Queries vão para o nó lider1 Se o cache contém o resultado da query, o valor é retornado 2 Se o resultado não está no cache, ele é então executado, e o resultado é cacheado 3 RESULTS CACHE QUERY_ID RESULT QUERY_ID RESULT Caching de Resultados Queries repetidas em menos de 1 segundo Como funciona: Result cache Caching libera recursos no cluster, melhorando a performance de todas as queries
  • 26. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Ingestão de Arquivos Parquet e ORC (Novo) • Parquet • Avro • Json • TXT • ORC • CSV
  • 27. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Algumas dicas para trabalhar com Spectrum 1. Use Amazon Redshift Spectrum para melhorar workloads “scan- intensive” e com muita concorrência. 2. Use múltiplos clusters on-demand do Amazon Redshift clusters para escalar concorrência. 3. Use arquivos Apache Parquet para melhor performance e menor custo.
  • 28. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Casos de Clientes
  • 29. Amazon.com tem a visão de ser a empresa com mais foco no cliente do mundo, em que pessoas podem encontrar o que quiserem e comprar online Challenge: Carregar alto volume de e queries/extrações todos os dias (Amazon.com, Amazon Prime, Amazon Music, Amazon Alexa, Amazon Video, and Twitch). Solution: • Data lake no S3 • Usa Redshift para análises baseadas em SQL por usuários de negócio, EMR e Machine Learning
  • 30. • DynamoDB capturando todas as transações da Amazon.com • Dados do DynamoDB, RDS PostgreSQL e Kinesis alimentam o data lake no S3 • Glue usado como catálogo de meta dados • Redshift usado para queries baseadas em SQL e EMR para machine learning e processamento big data • Usuários usam QuickSight para visualizações AWS Glue Catálogo QuickSight S3 Athena EMR DynamoDB PostgreSQL Kinesis Redshift Machine Learning Amazon.com Data Lake e Analytics
  • 31. © 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved. Líder mundial na área de automação bancária e comércio conectado. Atuam na área de online fraud detection. Desafio: Recebem informações de diversos canais e instituções (mobile, desktop, ATM). Informações são correlacionadas para gerar um score de risco em menos de 1 segundo. Solução: • Redshift • Data Lake no S3. Caso público: https://aws.amazon.com/pt/solutions/case- studies/diebold-gas/ Vídeo “This is my architecture”: https://www.youtube.com/watch?v=7HXTEewn 5bE
  • 32. © 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved. Amazon EC2 Mongo DB Amazon Kinesis Firehose Amazon Kinesis Analytics Amazon EMR Amazon EMR Amazon Redshift* S3 bucket S3 bucket Transformação Parquet Machine Learning Amazon EC2 ETL API Diebold Nixdorf https://www.youtube.com/watch?v=7HXTEewn5bE
  • 33. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Mais informações: https://aws.amazon.com/redshift/ Experimente o Amazon Redshift: https://aws.amazon.com/redshift/free-trial/ Leia os blog posts sobre o Amazon Redshift: https://aws.amazon.com/redshift/blog-posts/ Comece com o Amazon Redshift Amazon Redshift
  • 34. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Obrigada!