SlideShare uma empresa Scribd logo
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Angelo Carvalho
Principal Solutions Architect
BDA302
Construindo um Data Warehouse
moderno: Deep Dive no Amazon
Redshift
Felipe Duarte
Coordenador de DW/BI
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Introdução
Amazon Web Services
Visão Geral do Amazon Redshift
Funcionalidades recém lançadas e futuras
Cliente: Dafiti Group
Agenda
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Arquitetura de Analytics na AWS
Ingestão Armazenament
o
Análise
Amazon Kinesis
Data Firehose
AWS Direct
Connect
Amazon
Snowball
Amazon Kinesis
Data Analytics
Amazon Kinesis
Data Streams
Amazon S3 Amazon Glacier
Amazon
CloudSearch
Amazon RDS,
Amazon Aurora
Amazon
DynamoDB
Amazon ES
Amazon EMR
Amazon
Redshift
Amazon
QuickSight
AWS Database Migration Service AWS Glue
Amazon Athena
Amazon AI
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Amazon Redshift
10x mais rápido a 1/10 do custo
Rápido
Entrega resultados rápidos
para todos os tipos de
workloads
Custo-benefício
Sem custos custos iniciais,
começe pequeno, e pague o
que utilizar
Integrado Seguro
Audite tudo, criptografe os
dados de ponta a ponta,
certificação e compliance
extensivo
Integrado com data lakes no
Amazon S3, serviços AWS, e
ferramentas de terceiros
$
Simples
Crie e comece a usar um
data warehouse em minutos
Escalável
Gigabytes a petabytes,
a exabytes
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Redshift Spectrum
Extenda o data warehouse para o seu data lake no Amazon S3
Escale computação e storage separadamente
Cruze dados entre o Amazon Redshift e Amazon S3
Amazon Redshift SQL pesquisa exabytes de dados
no Amazon S3
Performance de queries estável e concorrência
ilimitada
Formatos: Parquet, ORC, Grok, Avro, & CSV
Pague somente de acordo com a quantidade de
dados processados
Amazon S3
data lake
Amazon
Redshift data
Redshift Spectrum
query engine
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Amazon
Redshift
JDBC/ODBC
...
1 2 3 4 N
Amazon S3
Storage de objetos em
escala de Exabytes
AWS Glue
Catálogo de
Dados
Amazon Redshift Spectrum
Computação serverless com
escalabilidade horizontal
Query
SELECT COUNT(*)
FROM S3.EXT_TABLE
GROUP BY …
Arquitetura do
Amazon Redshift
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Amazon Redshift possui Self-Healing
Prevê e remedia discos degradados, nós,
cluster e problemas de rede
Garante a performance geral do cluster e das
queries
Amazon S3
Region 1
Region 2
Amazon S3
Compute node Compute node Compute node
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Milhares de Organizações Executam Workloads de
Missão Crítica no Amazon Redshift
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
The Forrester Wave™ is copyrighted by Forrester Research, Inc. Forrester and Forrester Wave™ are trademarks of Forrester Research, Inc. The Forrester Wave™ is a graphical
representation of Forrester's call on a market and is plotted using a detailed spreadsheet with exposed scores, weightings, and comments. Forrester does not endorse any vendor,
product, or service depicted in the Forrester Wave. Information is based on best available resources. Opinions reflect judgment at the time and are subject to change.
“Amazon Redshift tem a maior adoção de
BDW na nuvem.”
“Com mais de 5.000 deployments, Amazon
Redshift tem o maior deployment de data
warehouse na nuvem – alguns acima de 10
petabytes em tamanho.”
AWS recebeu um score de 5/5 (o maior
score possível) em: base de clientes, market
awareness, habilidade para executar, road
map, suporte, e partners
Forrester Wave Big Data Warehouse Q2 2017
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Amazon Redshift está disponível Globalmente
Ireland
Frankfurt
London
Beijing
Mumbai
Seoul
Singapore
Sydney
Tokyo
Sao Paulo
US East – N Virginia
US East – Ohio
US West – Oregon
US West – N California
AWS GovCloud (US)
Canada – Central, Montreal
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Parceiros Selecionados Amazon Redshift
Data Integration Systems IntegratorsBusiness Intelligence
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Funcionalidades Lançadas Recentemente
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Customer Comments
“We have terabytes of event data coming from our
websites and applications to Amazon S3 and then to
Amazon Redshift in near real time. Amazon Redshift
is at the core of our operations and used by our
marketing automation tools,” said Jarno Kartela,
Head of Analytics and Chief Data Scientist, DNA.
“We can now run queries in half the time.”
“Amazon Redshift allows us to quickly spin up clusters and
provide our data scientists with a fast and easy method to
access data and generate insights,” said Bradley Todd, Liberty
Mutual’s Technology Architect. “We saw a 9x reduction in
month-end reporting time with Amazon Redshift DC2 nodes
as compared to DC1."
“We use Redshift Spectrum for interactive online
queries,” said Hyung-Joon Kim, Principle Software
Engineer, BrandVerity. "The new DC2 node from
Amazon Redshift has given us a 70 percent
performance boost for running Redshift Spectrum
queries. As a result, we can analyze far more data
for our customers and deliver results much faster."
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Dense Compute Nodes (DC2)
2x a performance pelo mesmo preço das DC1
3x mais I/O com
30% melhor utilização do storage
que a DC1
“O novo nó DC2 do Amazon Redshift está
entregando 100 por cento de aumento de
performance, nos permitindo fornecer
insights mais rápidos para os nossos
varejistas, com melhor custo benefício, para
gerar receita incremental."
NVMe SSD Memória DDR4
Intel E5-2686 v4 (Broadwell)
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Aceleração para Queries rápidas
Via Expressa para Queries rápidas
• Queries curtas não ficam presas entre queries longas
• Maior throughput – Menos variabilidade
• Se adapta ao seu workload
• Transparente – simplesmente funciona!
Tempo Médio de Espera na Fila para Queries Curtas (<1 sec.)
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Aceleração para Queries rápidas
Via Expressa para Queries rápidas
• Machine learning prevê o
tempo de execução das
queries
• Queries rápidas são roteadas
para uma fila expressa
• SQA Elástico: Recursos
dinamicamente dedicados
para servir um burst de
queries curtas
• Habilite hoje no seu
console de gerenciamento
AWS
Como funciona:
Analytics e
BI / Ferramentas e
Dashboards
Amazon
Redshift Machine Learning
Classifier
Machine learning
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
BI / Dashboard tools
Analytics and
Amazon
Redshift
Queries vão para o nó lider1
Se o cache contém o resultado da
query, o valor é retornado
2
Se o resultado não está no cache, ele
é então executado, e o resultado é
cacheado
3
RESULTS CACHE
QUERY_ID RESULT
QUERY_ID RESULT
Caching de Resultados
Queries repetidas em menos de 1 segundo
Como funciona:
Result
cache
Caching libera recursos no cluster, melhorando
a performance de todas as queries
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Caching de Resultados
Queries repetidas em menos de 1 segundo
• Clientes do Amazon Redshift podem agora servir 35% mais queries em
média, usando os mesmos recursos computacionais
• Dezenas de milhares de horas de computação foram liberadas diariamente
para servir outras queries ou ingestão de dados
• Transparente – Simplesmente Funciona!
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Mais lançamentos…
• Dentro dos últimos meses, nós adicionamos suporte para
• Queries de leitura dentro de um bloco transacional
• Funcões definidas por usuário baseadas SQL-based
• Cursor queries
• Prepared statements
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Melhorias no Commit
Ingestão e inserção de dados 16% mais rápidos
Commits de dados para cluster sobrecarregados 40% mais rápidos
Nov Dec Jan Feb Mar
Total Commit Time by Month
ds2.8xlarge, cluster size: 10 and up, us-west-2
Clusters with more than 90 backups a day
p99 p95 p90 p50 Linear (p99)
-50%
-30%
-30%
-20%
Commit Duration Per Transaction for Busy Clusters
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Ingestão de Arquivos Parquet e ORC (Novo)
• Parquet
• Avro
• Json
• TXT
• ORC
• CSV
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Melhorias no Redshift Spectrum
• Disponível em 14 Regiões da AWS
• Adicionado suporte para processamento de formatos de arquivo
escalares JSON e ION no Amazon S3
• Avro, CSV, Grok, ION, JSON, ORC, Parquet, RCFile, RegexSerDe,
SequenceFile, TextFile, e TSV
• Suporte para IAM role-chaining para assumir cross-account roles
• Expande os data lakes para departamentos diferentes e para uso de
serviços diferentes
• Suporte para tipos de dados DATE
• Melhorias de Performance
• Push down to Spectrum CASE, IS [NOT] NULL, Coalesce, *TRIM,
regex, ++, date/timestamp filters
• Melhor load balancing entre nós de computação
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Dados Aninhados (em breve)
• Analise de dados aninhados e semi-estruturados no Amazon S3 com o
Spectrum
• Permite fácil ETL de dados aninhados para o Amazon Redshift usando CTAS
• Supporte para formatos de arquivos abertos: Parquet, ORC, JSON, Ion, e
AVRO
• Uso de notação de ponto para exteder seu SQL existente
s3data.clickStream: <<
{ “session_time”: “20171013 14:05:00”,
“clicks”: [ {“page”: “/home”, “referrer”: “”},
{“page”: “/products”, “referrer”: “/home”} ]
},
{ “session_time”: “20171013 14:06:00”,
“clicks”: [ {“page”: “/contact”, “referrer”: “/home”} ]
} >>
SELECT c.page,
COUNT(*) AS count
FROM s3data.clickStream s,
s.clicks c
WHERE s.session_time > ‘2017-10-01 00:00:00’
AND c.referrer = “/home”
GROUP BY c.page;
Exemplo: Pesquise a frequência de clicks para os links em “/home”:
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Dados Aninhados (em breve)
Aumento de performance das queries através da análise de dados aninhados
OrderID CustomerID OrderTime ShipMode
5 23 10.00 12.50
8 32 1.00 5.60
OrdersWithItems
ItemID Quantity Price
23 10.00 12.50
16 1.00 1.99
32 1.00 5.60
24 5.00 26.50
OrderItems
OrderID ItemID Quantity Price
5 23 10.00 12.50
8 32 1.00 5.60
5 16 1.00 1.99
8 24 5.00 26.50
OrderID CustomerID OrderTime ShipMode
5 23 10.00 12.50
8 32 1.00 5.60
Orders
OrderItems
Para melhorar a
performance das
queries, a nova
tabela Orders inclue
OrdersWithItems
como uma coluna
aninhada,
eliminando o
processamento do
join
“Os serviços da AWS tornaram
nossas soluções mais dinâmicas,
trazendo um leque de
possibilidades para alvancar o
negocio.”
**fontes: https://ecommercenews.com.br/noticias/balancos/dafiti-group-cresce-221-em-q4-2017/
https://exame.abril.com.br/negocios/por-dentro-da-dafiti-em-sao-paulo-e-jundiai/
Dafiti Group e-commerce com três marcas:
• Dafiti
• Kanui
• Tricae
Presente em 4 países:
• Brasil
• Argentina
• Chile
• Colômbia
Maior e-commerce de moda e lifestyle da América Latina**
O SPECTRUM PERMITIU
POTENCIALIZAR O PODER DE
PROCESSAMENTO DO
REDSHIFT, REDUZINDO O
CUSTO PARA DISPONIBIZAR OS
DADOS PARA TODAS AS
ÁREAS DE NEGÓCIO.
• Diminuir o custo com Redshift.
• Retirar o rawdata do Redshift.
• Ampliação do uso para novas áreas do negócio.
• Plataforma com custo reduzido.
SOLUÇÃO
Databases APIS Demais fontes
Redshift Data Warehouse
Internal ApplicationsData Visualization Tools
EC2 ETL – In-House SolutionData Lake S3 (RAWDATA)
ORC/PARQUET
Amazon
Athena
Amazon
EMR
Alta disponibilidade e confiabilidade
Escalável de acordo com a demanda
Alta performance
Ótimo custo benefício
Rapidez na implantação
• Migração de DC1 para DC2, ganho de 2x mais throughput.
• Média de queries Executadas no Redshift por Dia 54.600
• Média de queries Executadas usando o Spectrum por Dia 9.500
• Quantidade de Tabelas Externas (Spectrum) 2.554
• Quantidade de Tabelas Internas (Redshift) 3.560
• Tamanho do Database do Redshift 7.9TB
• Tamanho do Data Lake S3 8.4TB
• Quantidade Total de Objetos Data Lake S3 868.943
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Sumário
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Mais informações: https://aws.amazon.com/redshift/
Experimente o Amazon Redshift
Faça uma Prova de Conceito
Leia os blog posts sobre o Amazon Redshift:
https://aws.amazon.com/redshift/blog-posts/
Comece com o Amazon Redshift
Amazon
Redshift
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Obrigado!
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Por favor preencha a avaliação desta sessão
no aplicativo mobile do summit.
Submeta Feedback para a Sessão
1. Tap the Schedule icon. 2. Select the session
you attended.
3. Tap Session Evaluation
to submit your feedback.

Mais conteúdo relacionado

Mais procurados

Otimizando Amazon EC2 por Diversão e Lucro
Otimizando Amazon EC2 por Diversão e LucroOtimizando Amazon EC2 por Diversão e Lucro
Otimizando Amazon EC2 por Diversão e Lucro
Amazon Web Services LATAM
 
Desenvolvimento de Aplicações em Container com AWS Fargate
Desenvolvimento de Aplicações em Container com AWS FargateDesenvolvimento de Aplicações em Container com AWS Fargate
Desenvolvimento de Aplicações em Container com AWS Fargate
Amazon Web Services LATAM
 
Criando Aplicações Serverless
Criando Aplicações ServerlessCriando Aplicações Serverless
Criando Aplicações Serverless
Amazon Web Services LATAM
 
Construindo Data Lakes e Analytics na AWS
Construindo Data Lakes e Analytics na AWSConstruindo Data Lakes e Analytics na AWS
Construindo Data Lakes e Analytics na AWS
Amazon Web Services LATAM
 
Segurança - 10 regras que você deve saber antes de migrar sua infraestrutura ...
Segurança - 10 regras que você deve saber antes de migrar sua infraestrutura ...Segurança - 10 regras que você deve saber antes de migrar sua infraestrutura ...
Segurança - 10 regras que você deve saber antes de migrar sua infraestrutura ...
Amazon Web Services LATAM
 
Criando o seu Data Center Virtual: Fundamentos de VPC e Opções de Conectivida...
Criando o seu Data Center Virtual: Fundamentos de VPC e Opções de Conectivida...Criando o seu Data Center Virtual: Fundamentos de VPC e Opções de Conectivida...
Criando o seu Data Center Virtual: Fundamentos de VPC e Opções de Conectivida...
Amazon Web Services
 
Desenvolvimento de Aplicações em Container com AWS Fargate - DEV302 - Sao Pa...
Desenvolvimento de Aplicações em Container com AWS Fargate -  DEV302 - Sao Pa...Desenvolvimento de Aplicações em Container com AWS Fargate -  DEV302 - Sao Pa...
Desenvolvimento de Aplicações em Container com AWS Fargate - DEV302 - Sao Pa...
Amazon Web Services
 
Do monolítico a sem servidor com a Dynatrace - DEM06 - Sao Paulo Summit
Do monolítico a sem servidor com a Dynatrace -  DEM06 - Sao Paulo SummitDo monolítico a sem servidor com a Dynatrace -  DEM06 - Sao Paulo Summit
Do monolítico a sem servidor com a Dynatrace - DEM06 - Sao Paulo Summit
Amazon Web Services
 
Liberte-se dos bancos de dados comerciais para economizar, crescer e inovar
Liberte-se dos bancos de dados comerciais para economizar, crescer e inovarLiberte-se dos bancos de dados comerciais para economizar, crescer e inovar
Liberte-se dos bancos de dados comerciais para economizar, crescer e inovar
Amazon Web Services LATAM
 
É Tudo sobre Dados - ARC202 - Sao Paulo Summit
É Tudo sobre Dados -  ARC202 - Sao Paulo SummitÉ Tudo sobre Dados -  ARC202 - Sao Paulo Summit
É Tudo sobre Dados - ARC202 - Sao Paulo Summit
Amazon Web Services
 
Construindo um data lake na nuvem aws
Construindo um data lake na nuvem awsConstruindo um data lake na nuvem aws
Construindo um data lake na nuvem aws
Amazon Web Services LATAM
 
Migre seus Desktops e Apps para a AWS com Amazon WorkSpaces e AppStream 2 - ...
Migre seus Desktops e Apps para a AWS com Amazon WorkSpaces e AppStream 2 -  ...Migre seus Desktops e Apps para a AWS com Amazon WorkSpaces e AppStream 2 -  ...
Migre seus Desktops e Apps para a AWS com Amazon WorkSpaces e AppStream 2 - ...
Amazon Web Services
 
Sem medo de sair do monolito para o sem servidor com Dynatrace - DEM10 - Sao...
Sem medo de sair do monolito para o sem servidor com Dynatrace -  DEM10 - Sao...Sem medo de sair do monolito para o sem servidor com Dynatrace -  DEM10 - Sao...
Sem medo de sair do monolito para o sem servidor com Dynatrace - DEM10 - Sao...
Amazon Web Services
 
Componentes de IoT: Dos Dispositivos de Borda a Análise de Dados na Nuvem
Componentes de IoT: Dos Dispositivos de Borda a Análise de Dados na NuvemComponentes de IoT: Dos Dispositivos de Borda a Análise de Dados na Nuvem
Componentes de IoT: Dos Dispositivos de Borda a Análise de Dados na Nuvem
Amazon Web Services LATAM
 
Sessão Avançada: Otimizando Bancos de Dados Relacionais na AWS com Amazon RDS...
Sessão Avançada: Otimizando Bancos de Dados Relacionais na AWS com Amazon RDS...Sessão Avançada: Otimizando Bancos de Dados Relacionais na AWS com Amazon RDS...
Sessão Avançada: Otimizando Bancos de Dados Relacionais na AWS com Amazon RDS...
Amazon Web Services
 
DevOps na AWS: Construindo Sistemas para Entregas Rápidas
DevOps na AWS: Construindo Sistemas para Entregas RápidasDevOps na AWS: Construindo Sistemas para Entregas Rápidas
DevOps na AWS: Construindo Sistemas para Entregas Rápidas
Amazon Web Services LATAM
 
AWS Database Day - Português
AWS Database Day - PortuguêsAWS Database Day - Português
AWS Database Day - Português
Amazon Web Services LATAM
 
Escalando do Zero aos seus Primeiros 10 Milhões de Usuários - ARC203 - Sao P...
Escalando do Zero aos seus Primeiros 10 Milhões de Usuários -  ARC203 - Sao P...Escalando do Zero aos seus Primeiros 10 Milhões de Usuários -  ARC203 - Sao P...
Escalando do Zero aos seus Primeiros 10 Milhões de Usuários - ARC203 - Sao P...
Amazon Web Services
 
Detecção e Mitigação de Ameaças - SID301 - Sao Paulo Summit
Detecção e Mitigação de Ameaças -  SID301 - Sao Paulo SummitDetecção e Mitigação de Ameaças -  SID301 - Sao Paulo Summit
Detecção e Mitigação de Ameaças - SID301 - Sao Paulo Summit
Amazon Web Services
 
SAP HANA na AWS: Por que migrar para a nuvem? - ENT301 - Sao Paulo Summit
SAP HANA na AWS: Por que migrar para a nuvem? -  ENT301 - Sao Paulo SummitSAP HANA na AWS: Por que migrar para a nuvem? -  ENT301 - Sao Paulo Summit
SAP HANA na AWS: Por que migrar para a nuvem? - ENT301 - Sao Paulo Summit
Amazon Web Services
 

Mais procurados (20)

Otimizando Amazon EC2 por Diversão e Lucro
Otimizando Amazon EC2 por Diversão e LucroOtimizando Amazon EC2 por Diversão e Lucro
Otimizando Amazon EC2 por Diversão e Lucro
 
Desenvolvimento de Aplicações em Container com AWS Fargate
Desenvolvimento de Aplicações em Container com AWS FargateDesenvolvimento de Aplicações em Container com AWS Fargate
Desenvolvimento de Aplicações em Container com AWS Fargate
 
Criando Aplicações Serverless
Criando Aplicações ServerlessCriando Aplicações Serverless
Criando Aplicações Serverless
 
Construindo Data Lakes e Analytics na AWS
Construindo Data Lakes e Analytics na AWSConstruindo Data Lakes e Analytics na AWS
Construindo Data Lakes e Analytics na AWS
 
Segurança - 10 regras que você deve saber antes de migrar sua infraestrutura ...
Segurança - 10 regras que você deve saber antes de migrar sua infraestrutura ...Segurança - 10 regras que você deve saber antes de migrar sua infraestrutura ...
Segurança - 10 regras que você deve saber antes de migrar sua infraestrutura ...
 
Criando o seu Data Center Virtual: Fundamentos de VPC e Opções de Conectivida...
Criando o seu Data Center Virtual: Fundamentos de VPC e Opções de Conectivida...Criando o seu Data Center Virtual: Fundamentos de VPC e Opções de Conectivida...
Criando o seu Data Center Virtual: Fundamentos de VPC e Opções de Conectivida...
 
Desenvolvimento de Aplicações em Container com AWS Fargate - DEV302 - Sao Pa...
Desenvolvimento de Aplicações em Container com AWS Fargate -  DEV302 - Sao Pa...Desenvolvimento de Aplicações em Container com AWS Fargate -  DEV302 - Sao Pa...
Desenvolvimento de Aplicações em Container com AWS Fargate - DEV302 - Sao Pa...
 
Do monolítico a sem servidor com a Dynatrace - DEM06 - Sao Paulo Summit
Do monolítico a sem servidor com a Dynatrace -  DEM06 - Sao Paulo SummitDo monolítico a sem servidor com a Dynatrace -  DEM06 - Sao Paulo Summit
Do monolítico a sem servidor com a Dynatrace - DEM06 - Sao Paulo Summit
 
Liberte-se dos bancos de dados comerciais para economizar, crescer e inovar
Liberte-se dos bancos de dados comerciais para economizar, crescer e inovarLiberte-se dos bancos de dados comerciais para economizar, crescer e inovar
Liberte-se dos bancos de dados comerciais para economizar, crescer e inovar
 
É Tudo sobre Dados - ARC202 - Sao Paulo Summit
É Tudo sobre Dados -  ARC202 - Sao Paulo SummitÉ Tudo sobre Dados -  ARC202 - Sao Paulo Summit
É Tudo sobre Dados - ARC202 - Sao Paulo Summit
 
Construindo um data lake na nuvem aws
Construindo um data lake na nuvem awsConstruindo um data lake na nuvem aws
Construindo um data lake na nuvem aws
 
Migre seus Desktops e Apps para a AWS com Amazon WorkSpaces e AppStream 2 - ...
Migre seus Desktops e Apps para a AWS com Amazon WorkSpaces e AppStream 2 -  ...Migre seus Desktops e Apps para a AWS com Amazon WorkSpaces e AppStream 2 -  ...
Migre seus Desktops e Apps para a AWS com Amazon WorkSpaces e AppStream 2 - ...
 
Sem medo de sair do monolito para o sem servidor com Dynatrace - DEM10 - Sao...
Sem medo de sair do monolito para o sem servidor com Dynatrace -  DEM10 - Sao...Sem medo de sair do monolito para o sem servidor com Dynatrace -  DEM10 - Sao...
Sem medo de sair do monolito para o sem servidor com Dynatrace - DEM10 - Sao...
 
Componentes de IoT: Dos Dispositivos de Borda a Análise de Dados na Nuvem
Componentes de IoT: Dos Dispositivos de Borda a Análise de Dados na NuvemComponentes de IoT: Dos Dispositivos de Borda a Análise de Dados na Nuvem
Componentes de IoT: Dos Dispositivos de Borda a Análise de Dados na Nuvem
 
Sessão Avançada: Otimizando Bancos de Dados Relacionais na AWS com Amazon RDS...
Sessão Avançada: Otimizando Bancos de Dados Relacionais na AWS com Amazon RDS...Sessão Avançada: Otimizando Bancos de Dados Relacionais na AWS com Amazon RDS...
Sessão Avançada: Otimizando Bancos de Dados Relacionais na AWS com Amazon RDS...
 
DevOps na AWS: Construindo Sistemas para Entregas Rápidas
DevOps na AWS: Construindo Sistemas para Entregas RápidasDevOps na AWS: Construindo Sistemas para Entregas Rápidas
DevOps na AWS: Construindo Sistemas para Entregas Rápidas
 
AWS Database Day - Português
AWS Database Day - PortuguêsAWS Database Day - Português
AWS Database Day - Português
 
Escalando do Zero aos seus Primeiros 10 Milhões de Usuários - ARC203 - Sao P...
Escalando do Zero aos seus Primeiros 10 Milhões de Usuários -  ARC203 - Sao P...Escalando do Zero aos seus Primeiros 10 Milhões de Usuários -  ARC203 - Sao P...
Escalando do Zero aos seus Primeiros 10 Milhões de Usuários - ARC203 - Sao P...
 
Detecção e Mitigação de Ameaças - SID301 - Sao Paulo Summit
Detecção e Mitigação de Ameaças -  SID301 - Sao Paulo SummitDetecção e Mitigação de Ameaças -  SID301 - Sao Paulo Summit
Detecção e Mitigação de Ameaças - SID301 - Sao Paulo Summit
 
SAP HANA na AWS: Por que migrar para a nuvem? - ENT301 - Sao Paulo Summit
SAP HANA na AWS: Por que migrar para a nuvem? -  ENT301 - Sao Paulo SummitSAP HANA na AWS: Por que migrar para a nuvem? -  ENT301 - Sao Paulo Summit
SAP HANA na AWS: Por que migrar para a nuvem? - ENT301 - Sao Paulo Summit
 

Semelhante a Sessão Avançada: Construindo um Data Warehouse Moderno com Amazon Redshift - BDA302 - Sao Paulo Summit

AWS Initiate - Construindo Data Lakes e Analytics com AWS
AWS Initiate - Construindo Data Lakes e Analytics com AWSAWS Initiate - Construindo Data Lakes e Analytics com AWS
AWS Initiate - Construindo Data Lakes e Analytics com AWS
Amazon Web Services LATAM
 
Data Lakes - EBC on the road Brazil Edition [Portuguese]
Data Lakes - EBC on the road Brazil Edition [Portuguese]Data Lakes - EBC on the road Brazil Edition [Portuguese]
Data Lakes - EBC on the road Brazil Edition [Portuguese]
Amazon Web Services
 
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
Amazon Web Services LATAM
 
Porque ir para a Nuvem e escolher a Amazon Web Services
Porque ir para a Nuvem e escolher a Amazon Web ServicesPorque ir para a Nuvem e escolher a Amazon Web Services
Porque ir para a Nuvem e escolher a Amazon Web Services
Amazon Web Services LATAM
 
Tendências de Big Data
Tendências de Big DataTendências de Big Data
Tendências de Big Data
Amazon Web Services LATAM
 
Tendências de Big Data
Tendências de Big DataTendências de Big Data
Tendências de Big Data
Amazon Web Services LATAM
 
Tendências de Big Data
Tendências de Big DataTendências de Big Data
Tendências de Big Data
Amazon Web Services LATAM
 
Path to the Future #1 - Tendências de Big Data
Path to the Future #1 - Tendências de Big DataPath to the Future #1 - Tendências de Big Data
Path to the Future #1 - Tendências de Big Data
Amazon Web Services LATAM
 
Microsoft Workloads em Amazon Web Services
Microsoft Workloads em Amazon Web ServicesMicrosoft Workloads em Amazon Web Services
Microsoft Workloads em Amazon Web Services
Amazon Web Services LATAM
 
[Webinar] AWS Storage Day - Português
[Webinar] AWS Storage Day - Português[Webinar] AWS Storage Day - Português
[Webinar] AWS Storage Day - Português
Amazon Web Services LATAM
 
AWS Innovate 2020 - Entenda como o Data Flywheel pode apoiá-lo em sua estraté...
AWS Innovate 2020 - Entenda como o Data Flywheel pode apoiá-lo em sua estraté...AWS Innovate 2020 - Entenda como o Data Flywheel pode apoiá-lo em sua estraté...
AWS Innovate 2020 - Entenda como o Data Flywheel pode apoiá-lo em sua estraté...
Amazon Web Services LATAM
 
Arquiteturas de Software para o Século XXI
Arquiteturas de Software para o Século XXIArquiteturas de Software para o Século XXI
Arquiteturas de Software para o Século XXI
Amazon Web Services LATAM
 
Big Data na Nuvem
Big Data na NuvemBig Data na Nuvem
Big Data na Nuvem
Amazon Web Services LATAM
 
Keynote AWS RoadShow Porto Alegre 2013
Keynote AWS RoadShow Porto Alegre 2013Keynote AWS RoadShow Porto Alegre 2013
Keynote AWS RoadShow Porto Alegre 2013
Amazon Web Services LATAM
 
Performing real-time ETL into data lakes - ADB202 - São Paulo AWS Summit
Performing real-time ETL into data lakes - ADB202 - São Paulo AWS SummitPerforming real-time ETL into data lakes - ADB202 - São Paulo AWS Summit
Performing real-time ETL into data lakes - ADB202 - São Paulo AWS Summit
Amazon Web Services
 
Keynote - Sao Paulo Summit - 2015 - Teresa Carlson
Keynote - Sao Paulo Summit - 2015 - Teresa CarlsonKeynote - Sao Paulo Summit - 2015 - Teresa Carlson
Keynote - Sao Paulo Summit - 2015 - Teresa Carlson
Amazon Web Services LATAM
 
Aws summit arquitetura big data-v1.2
Aws summit arquitetura big data-v1.2Aws summit arquitetura big data-v1.2
Aws summit arquitetura big data-v1.2
Amazon Web Services LATAM
 
Bancos de Dados gerenciados na nuvem AWS
Bancos de Dados gerenciados na nuvem AWSBancos de Dados gerenciados na nuvem AWS
Bancos de Dados gerenciados na nuvem AWS
Amazon Web Services LATAM
 
Os benefícios de migrar seus workloads de Big Data para a AWS
Os benefícios de migrar seus workloads de Big Data para a AWSOs benefícios de migrar seus workloads de Big Data para a AWS
Os benefícios de migrar seus workloads de Big Data para a AWS
Amazon Web Services LATAM
 
Webinar - Inicie sua jornada de migração para nuvem com a AWS (Português)
Webinar - Inicie sua jornada de migração para nuvem com a AWS (Português)Webinar - Inicie sua jornada de migração para nuvem com a AWS (Português)
Webinar - Inicie sua jornada de migração para nuvem com a AWS (Português)
Amazon Web Services LATAM
 

Semelhante a Sessão Avançada: Construindo um Data Warehouse Moderno com Amazon Redshift - BDA302 - Sao Paulo Summit (20)

AWS Initiate - Construindo Data Lakes e Analytics com AWS
AWS Initiate - Construindo Data Lakes e Analytics com AWSAWS Initiate - Construindo Data Lakes e Analytics com AWS
AWS Initiate - Construindo Data Lakes e Analytics com AWS
 
Data Lakes - EBC on the road Brazil Edition [Portuguese]
Data Lakes - EBC on the road Brazil Edition [Portuguese]Data Lakes - EBC on the road Brazil Edition [Portuguese]
Data Lakes - EBC on the road Brazil Edition [Portuguese]
 
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
 
Porque ir para a Nuvem e escolher a Amazon Web Services
Porque ir para a Nuvem e escolher a Amazon Web ServicesPorque ir para a Nuvem e escolher a Amazon Web Services
Porque ir para a Nuvem e escolher a Amazon Web Services
 
Tendências de Big Data
Tendências de Big DataTendências de Big Data
Tendências de Big Data
 
Tendências de Big Data
Tendências de Big DataTendências de Big Data
Tendências de Big Data
 
Tendências de Big Data
Tendências de Big DataTendências de Big Data
Tendências de Big Data
 
Path to the Future #1 - Tendências de Big Data
Path to the Future #1 - Tendências de Big DataPath to the Future #1 - Tendências de Big Data
Path to the Future #1 - Tendências de Big Data
 
Microsoft Workloads em Amazon Web Services
Microsoft Workloads em Amazon Web ServicesMicrosoft Workloads em Amazon Web Services
Microsoft Workloads em Amazon Web Services
 
[Webinar] AWS Storage Day - Português
[Webinar] AWS Storage Day - Português[Webinar] AWS Storage Day - Português
[Webinar] AWS Storage Day - Português
 
AWS Innovate 2020 - Entenda como o Data Flywheel pode apoiá-lo em sua estraté...
AWS Innovate 2020 - Entenda como o Data Flywheel pode apoiá-lo em sua estraté...AWS Innovate 2020 - Entenda como o Data Flywheel pode apoiá-lo em sua estraté...
AWS Innovate 2020 - Entenda como o Data Flywheel pode apoiá-lo em sua estraté...
 
Arquiteturas de Software para o Século XXI
Arquiteturas de Software para o Século XXIArquiteturas de Software para o Século XXI
Arquiteturas de Software para o Século XXI
 
Big Data na Nuvem
Big Data na NuvemBig Data na Nuvem
Big Data na Nuvem
 
Keynote AWS RoadShow Porto Alegre 2013
Keynote AWS RoadShow Porto Alegre 2013Keynote AWS RoadShow Porto Alegre 2013
Keynote AWS RoadShow Porto Alegre 2013
 
Performing real-time ETL into data lakes - ADB202 - São Paulo AWS Summit
Performing real-time ETL into data lakes - ADB202 - São Paulo AWS SummitPerforming real-time ETL into data lakes - ADB202 - São Paulo AWS Summit
Performing real-time ETL into data lakes - ADB202 - São Paulo AWS Summit
 
Keynote - Sao Paulo Summit - 2015 - Teresa Carlson
Keynote - Sao Paulo Summit - 2015 - Teresa CarlsonKeynote - Sao Paulo Summit - 2015 - Teresa Carlson
Keynote - Sao Paulo Summit - 2015 - Teresa Carlson
 
Aws summit arquitetura big data-v1.2
Aws summit arquitetura big data-v1.2Aws summit arquitetura big data-v1.2
Aws summit arquitetura big data-v1.2
 
Bancos de Dados gerenciados na nuvem AWS
Bancos de Dados gerenciados na nuvem AWSBancos de Dados gerenciados na nuvem AWS
Bancos de Dados gerenciados na nuvem AWS
 
Os benefícios de migrar seus workloads de Big Data para a AWS
Os benefícios de migrar seus workloads de Big Data para a AWSOs benefícios de migrar seus workloads de Big Data para a AWS
Os benefícios de migrar seus workloads de Big Data para a AWS
 
Webinar - Inicie sua jornada de migração para nuvem com a AWS (Português)
Webinar - Inicie sua jornada de migração para nuvem com a AWS (Português)Webinar - Inicie sua jornada de migração para nuvem com a AWS (Português)
Webinar - Inicie sua jornada de migração para nuvem com a AWS (Português)
 

Mais de Amazon Web Services

Come costruire servizi di Forecasting sfruttando algoritmi di ML e deep learn...
Come costruire servizi di Forecasting sfruttando algoritmi di ML e deep learn...Come costruire servizi di Forecasting sfruttando algoritmi di ML e deep learn...
Come costruire servizi di Forecasting sfruttando algoritmi di ML e deep learn...
Amazon Web Services
 
Big Data per le Startup: come creare applicazioni Big Data in modalità Server...
Big Data per le Startup: come creare applicazioni Big Data in modalità Server...Big Data per le Startup: come creare applicazioni Big Data in modalità Server...
Big Data per le Startup: come creare applicazioni Big Data in modalità Server...
Amazon Web Services
 
Esegui pod serverless con Amazon EKS e AWS Fargate
Esegui pod serverless con Amazon EKS e AWS FargateEsegui pod serverless con Amazon EKS e AWS Fargate
Esegui pod serverless con Amazon EKS e AWS Fargate
Amazon Web Services
 
Costruire Applicazioni Moderne con AWS
Costruire Applicazioni Moderne con AWSCostruire Applicazioni Moderne con AWS
Costruire Applicazioni Moderne con AWS
Amazon Web Services
 
Come spendere fino al 90% in meno con i container e le istanze spot
Come spendere fino al 90% in meno con i container e le istanze spot Come spendere fino al 90% in meno con i container e le istanze spot
Come spendere fino al 90% in meno con i container e le istanze spot
Amazon Web Services
 
Open banking as a service
Open banking as a serviceOpen banking as a service
Open banking as a service
Amazon Web Services
 
Rendi unica l’offerta della tua startup sul mercato con i servizi Machine Lea...
Rendi unica l’offerta della tua startup sul mercato con i servizi Machine Lea...Rendi unica l’offerta della tua startup sul mercato con i servizi Machine Lea...
Rendi unica l’offerta della tua startup sul mercato con i servizi Machine Lea...
Amazon Web Services
 
OpsWorks Configuration Management: automatizza la gestione e i deployment del...
OpsWorks Configuration Management: automatizza la gestione e i deployment del...OpsWorks Configuration Management: automatizza la gestione e i deployment del...
OpsWorks Configuration Management: automatizza la gestione e i deployment del...
Amazon Web Services
 
Microsoft Active Directory su AWS per supportare i tuoi Windows Workloads
Microsoft Active Directory su AWS per supportare i tuoi Windows WorkloadsMicrosoft Active Directory su AWS per supportare i tuoi Windows Workloads
Microsoft Active Directory su AWS per supportare i tuoi Windows Workloads
Amazon Web Services
 
Computer Vision con AWS
Computer Vision con AWSComputer Vision con AWS
Computer Vision con AWS
Amazon Web Services
 
Database Oracle e VMware Cloud on AWS i miti da sfatare
Database Oracle e VMware Cloud on AWS i miti da sfatareDatabase Oracle e VMware Cloud on AWS i miti da sfatare
Database Oracle e VMware Cloud on AWS i miti da sfatare
Amazon Web Services
 
Crea la tua prima serverless ledger-based app con QLDB e NodeJS
Crea la tua prima serverless ledger-based app con QLDB e NodeJSCrea la tua prima serverless ledger-based app con QLDB e NodeJS
Crea la tua prima serverless ledger-based app con QLDB e NodeJS
Amazon Web Services
 
API moderne real-time per applicazioni mobili e web
API moderne real-time per applicazioni mobili e webAPI moderne real-time per applicazioni mobili e web
API moderne real-time per applicazioni mobili e web
Amazon Web Services
 
Database Oracle e VMware Cloud™ on AWS: i miti da sfatare
Database Oracle e VMware Cloud™ on AWS: i miti da sfatareDatabase Oracle e VMware Cloud™ on AWS: i miti da sfatare
Database Oracle e VMware Cloud™ on AWS: i miti da sfatare
Amazon Web Services
 
Tools for building your MVP on AWS
Tools for building your MVP on AWSTools for building your MVP on AWS
Tools for building your MVP on AWS
Amazon Web Services
 
How to Build a Winning Pitch Deck
How to Build a Winning Pitch DeckHow to Build a Winning Pitch Deck
How to Build a Winning Pitch Deck
Amazon Web Services
 
Building a web application without servers
Building a web application without serversBuilding a web application without servers
Building a web application without servers
Amazon Web Services
 
Fundraising Essentials
Fundraising EssentialsFundraising Essentials
Fundraising Essentials
Amazon Web Services
 
AWS_HK_StartupDay_Building Interactive websites while automating for efficien...
AWS_HK_StartupDay_Building Interactive websites while automating for efficien...AWS_HK_StartupDay_Building Interactive websites while automating for efficien...
AWS_HK_StartupDay_Building Interactive websites while automating for efficien...
Amazon Web Services
 
Introduzione a Amazon Elastic Container Service
Introduzione a Amazon Elastic Container ServiceIntroduzione a Amazon Elastic Container Service
Introduzione a Amazon Elastic Container Service
Amazon Web Services
 

Mais de Amazon Web Services (20)

Come costruire servizi di Forecasting sfruttando algoritmi di ML e deep learn...
Come costruire servizi di Forecasting sfruttando algoritmi di ML e deep learn...Come costruire servizi di Forecasting sfruttando algoritmi di ML e deep learn...
Come costruire servizi di Forecasting sfruttando algoritmi di ML e deep learn...
 
Big Data per le Startup: come creare applicazioni Big Data in modalità Server...
Big Data per le Startup: come creare applicazioni Big Data in modalità Server...Big Data per le Startup: come creare applicazioni Big Data in modalità Server...
Big Data per le Startup: come creare applicazioni Big Data in modalità Server...
 
Esegui pod serverless con Amazon EKS e AWS Fargate
Esegui pod serverless con Amazon EKS e AWS FargateEsegui pod serverless con Amazon EKS e AWS Fargate
Esegui pod serverless con Amazon EKS e AWS Fargate
 
Costruire Applicazioni Moderne con AWS
Costruire Applicazioni Moderne con AWSCostruire Applicazioni Moderne con AWS
Costruire Applicazioni Moderne con AWS
 
Come spendere fino al 90% in meno con i container e le istanze spot
Come spendere fino al 90% in meno con i container e le istanze spot Come spendere fino al 90% in meno con i container e le istanze spot
Come spendere fino al 90% in meno con i container e le istanze spot
 
Open banking as a service
Open banking as a serviceOpen banking as a service
Open banking as a service
 
Rendi unica l’offerta della tua startup sul mercato con i servizi Machine Lea...
Rendi unica l’offerta della tua startup sul mercato con i servizi Machine Lea...Rendi unica l’offerta della tua startup sul mercato con i servizi Machine Lea...
Rendi unica l’offerta della tua startup sul mercato con i servizi Machine Lea...
 
OpsWorks Configuration Management: automatizza la gestione e i deployment del...
OpsWorks Configuration Management: automatizza la gestione e i deployment del...OpsWorks Configuration Management: automatizza la gestione e i deployment del...
OpsWorks Configuration Management: automatizza la gestione e i deployment del...
 
Microsoft Active Directory su AWS per supportare i tuoi Windows Workloads
Microsoft Active Directory su AWS per supportare i tuoi Windows WorkloadsMicrosoft Active Directory su AWS per supportare i tuoi Windows Workloads
Microsoft Active Directory su AWS per supportare i tuoi Windows Workloads
 
Computer Vision con AWS
Computer Vision con AWSComputer Vision con AWS
Computer Vision con AWS
 
Database Oracle e VMware Cloud on AWS i miti da sfatare
Database Oracle e VMware Cloud on AWS i miti da sfatareDatabase Oracle e VMware Cloud on AWS i miti da sfatare
Database Oracle e VMware Cloud on AWS i miti da sfatare
 
Crea la tua prima serverless ledger-based app con QLDB e NodeJS
Crea la tua prima serverless ledger-based app con QLDB e NodeJSCrea la tua prima serverless ledger-based app con QLDB e NodeJS
Crea la tua prima serverless ledger-based app con QLDB e NodeJS
 
API moderne real-time per applicazioni mobili e web
API moderne real-time per applicazioni mobili e webAPI moderne real-time per applicazioni mobili e web
API moderne real-time per applicazioni mobili e web
 
Database Oracle e VMware Cloud™ on AWS: i miti da sfatare
Database Oracle e VMware Cloud™ on AWS: i miti da sfatareDatabase Oracle e VMware Cloud™ on AWS: i miti da sfatare
Database Oracle e VMware Cloud™ on AWS: i miti da sfatare
 
Tools for building your MVP on AWS
Tools for building your MVP on AWSTools for building your MVP on AWS
Tools for building your MVP on AWS
 
How to Build a Winning Pitch Deck
How to Build a Winning Pitch DeckHow to Build a Winning Pitch Deck
How to Build a Winning Pitch Deck
 
Building a web application without servers
Building a web application without serversBuilding a web application without servers
Building a web application without servers
 
Fundraising Essentials
Fundraising EssentialsFundraising Essentials
Fundraising Essentials
 
AWS_HK_StartupDay_Building Interactive websites while automating for efficien...
AWS_HK_StartupDay_Building Interactive websites while automating for efficien...AWS_HK_StartupDay_Building Interactive websites while automating for efficien...
AWS_HK_StartupDay_Building Interactive websites while automating for efficien...
 
Introduzione a Amazon Elastic Container Service
Introduzione a Amazon Elastic Container ServiceIntroduzione a Amazon Elastic Container Service
Introduzione a Amazon Elastic Container Service
 

Sessão Avançada: Construindo um Data Warehouse Moderno com Amazon Redshift - BDA302 - Sao Paulo Summit

  • 1. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Angelo Carvalho Principal Solutions Architect BDA302 Construindo um Data Warehouse moderno: Deep Dive no Amazon Redshift Felipe Duarte Coordenador de DW/BI
  • 2. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Introdução Amazon Web Services Visão Geral do Amazon Redshift Funcionalidades recém lançadas e futuras Cliente: Dafiti Group Agenda
  • 3. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Arquitetura de Analytics na AWS Ingestão Armazenament o Análise Amazon Kinesis Data Firehose AWS Direct Connect Amazon Snowball Amazon Kinesis Data Analytics Amazon Kinesis Data Streams Amazon S3 Amazon Glacier Amazon CloudSearch Amazon RDS, Amazon Aurora Amazon DynamoDB Amazon ES Amazon EMR Amazon Redshift Amazon QuickSight AWS Database Migration Service AWS Glue Amazon Athena Amazon AI
  • 4. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Amazon Redshift 10x mais rápido a 1/10 do custo Rápido Entrega resultados rápidos para todos os tipos de workloads Custo-benefício Sem custos custos iniciais, começe pequeno, e pague o que utilizar Integrado Seguro Audite tudo, criptografe os dados de ponta a ponta, certificação e compliance extensivo Integrado com data lakes no Amazon S3, serviços AWS, e ferramentas de terceiros $ Simples Crie e comece a usar um data warehouse em minutos Escalável Gigabytes a petabytes, a exabytes
  • 5. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Redshift Spectrum Extenda o data warehouse para o seu data lake no Amazon S3 Escale computação e storage separadamente Cruze dados entre o Amazon Redshift e Amazon S3 Amazon Redshift SQL pesquisa exabytes de dados no Amazon S3 Performance de queries estável e concorrência ilimitada Formatos: Parquet, ORC, Grok, Avro, & CSV Pague somente de acordo com a quantidade de dados processados Amazon S3 data lake Amazon Redshift data Redshift Spectrum query engine
  • 6. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Amazon Redshift JDBC/ODBC ... 1 2 3 4 N Amazon S3 Storage de objetos em escala de Exabytes AWS Glue Catálogo de Dados Amazon Redshift Spectrum Computação serverless com escalabilidade horizontal Query SELECT COUNT(*) FROM S3.EXT_TABLE GROUP BY … Arquitetura do Amazon Redshift
  • 7. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Amazon Redshift possui Self-Healing Prevê e remedia discos degradados, nós, cluster e problemas de rede Garante a performance geral do cluster e das queries Amazon S3 Region 1 Region 2 Amazon S3 Compute node Compute node Compute node
  • 8. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Milhares de Organizações Executam Workloads de Missão Crítica no Amazon Redshift
  • 9. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. The Forrester Wave™ is copyrighted by Forrester Research, Inc. Forrester and Forrester Wave™ are trademarks of Forrester Research, Inc. The Forrester Wave™ is a graphical representation of Forrester's call on a market and is plotted using a detailed spreadsheet with exposed scores, weightings, and comments. Forrester does not endorse any vendor, product, or service depicted in the Forrester Wave. Information is based on best available resources. Opinions reflect judgment at the time and are subject to change. “Amazon Redshift tem a maior adoção de BDW na nuvem.” “Com mais de 5.000 deployments, Amazon Redshift tem o maior deployment de data warehouse na nuvem – alguns acima de 10 petabytes em tamanho.” AWS recebeu um score de 5/5 (o maior score possível) em: base de clientes, market awareness, habilidade para executar, road map, suporte, e partners Forrester Wave Big Data Warehouse Q2 2017
  • 10. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Amazon Redshift está disponível Globalmente Ireland Frankfurt London Beijing Mumbai Seoul Singapore Sydney Tokyo Sao Paulo US East – N Virginia US East – Ohio US West – Oregon US West – N California AWS GovCloud (US) Canada – Central, Montreal
  • 11. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Parceiros Selecionados Amazon Redshift Data Integration Systems IntegratorsBusiness Intelligence
  • 12. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Funcionalidades Lançadas Recentemente
  • 13. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Customer Comments “We have terabytes of event data coming from our websites and applications to Amazon S3 and then to Amazon Redshift in near real time. Amazon Redshift is at the core of our operations and used by our marketing automation tools,” said Jarno Kartela, Head of Analytics and Chief Data Scientist, DNA. “We can now run queries in half the time.” “Amazon Redshift allows us to quickly spin up clusters and provide our data scientists with a fast and easy method to access data and generate insights,” said Bradley Todd, Liberty Mutual’s Technology Architect. “We saw a 9x reduction in month-end reporting time with Amazon Redshift DC2 nodes as compared to DC1." “We use Redshift Spectrum for interactive online queries,” said Hyung-Joon Kim, Principle Software Engineer, BrandVerity. "The new DC2 node from Amazon Redshift has given us a 70 percent performance boost for running Redshift Spectrum queries. As a result, we can analyze far more data for our customers and deliver results much faster."
  • 14. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Dense Compute Nodes (DC2) 2x a performance pelo mesmo preço das DC1 3x mais I/O com 30% melhor utilização do storage que a DC1 “O novo nó DC2 do Amazon Redshift está entregando 100 por cento de aumento de performance, nos permitindo fornecer insights mais rápidos para os nossos varejistas, com melhor custo benefício, para gerar receita incremental." NVMe SSD Memória DDR4 Intel E5-2686 v4 (Broadwell)
  • 15. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Aceleração para Queries rápidas Via Expressa para Queries rápidas • Queries curtas não ficam presas entre queries longas • Maior throughput – Menos variabilidade • Se adapta ao seu workload • Transparente – simplesmente funciona! Tempo Médio de Espera na Fila para Queries Curtas (<1 sec.)
  • 16. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Aceleração para Queries rápidas Via Expressa para Queries rápidas • Machine learning prevê o tempo de execução das queries • Queries rápidas são roteadas para uma fila expressa • SQA Elástico: Recursos dinamicamente dedicados para servir um burst de queries curtas • Habilite hoje no seu console de gerenciamento AWS Como funciona: Analytics e BI / Ferramentas e Dashboards Amazon Redshift Machine Learning Classifier Machine learning
  • 17. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. BI / Dashboard tools Analytics and Amazon Redshift Queries vão para o nó lider1 Se o cache contém o resultado da query, o valor é retornado 2 Se o resultado não está no cache, ele é então executado, e o resultado é cacheado 3 RESULTS CACHE QUERY_ID RESULT QUERY_ID RESULT Caching de Resultados Queries repetidas em menos de 1 segundo Como funciona: Result cache Caching libera recursos no cluster, melhorando a performance de todas as queries
  • 18. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Caching de Resultados Queries repetidas em menos de 1 segundo • Clientes do Amazon Redshift podem agora servir 35% mais queries em média, usando os mesmos recursos computacionais • Dezenas de milhares de horas de computação foram liberadas diariamente para servir outras queries ou ingestão de dados • Transparente – Simplesmente Funciona!
  • 19. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Mais lançamentos… • Dentro dos últimos meses, nós adicionamos suporte para • Queries de leitura dentro de um bloco transacional • Funcões definidas por usuário baseadas SQL-based • Cursor queries • Prepared statements
  • 20. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Melhorias no Commit Ingestão e inserção de dados 16% mais rápidos Commits de dados para cluster sobrecarregados 40% mais rápidos Nov Dec Jan Feb Mar Total Commit Time by Month ds2.8xlarge, cluster size: 10 and up, us-west-2 Clusters with more than 90 backups a day p99 p95 p90 p50 Linear (p99) -50% -30% -30% -20% Commit Duration Per Transaction for Busy Clusters
  • 21. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Ingestão de Arquivos Parquet e ORC (Novo) • Parquet • Avro • Json • TXT • ORC • CSV
  • 22. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Melhorias no Redshift Spectrum • Disponível em 14 Regiões da AWS • Adicionado suporte para processamento de formatos de arquivo escalares JSON e ION no Amazon S3 • Avro, CSV, Grok, ION, JSON, ORC, Parquet, RCFile, RegexSerDe, SequenceFile, TextFile, e TSV • Suporte para IAM role-chaining para assumir cross-account roles • Expande os data lakes para departamentos diferentes e para uso de serviços diferentes • Suporte para tipos de dados DATE • Melhorias de Performance • Push down to Spectrum CASE, IS [NOT] NULL, Coalesce, *TRIM, regex, ++, date/timestamp filters • Melhor load balancing entre nós de computação
  • 23. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Dados Aninhados (em breve) • Analise de dados aninhados e semi-estruturados no Amazon S3 com o Spectrum • Permite fácil ETL de dados aninhados para o Amazon Redshift usando CTAS • Supporte para formatos de arquivos abertos: Parquet, ORC, JSON, Ion, e AVRO • Uso de notação de ponto para exteder seu SQL existente s3data.clickStream: << { “session_time”: “20171013 14:05:00”, “clicks”: [ {“page”: “/home”, “referrer”: “”}, {“page”: “/products”, “referrer”: “/home”} ] }, { “session_time”: “20171013 14:06:00”, “clicks”: [ {“page”: “/contact”, “referrer”: “/home”} ] } >> SELECT c.page, COUNT(*) AS count FROM s3data.clickStream s, s.clicks c WHERE s.session_time > ‘2017-10-01 00:00:00’ AND c.referrer = “/home” GROUP BY c.page; Exemplo: Pesquise a frequência de clicks para os links em “/home”:
  • 24. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Dados Aninhados (em breve) Aumento de performance das queries através da análise de dados aninhados OrderID CustomerID OrderTime ShipMode 5 23 10.00 12.50 8 32 1.00 5.60 OrdersWithItems ItemID Quantity Price 23 10.00 12.50 16 1.00 1.99 32 1.00 5.60 24 5.00 26.50 OrderItems OrderID ItemID Quantity Price 5 23 10.00 12.50 8 32 1.00 5.60 5 16 1.00 1.99 8 24 5.00 26.50 OrderID CustomerID OrderTime ShipMode 5 23 10.00 12.50 8 32 1.00 5.60 Orders OrderItems Para melhorar a performance das queries, a nova tabela Orders inclue OrdersWithItems como uma coluna aninhada, eliminando o processamento do join
  • 25. “Os serviços da AWS tornaram nossas soluções mais dinâmicas, trazendo um leque de possibilidades para alvancar o negocio.” **fontes: https://ecommercenews.com.br/noticias/balancos/dafiti-group-cresce-221-em-q4-2017/ https://exame.abril.com.br/negocios/por-dentro-da-dafiti-em-sao-paulo-e-jundiai/ Dafiti Group e-commerce com três marcas: • Dafiti • Kanui • Tricae Presente em 4 países: • Brasil • Argentina • Chile • Colômbia Maior e-commerce de moda e lifestyle da América Latina** O SPECTRUM PERMITIU POTENCIALIZAR O PODER DE PROCESSAMENTO DO REDSHIFT, REDUZINDO O CUSTO PARA DISPONIBIZAR OS DADOS PARA TODAS AS ÁREAS DE NEGÓCIO.
  • 26. • Diminuir o custo com Redshift. • Retirar o rawdata do Redshift. • Ampliação do uso para novas áreas do negócio. • Plataforma com custo reduzido.
  • 27. SOLUÇÃO Databases APIS Demais fontes Redshift Data Warehouse Internal ApplicationsData Visualization Tools EC2 ETL – In-House SolutionData Lake S3 (RAWDATA) ORC/PARQUET Amazon Athena Amazon EMR Alta disponibilidade e confiabilidade Escalável de acordo com a demanda Alta performance Ótimo custo benefício Rapidez na implantação
  • 28. • Migração de DC1 para DC2, ganho de 2x mais throughput. • Média de queries Executadas no Redshift por Dia 54.600 • Média de queries Executadas usando o Spectrum por Dia 9.500 • Quantidade de Tabelas Externas (Spectrum) 2.554 • Quantidade de Tabelas Internas (Redshift) 3.560 • Tamanho do Database do Redshift 7.9TB • Tamanho do Data Lake S3 8.4TB • Quantidade Total de Objetos Data Lake S3 868.943
  • 29. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Sumário
  • 30. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Mais informações: https://aws.amazon.com/redshift/ Experimente o Amazon Redshift Faça uma Prova de Conceito Leia os blog posts sobre o Amazon Redshift: https://aws.amazon.com/redshift/blog-posts/ Comece com o Amazon Redshift Amazon Redshift
  • 31. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Obrigado!
  • 32. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Por favor preencha a avaliação desta sessão no aplicativo mobile do summit.
  • 33. Submeta Feedback para a Sessão 1. Tap the Schedule icon. 2. Select the session you attended. 3. Tap Session Evaluation to submit your feedback.