SlideShare uma empresa Scribd logo
1 de 18
Baixar para ler offline
P O S T G R E S + A Z U R E
M A R C E L O
K R Ü G E R
D A T A I N T E G R A T I O N
T E A M
TRANSFORMANDO DIFICULDADES EM OPORTUNIDADES
A P R E S E N T A Ç Ã O
FORMAÇÃO  Ciências da Computação - UNIVALI/SJ
VIDA
PROFISSIONAL
Digitro Tecnologia: Integração de Dados e DBA (Oracle,
DB2 e PostgreSQL)
Cassol Centerlar: DBA Oracle
Neoway: Especialista de Dados e DBA PostgreSQL
PUBLICAÇÕES Efficient Execution of Conjunctive Complex Queries on
Big Multimedia Databases (Co-autor)
Baquara: A Holistic Ontological Framework for
Movement Analysis with Linked Data (Co-autor)
Fragmentação, caracterização e recuperação de
imagens em bases de dados Oracle (Autor)
N E O W A Y
100% Big Data
Fornecer soluções que vão além de exibir dados, mas sim gerar
informação e conhecimento para tomada de decisão
Não ser mais do mesmo, ser DIFERENTE!
B I G D A T A
Grande Volume de Dados, estruturados e não estruturados, oriundos de diversas fontes
=
Gerar conhecimento para auxiliar na tomada de decisão
B I G D A T A
 Dados                                   Conhecimento
Para isso, é necessário equipes e processos
=
Recursos de Hardware cada vez maiores
CPU / Memória / Disco / Estruturas de Redundância
D A T A C E N T E R F Í S I C O
Com o aumento no volume de dados armazenados é demandado mais
recursos de hardware
Como expandir de forma rápida, com menor custo, em um servidor
físico?
Adquirir + CPU, Memória, Discos, Storages, Servidores?
Quando custa em termos financeiros, e de pessoas, atualizar e manter
esta estrutura sempre em crescimento?
Pesquisa feita pela consultoria Gartner
com executivos de TI de dez países,
inclusive o Brasil, mostra que 44%
apontam a redução de custos como a
principal razão para contratar serviços
de cloud. Exame, 2015
C L O U D C O M P U T I N G
Principais Vantagens
Redução de Custos;
Escalabilidade;
Aumento da disponibilidade;
Atualização e manutenção de hardwares;
Acesso facilitado sem necessidade de ativos de redes;
Caso Neoway
Migrando PostgreSQL
entre nuvens
C E N Á R I O
 Estrutura na Amazon AWS
CPU: Intel(R) Xeon(R) CPU E5-2670 (32 núcleos)
Memória: 250 GB
Discos: 11 discos SSD
Linux: CentOS Linux release 7.3.1611 (Core)
Arquitetura: 64 Bits
Banco de Dados: PostgreSQL Versão 9.5.6
Schemas do banco de dados divididos entre os diversos discos
(Tablespaces)
RAIDs de 4 a 6 discos
O B A N C O D E D A D O S
PostgreSQL Versão 9.5.6
Tamanho de 13,50 TB
Média de 1000 sessões abertas
Média de 600 GB de alteração diária
D I F I C U L D A D E S
Reduzir downtime durante a migração (Ambiente sem replicação);
Garantir a integridade de uma base com mais de 13TB;
Migrar da versão 9.5 para a versão 9.6;
Criar uma arquitetura com melhor performance que o banco na AWS;
Possibilitar um backup periódico do banco de dados sem afetar os
usuários que utilizam o banco de dados;
Aumentar a disponibilidade do bancos de dados, visto maturidade da
Azure frente a AWS.
A M I G R A Ç Ã O
Migração dos dados através de um PGDUMP - 12 Horas
Envio do backup para a S3 - 4 Horas
Download do backup da S3 para a Azure - 3 horas
Restauração do dump na Azure - 18 Horas
Ativação da Replicação - 12 Horas
Tempo total de migração para a Azure: 49 Horas
P R O B L E M A S P Ó S M I G R A Ç Ã O
Lentidão nas operações de consulta e inserção.
Processo de ETL que executava em 7 horas na AWS, passando a
executar em 28 horas.
Replicação com alto delay
Banco de dados replicado não aplicando as alterações vindas da
produção sem gerar delay. Mais de 800GB de alterações não aplicadas,
mais de 2 dias de diferença de dados entre os bancos.
P R O B L E M A S P Ó S M I G R A Ç Ã O
M E L H O R I A S A P L I C A D A S
Ativação da cache de disco no painel da Azure
Com a ativação da cache o iowait foi reduzido consideravelmente, e
melhorado o tempo das consultas e operações no banco de dados.
Query de ETL na Azure executando em 5 Horas. Antes na AWS em 7
horas
Entender a complexidade do cenário presente na Neoway
Compreender o volume de dados gerados e alterados pelas equipes
que utilizam o banco, e otimizar diversos parâmetros presentes no
Postgres
T E S T E S , T E S T E S E T E S T E S
Para evitar os problemas encontrados na migração é importante
Simular carga de dados no banco de dados
Execução de operações que elevem o lag de replicação
Simular concorrência entre demais processos e o banco de dados
O B R I G A D O !
M A R C E L O . K R U G E R @ N E O W A Y . C O M . B R

Mais conteúdo relacionado

Semelhante a Postgres + Azure = Transformando dificuldades em oportunidades

L'esprit de l'escalier
L'esprit de l'escalierL'esprit de l'escalier
L'esprit de l'escalierGleicon Moraes
 
NoSQL x SQL: Bancos de Dados em Nuvens Computacionais
NoSQL x SQL: Bancos de Dados em Nuvens ComputacionaisNoSQL x SQL: Bancos de Dados em Nuvens Computacionais
NoSQL x SQL: Bancos de Dados em Nuvens ComputacionaisCarlo Pires
 
Pangea - Plataforma digital com Google Cloud Platform
Pangea - Plataforma digital com Google Cloud PlatformPangea - Plataforma digital com Google Cloud Platform
Pangea - Plataforma digital com Google Cloud PlatformAndré Paulovich
 
Como escolher qual banco de dados utilizar?
Como escolher qual banco de dados utilizar?Como escolher qual banco de dados utilizar?
Como escolher qual banco de dados utilizar?Felipe Santos
 
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
[DTC21] Lucas Gomes - Do 0 ao 100 no Big DataDeep Tech Brasil
 
Expremendo performance do sql server
Expremendo performance do sql serverExpremendo performance do sql server
Expremendo performance do sql serverFelipe Ferreira
 
TechEd 2010: Escalando aplicações OLTP:Design de aplicação e considerações pa...
TechEd 2010: Escalando aplicações OLTP:Design de aplicação e considerações pa...TechEd 2010: Escalando aplicações OLTP:Design de aplicação e considerações pa...
TechEd 2010: Escalando aplicações OLTP:Design de aplicação e considerações pa...Fabrício Catae
 
Introdução à computação na nuvem e Windows Azure
Introdução à computação na nuvem e Windows AzureIntrodução à computação na nuvem e Windows Azure
Introdução à computação na nuvem e Windows AzureGiovanni Bassi
 
Bancos de dados open source
Bancos de dados open sourceBancos de dados open source
Bancos de dados open sourceRodrigo Aurélio
 
8-motivações-empresariais-em-prol-da-migração-para-a-nuvem.pdf
8-motivações-empresariais-em-prol-da-migração-para-a-nuvem.pdf8-motivações-empresariais-em-prol-da-migração-para-a-nuvem.pdf
8-motivações-empresariais-em-prol-da-migração-para-a-nuvem.pdfRicardo Carneiro
 
QConSP16 - Apache Cassandra Evoluindo Sistemas Distribuídos
QConSP16 - Apache Cassandra Evoluindo Sistemas DistribuídosQConSP16 - Apache Cassandra Evoluindo Sistemas Distribuídos
QConSP16 - Apache Cassandra Evoluindo Sistemas DistribuídosEiti Kimura
 
Azure SQL DataWarehouse
Azure SQL DataWarehouseAzure SQL DataWarehouse
Azure SQL DataWarehouseVitor Fava
 

Semelhante a Postgres + Azure = Transformando dificuldades em oportunidades (20)

L'esprit de l'escalier
L'esprit de l'escalierL'esprit de l'escalier
L'esprit de l'escalier
 
NoSQL x SQL: Bancos de Dados em Nuvens Computacionais
NoSQL x SQL: Bancos de Dados em Nuvens ComputacionaisNoSQL x SQL: Bancos de Dados em Nuvens Computacionais
NoSQL x SQL: Bancos de Dados em Nuvens Computacionais
 
Pangea - Plataforma digital com Google Cloud Platform
Pangea - Plataforma digital com Google Cloud PlatformPangea - Plataforma digital com Google Cloud Platform
Pangea - Plataforma digital com Google Cloud Platform
 
Como escolher qual banco de dados utilizar?
Como escolher qual banco de dados utilizar?Como escolher qual banco de dados utilizar?
Como escolher qual banco de dados utilizar?
 
TechEd_OFC302
TechEd_OFC302TechEd_OFC302
TechEd_OFC302
 
Bi ferramentas olap 1
Bi   ferramentas olap 1Bi   ferramentas olap 1
Bi ferramentas olap 1
 
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
 
Big Data na Nuvem
Big Data na NuvemBig Data na Nuvem
Big Data na Nuvem
 
Expremendo performance do sql server
Expremendo performance do sql serverExpremendo performance do sql server
Expremendo performance do sql server
 
TechEd 2010: Escalando aplicações OLTP:Design de aplicação e considerações pa...
TechEd 2010: Escalando aplicações OLTP:Design de aplicação e considerações pa...TechEd 2010: Escalando aplicações OLTP:Design de aplicação e considerações pa...
TechEd 2010: Escalando aplicações OLTP:Design de aplicação e considerações pa...
 
TDC - Planejando data Lake com big data clusters
TDC - Planejando data Lake com big data clustersTDC - Planejando data Lake com big data clusters
TDC - Planejando data Lake com big data clusters
 
Introdução à computação na nuvem e Windows Azure
Introdução à computação na nuvem e Windows AzureIntrodução à computação na nuvem e Windows Azure
Introdução à computação na nuvem e Windows Azure
 
Bancos de Dados no Azure - Arquiteturas
Bancos de Dados no Azure - ArquiteturasBancos de Dados no Azure - Arquiteturas
Bancos de Dados no Azure - Arquiteturas
 
Bancos de dados open source
Bancos de dados open sourceBancos de dados open source
Bancos de dados open source
 
8-motivações-empresariais-em-prol-da-migração-para-a-nuvem.pdf
8-motivações-empresariais-em-prol-da-migração-para-a-nuvem.pdf8-motivações-empresariais-em-prol-da-migração-para-a-nuvem.pdf
8-motivações-empresariais-em-prol-da-migração-para-a-nuvem.pdf
 
Qcon Rio 2015 - Data Lakes Workshop
Qcon Rio 2015 - Data Lakes WorkshopQcon Rio 2015 - Data Lakes Workshop
Qcon Rio 2015 - Data Lakes Workshop
 
Data Lakes com Hadoop e Spark: Agile Analytics na prática
Data Lakes com Hadoop e Spark: Agile Analytics na práticaData Lakes com Hadoop e Spark: Agile Analytics na prática
Data Lakes com Hadoop e Spark: Agile Analytics na prática
 
QConSP16 - Apache Cassandra Evoluindo Sistemas Distribuídos
QConSP16 - Apache Cassandra Evoluindo Sistemas DistribuídosQConSP16 - Apache Cassandra Evoluindo Sistemas Distribuídos
QConSP16 - Apache Cassandra Evoluindo Sistemas Distribuídos
 
Azure SQL DataWarehouse
Azure SQL DataWarehouseAzure SQL DataWarehouse
Azure SQL DataWarehouse
 
Agenda CMG Brasil 2014
Agenda CMG Brasil 2014Agenda CMG Brasil 2014
Agenda CMG Brasil 2014
 

Postgres + Azure = Transformando dificuldades em oportunidades

  • 1. P O S T G R E S + A Z U R E M A R C E L O K R Ü G E R D A T A I N T E G R A T I O N T E A M TRANSFORMANDO DIFICULDADES EM OPORTUNIDADES
  • 2. A P R E S E N T A Ç Ã O FORMAÇÃO  Ciências da Computação - UNIVALI/SJ VIDA PROFISSIONAL Digitro Tecnologia: Integração de Dados e DBA (Oracle, DB2 e PostgreSQL) Cassol Centerlar: DBA Oracle Neoway: Especialista de Dados e DBA PostgreSQL PUBLICAÇÕES Efficient Execution of Conjunctive Complex Queries on Big Multimedia Databases (Co-autor) Baquara: A Holistic Ontological Framework for Movement Analysis with Linked Data (Co-autor) Fragmentação, caracterização e recuperação de imagens em bases de dados Oracle (Autor)
  • 3. N E O W A Y 100% Big Data Fornecer soluções que vão além de exibir dados, mas sim gerar informação e conhecimento para tomada de decisão Não ser mais do mesmo, ser DIFERENTE!
  • 4. B I G D A T A Grande Volume de Dados, estruturados e não estruturados, oriundos de diversas fontes = Gerar conhecimento para auxiliar na tomada de decisão
  • 5. B I G D A T A  Dados                                   Conhecimento Para isso, é necessário equipes e processos = Recursos de Hardware cada vez maiores CPU / Memória / Disco / Estruturas de Redundância
  • 6. D A T A C E N T E R F Í S I C O Com o aumento no volume de dados armazenados é demandado mais recursos de hardware Como expandir de forma rápida, com menor custo, em um servidor físico? Adquirir + CPU, Memória, Discos, Storages, Servidores? Quando custa em termos financeiros, e de pessoas, atualizar e manter esta estrutura sempre em crescimento?
  • 7. Pesquisa feita pela consultoria Gartner com executivos de TI de dez países, inclusive o Brasil, mostra que 44% apontam a redução de custos como a principal razão para contratar serviços de cloud. Exame, 2015
  • 8. C L O U D C O M P U T I N G Principais Vantagens Redução de Custos; Escalabilidade; Aumento da disponibilidade; Atualização e manutenção de hardwares; Acesso facilitado sem necessidade de ativos de redes;
  • 10. C E N Á R I O  Estrutura na Amazon AWS CPU: Intel(R) Xeon(R) CPU E5-2670 (32 núcleos) Memória: 250 GB Discos: 11 discos SSD Linux: CentOS Linux release 7.3.1611 (Core) Arquitetura: 64 Bits Banco de Dados: PostgreSQL Versão 9.5.6 Schemas do banco de dados divididos entre os diversos discos (Tablespaces) RAIDs de 4 a 6 discos
  • 11. O B A N C O D E D A D O S PostgreSQL Versão 9.5.6 Tamanho de 13,50 TB Média de 1000 sessões abertas Média de 600 GB de alteração diária
  • 12. D I F I C U L D A D E S Reduzir downtime durante a migração (Ambiente sem replicação); Garantir a integridade de uma base com mais de 13TB; Migrar da versão 9.5 para a versão 9.6; Criar uma arquitetura com melhor performance que o banco na AWS; Possibilitar um backup periódico do banco de dados sem afetar os usuários que utilizam o banco de dados; Aumentar a disponibilidade do bancos de dados, visto maturidade da Azure frente a AWS.
  • 13. A M I G R A Ç Ã O Migração dos dados através de um PGDUMP - 12 Horas Envio do backup para a S3 - 4 Horas Download do backup da S3 para a Azure - 3 horas Restauração do dump na Azure - 18 Horas Ativação da Replicação - 12 Horas Tempo total de migração para a Azure: 49 Horas
  • 14. P R O B L E M A S P Ó S M I G R A Ç Ã O Lentidão nas operações de consulta e inserção. Processo de ETL que executava em 7 horas na AWS, passando a executar em 28 horas. Replicação com alto delay Banco de dados replicado não aplicando as alterações vindas da produção sem gerar delay. Mais de 800GB de alterações não aplicadas, mais de 2 dias de diferença de dados entre os bancos.
  • 15. P R O B L E M A S P Ó S M I G R A Ç Ã O
  • 16. M E L H O R I A S A P L I C A D A S Ativação da cache de disco no painel da Azure Com a ativação da cache o iowait foi reduzido consideravelmente, e melhorado o tempo das consultas e operações no banco de dados. Query de ETL na Azure executando em 5 Horas. Antes na AWS em 7 horas Entender a complexidade do cenário presente na Neoway Compreender o volume de dados gerados e alterados pelas equipes que utilizam o banco, e otimizar diversos parâmetros presentes no Postgres
  • 17. T E S T E S , T E S T E S E T E S T E S Para evitar os problemas encontrados na migração é importante Simular carga de dados no banco de dados Execução de operações que elevem o lag de replicação Simular concorrência entre demais processos e o banco de dados
  • 18. O B R I G A D O ! M A R C E L O . K R U G E R @ N E O W A Y . C O M . B R