Empresas podem usar a nuvem da AWS para possibilitar backups e uma rápida recuperação de desastres (DR) para aplicações críticas, reduzindo gastos de infraestrutura e sem a necessidade de um segundo datacenter. A nuvem da AWS permite que arquiteturas de TI sejam elaboradas de maneira que, no caso de um desastre, recursos sejam rapidamente iniciados para garantir a estabilidade dos serviços e a continuidade do negócio, bem como a recuperação de backups previamente efetuados. Nesse sentido, é importante destacarmos os serviços AWS e os componentes relevantes que podem ser utilizados para os processos de recuperação de desastres e backup. Também é interessante mostrarmos exemplos de cenários sobre como se recuperar de um desastre, além de recomendações de como melhorar o plano de DR e alavancar o potencial da AWS para arquiteturas de recuperação de desastres.
Apresentação de Rodolfo Dantas no evento "Usando a nuvem AWS para Backup e Disaster Recovery", realizado no dia 13 de fevereiro no Rio de Janeiro e em 20 de fevereiro em São Paulo.
2. Agenda
Sobre a Concrete Solutions
Motivação. Por que usar AWS?
Backup da AWS
Disaster Recovery na AWS
POC Storage Gateway para o Banco Opportunity
Mesa redonda: perguntas e respostas
1
3. Concrete Solutions
Primeiro parceiro AWS na América Latina
Colocamos mais de 50 clientes na nuvem da Amazon AWS desde 2009
Possuímos as maiores certificações junto à AWS:
2
5. Por que usar a AWS?
Baixo custo
Elasticidade instantânea
Flexibilidade
Múltiplas localizações
Segurança
4
6. Diferenças de DR na AWS
Produção:
Routers
Firewalls
IP Network
Application Licenses
Operating Systems
Hypervisor
Servers
Storage Network
Primary Storage
Backup SW
Backup Tapes
Tape Silos
Archive SW
Archive Storage
DR Site (AWS):
Routers
Firewalls
IP Network
Application Licenses
Operating Systems
Hypervisor
Servers
Storage Network
Snapshot Storage
Backup SW
Backup Tapes
Tape Silos
Archive SW
Archive Storage
5
7. AWS: Modelo de custos diferente
Ability to scale –
no arbitrary time
limit to failback
Infrastructure Cost
Cost savings w/
AWS
2nd Site
Cost
AWS Cost
Demand
Test
Test
Failover
6
Failback
Time
15. Restore utilizando o S3
Amazon
EC2
Instance
Instance Quickly
provisioned from
AMI
Data copied from
objects in S3
Data
Volume
AMI
Amazon
S3 Bucket
Pre-bundled with
OS and
applications
Availability Zone
AWS Region
14
22. O meu backup deve ser e estar seguro!
SSL Endpoints (Amazon S3 e Amazon Glacier)
Chamadas de API assinadas
Arquivos armazenados com criptografia
Server-side encryption (AES-256)
Durabilidade: múltiplas cópias em data centers distintos
Permissões com IAM: Usuários, Grupos, Perfis
Logs
Local/Cloud com AWS Storage Gateway
21
24. Disaster Recovery – Termos comuns
RTO: Real Time Objective
Duração e nível de serviço dentro de um processo de negócio que precisa
ser restaurado após um desastre, a fim de evitar consequências inaceitáveis.
Exemplo: 4 horas
RPO: Recovery Point Objecive
Quantidade de perda de dados medida em tempo.
Exemplo: Se o RPO é de 1 hora, para um desastre que ocorreu ao meio-dia a
recuperação deverá conter todos os dados até antes das 11h00.
23
29. Arquiteturas para DR:
Pronto para subir
User or system
Web
Server
Amazon Route 53
Not Running
Application
Server
Application
Server
Database
Server
Web
Server
Database
Server
Data Mirroring/
Replication
Smaller Instance
Data
Volume
Data
Volume
28
30. Arquiteturas para DR:
Pronto para subir
User or system
Web
Server
Amazon Route 53
Not Running
Application
Server
Application
Server
Database
Server
Web
Server
Database
Server
Data Mirroring/
Replication
Smaller Instance
Data
Volume
Data
Volume
29
31. Arquiteturas para DR:
Pronto para subir
User or system
Web
Server
Amazon Route 53
Start in minutes
Application
Server
Application
Server
Database
Server
Web
Server
Database
Server
Data Mirroring/
Replication
Resize as desired
Data
Volume
Data
Volume
30
32. Arquiteturas para DR:
Pronto para subir
Vantagens:
Baixo custo com poucos componentes ativos
Preparação:
Habilitar a replicação dos dados criticos para a AWS
Preparar todos os componentes para iniciar automaticamente (AMIs,
configuração de rede, Load Balancer, etc)
31
33. Arquiteturas para DR:
Pronto para subir
Em caso de desastre:
Iniciar os recursos e dimensioná-los para atender a demanda de produção
Ajustar os registros de DNS apontando para a AWS
Objetivos:
RTO: tempo necessário para detectar a necessidade de DR e
automaticamente ampliar o sistema para a substituição
RPO: depende do tipo de replicação
32
34. Arquiteturas para DR:
Totalmente ativo com capacidade reduzida
User or system
Web
Server
Amazon Route 53
Application
Server
Application
Server
Database
Server
Web
Server
Database
Server
Data Mirroring/
Replication
Data
Volume
Data
Volume
33
Low capacity
35. Arquiteturas para DR:
Totalmente ativo com capacidade reduzida
User or system
Web
Server
Amazon Route 53
Application
Server
Application
Server
Database
Server
Web
Server
Database
Server
Data Mirroring/
Replication
Data
Volume
Data
Volume
34
Low capacity
36. Arquiteturas para DR:
Totalmente ativo com capacidade reduzida
User or system
Web
Server
Amazon Route 53
Application
Server
Application
Server
Database
Server
Web
Server
Database
Server
Data Mirroring/
Replication
Data
Volume
Data
Volume
35
Grow capacity
37. Arquiteturas para DR:
Totalmente ativo com capacidade reduzida
Vantagens:
Pode funcionar como parte do ambiente de produção
Baixo custo pois o ambiente de DR é reduzido
Preparação:
Similar ao anterior
Todos os componentes necessários rodando 24x7
Testes contínuos para garantir a integridade do ambiente de DR
36
38. Arquiteturas para DR:
Totalmente ativo com capacidade reduzida
Em caso de desastre:
O ambiente já está rodando e imediatamente é utilizado
(Auto) Dimensionar o ambiente para atender a demanda de produção
Objetivos:
RTO: tempo necessário para o failover
RPO: depende do tipo de replicação
37
39. Arquiteturas para DR:
Totalmente ativo com capacidade normal
User or system
Web
Server
Amazon Route 53
Application
Server
Application
Server
Database
Server
Web
Server
Database
Server
Data Mirroring/
Replication
Data
Volume
Data
Volume
38
Fullcapacity
40. Testar o DR também é importante!
Dev/test na nuvem é muito mais fácil
Crie capacidade apenas para o teste e desative tudo depois
Teste regularmente seu plano de DR e o restore do Backup
Custo é mínimo na AWS
39
41. Vantagens de utilizar Backup e DR na AWS
Infraestrutura disponível quando você precisar
Múltiplas localizações no mundo
Controle sobre custos x RTO / RPO
Capacidade de ampliar, quando necessário
Sem dor de cabeça de aprovisionamento de infraestrutura física
Várias opções disponíveis. Não exige aprovisionamento de
infraestrutura duplicada
Pague apenas o que você usa
40