O documento discute estratégias de recuperação de desastres (Disaster Recovery) utilizando serviços da AWS. Ele explica o que é Disaster Recovery e planos de recuperação, como começar a planejar uma estratégia, e técnicas como backup e restore, piloto leve e hot standby que podem ser implementadas na nuvem para melhorar a continuidade dos negócios.
5. Disaster Recovery na
AWS: Introdução
O que é Disaster Recovery?
Processo que utiliza ferramentas
e serviços diversos para
restaurar rapidamente a
funcionalidade dos sistemas em
caso de interrupções e falhas,
garantindo a continuidade e a
integridade de dados.
O que é um plano de DR?
Conjunto documentado de
procedimentos e instruções para
responder e se recuperar
rapidamente destes incidentes. O
objetivo do plano é minimizar o
tempo de inatividade e a perda
de dados, garantindo a
continuidade dos negócios.
6. Por que planos de Disaster Recovery
falham?
• Falta de testes: podemos ter planos que não foram testados e que possuem falhas na
prática, o que prejudica a eficiência.
• Recuperação complexa: toda recuperação tem um caminho e um conjunto de atividades
para realização. Muitas vezes, o caminho é longo e os procedimentos são numerosos.
• Falta de recursos disponíveis: ambientes com limitação de escalabilidade
dificultam uma recuperação de sucesso.
• Planos obsoletos: um plano de recuperação funcional deve ser atualizado de acordo
com as mudanças nos ambientes. É comum que ambientes sejam atualizados sem
mudanças nos planos, o que torna a recuperação arriscada.
7. Como começar a planejar a estratégia de
Disaster Recovery?
Conheça os componentes da
infraestrutura:
Armazenamento Computação Redes e
Conectividade
Banco de
Dados
Template de
Infraestrutura
8. Como começar a planejar a estratégia de
Disaster Recovery?
Conheça o RTO e RPO da
estrutura:
Data loss Downtime
Recovery point objective
(RPO)
Com que frequência os dados
precisam ser copiados para
backup?
Time
Recovery time objective
(RTO)
Por quanto tempo o aplicativo
pode ficar indisponível?
Disaster
10. Disaster Recovery na AWS
Maior RPO / RTO
Casos de uso:
menor
prioridade
Menor RPO / RTO
Casos de uso:
escalabilidade
controlada para
eventos de desastre
RPO / RTO de
minutos
Casos de uso:
serviços críticos
ao negócio
RPO / RTO de
maior prioridade
Casos de uso:
failover
automático em
tempo real
$ $$ $$$ $$$$
RPO-RTO:
horas
RPO-RTO:
10s de minutos
RPO-RTO:
minutos
RPO-RTO:
tempo real
Low High
Backup and restore Pilot light Warm standby in AWS Hot multi-site standby
11. Principais técnicas: Backup &
Restore
Apps
Backup
Database
Nativo em Cloud
EC2
AWS Cloud
RDS Dynamo
DB EBS
On-premises
Servidores
Corporate data
center
Applianc
e de
Backup
Storage
Híbrido
Storage
Corporate data
center
Servidores
Storage
Gateway
AWS Backup
Overview
14. Principais técnicas: Pilot
Light
Serviço AWS: Elastic Disaster
Recovery
Replicação segura de dados de ambiente
on-premises para AWS
• Cópia de discos para área de staging
e preparação para eventos de
desastre
Monitoramento da replicação e execução
periódica de sessões de recuperação
Recuperação para ransomware: lançamento
de versões de sistema anteriores ao
ataque de ransomware (destravadas /
descriptografadas)
16. Proteção de dados: quais são as maiores
ameaças?
Ameaça Como mitigar?
Comprometimento
da integridade
dos dados
Controle de identidades e acessos
Criptografia em repouso e criptografia em trânsito
Versionamento de dados
Deleção acidental
Controle de identidades e acessos
Versionamento de dados
Perda de dados em
evento de
desastre
Replicação
Backups
Estratégia de DR
17. Proteção de dados: criptografia
Criptografia em repouso
AWS Key Management Service
• Criação, controle e gerenciamento de
chaves de criptografia
• Rotação e configurações de chaves de
criptografia
• Ambiente centralizado
18. Proteção de dados: criptografia
Criptografia em
trânsito
AWS Certificate Manager
• Provisionamento, gerenciamento e
implantação de certificados SSL/TLS
• Implantação de certificados públicos e
privados
• Controle e automatização do
gerenciamento e renovação