17. Design for Failure and Resilience
障害を避けるだけでなく、障害が発生した時
に対応するための仕組みが重要
Data Backup
データの破損や削除に備えて、以前の正常な状態に復旧する
High Availability
障害時にもダウンタイムを極小化し、システムが健全な状態で継続
稼働することを目的とする
Disaster Recovery
広域災害においても迅速なシステムを復旧し、業務継続・サービス
提供することを目的とする
17
Original Backup
Primary site
Secondary site
Primary site
41. Azure Storage の冗長性
41
読み書き 読み取り専用
リージョン A リージョン B リージョン A リージョン B
リージョン内
リージョン内
(同一データセンター内)
データセンター A
データセンター B データセンター C
• ノードの障害に対応 • データセンターの障害に対応 • リージョンの障害に対応 • リージョンの障害に対応
• 複製先の読み取りアクセスが可能
48. 例)可用性セット DB サーバクラスタ
仮想マシンの役割が DB サーバーの場合は、対応したクラス
タ用ミドルウェアが必要になることが多い
SQL Server の場合には Always On Availability Group および Windows Server
Failover Cluster などを利用
複数の DB サーバー間でデータ同期を取りつつ、Load Balancer の NAT 機能を利用して
主系への透過的な接続を実現
48
Load Balancer
TDS
可用性セット
Active
Stand-by
主系で永続化されたデータを
Always-on の機能によって
同期レプリケーション
65. 障害モード分析
リージョン規模、あるいは複合的な大規模障害や広域災害に
対応するにはマルチリージョン構成を検討
65
Web tier subnet Business tier subnet Data tier subnet
Management
subnet
Active Directory
subnet
Azure load
balancer
standard
Azure load
balancer
standard
Virtual Network
DDoS
Protection
AD DS
server
AD DS
server
VM
Jumpbox
VM
Zone 1
VM
Zone 2
VM
Zone 3
VM
Zone 1
VM
Zone 2
VM
Zone 3
SQL Server
(primary)
SQL Server
(secondary)
Zone 1
Zone 2
Zone 1 Zone 2
Failover
Internet
Traffic
manager
Region
1
Region
2
Web tier subnet Business tier subnet Data tier subnet
Management
subnet
Active Directory
subnet
Azure load
balancer
standard
Azure load
balancer
standard
Virtual network
DDoS
Protection
AD DS
server
AD DS
server
VM
Jumpbox
VM
Zone 1
VM
Zone 2
VM
Zone 3
VM
Zone 1
VM
Zone 2
VM
Zone 3
SQL Server
(primary)
SQL Server
(secondary)
Zone 1
Zone 2
Zone 1 Zone 2
67. [参考] 災害対策例の RPO/RTO の目安
種別 方式 RPO/RTO 備考
Web
サーバー
Azure Backup/復元
RPO 1日
RTO > 1時間
Azure Backup にてリージョンをまたがる復元の設定(CRR: Cross Region Restore)を実施し、ペアリージョンに
て復元。RTO は目安。
Azure Site Recovery
RPO < 60分
RTO < 2時間
アプリケーション整合性で最小60分のストレージの差分同期を行い、フェールオーバー時は、ASR の機能にてフェー
ルオーバー。RTO は SLA。
データベー
ス
データベースのバックアップ/復
元
RPO 1日
RTO > 12時間
データベースの機能のバックアップ及び復元。RTO はソフトウェアのインストールも含めた目安。
Azure Backup/復元
RPO 1日
RTO > 1時間
Azure Backup にてリージョンをまたがる復元の設定(CRR: Cross Region Restore)を実施し、ペアリージョンに
て復元。RTO は目安。
Azure Site Recovery
RPO < 60分
RTO < 2時間
アプリケーション整合性で最小60分のストレージの差分同期を行い、フェールオーバー時は、ASR の機能にてフェー
ルオーバー。RTO は SLA。
SQL Server Always On or ミ
ラーリング(同期)
RPO > 0秒
RTO > 数秒
SQL Server のクラスタ機能(同期コミット:自動フェールオーバー)
SQL Server Always On or ミ
ラーリング(非同期)
RPO > 数秒
RTO > 数分
SQL Server のクラスタ機能(非同期コミット:手動フェールオーバー)
SQL Database の自動フェイ
ルオーバーグループ
RPO < 5秒
RTO < 1時間
自動フェイルオーバーグループでのフェイルオーバー
〇リージョン全体でのサービスの中断から復旧する
https://docs.microsoft.com/ja-jp/azure/architecture/resiliency/recovery-loss-azure-region
〇SQL Server のためにディザスター リカバリーを設定する
https://docs.microsoft.com/ja-jp/azure/site-recovery/site-recovery-sql
68.
69. [参考] 3rd Party Solution
69
Partner Product Solution Key Workloads
CommVault
Backup and DR, Workload and Data Migration, Endpoint Data
Protection
Veritas NetBackup
Veritas BackupExec
Backup and DR, Workload and Data Migration, Endpoint Data
Protection
HPE Data Protector
HPE VM Explorer
StoreOnce CloudBank
Backup and DR
NetApp ONTAP Cloud
NetApp AltaVault Cloud-Based Appliance
Backup and DR, Migration, DevTest
Data Domain Cloud Tier
EMC Avamar Virtual Edition
EMC Data Protection Suite CloudBoost
Backup and DR
Long-Term Retention
Veeam® Cloud Connect™ for the Enterprise
Veeam® Cloud Connect™ for Service Providers
Veeam® Direct Restore to Azure
Backup and DR, Workload and Data Migration, Endpoint Data
Protection
Quest Rapid Recovery Backup and DR, Archiving
Carbonite Endpoint Protection Endpoint Data Protection
Spectrum Protect Backup and DR for Windows, Linux, and Unix
Actifio Sky Backup and DR, Data Migration, DevTest
Rubrik Backup and DR, Workload and Data Migration, Archival, Search
Cohesity CloudArchive, CloudTier, CloudReplicate
Innovative secondary storage consolidation platform with
comprehensive integration with Azure Disks and Blobs