

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 進階異地同步備份復原模
<a name="advanced-multi-az-resilience-patterns"></a>

出版日期：**2023年7月11日**([文件修訂](document-revisions.md))

許多客戶在高可用性的多重可用區域 (AZ) 組態中執行工作負載。這些架構在二進制故障事件期間表現良好，但經常遇到問題*灰色*失敗。這種類型的故障的表現可能是微妙的，並且無視快速而明確的檢測。本白皮書提供指引，說明如何檢測工作負載以偵測灰色故障所造成的影響 (隔離至單一可用區域)，然後採取行動以減輕可用區域中的影響。

## 簡介
<a name="introduction"></a>

 本文件的目的是協助您更有效地實作具備彈性的異地同步備份架構。建立彈性系統的最佳做法之一[亞馬遜虛擬私有雲](https://aws.amazon.com/vpc/)（VPC）網絡是[將每個工作負載部署到多個可用區](https://docs.aws.amazon.com/vpc/latest/userguide/vpc-security-best-practices.html)。

 一個[可用區域](https://aws.amazon.com/about-aws/global-infrastructure/regions_az/)是一或多個具備備援電源、網路和連線能力的獨立資料中心。使用多個可用區域可讓您操作比單一資料中心更具可用性、容錯能力和可擴充性的工作負載。

 許多AWS服務，例如[亞馬遜彈性運算雲（EC2）自動擴展](https://aws.amazon.com/ec2/autoscaling/)或者[亞馬遜關聯式資料庫](https://aws.amazon.com/rds/)（亞馬遜 RDS），提供異地同步備份配置。這些服務不需要您建立任何額外的可觀測性或容錯移轉工具。它們使工作負載具有彈性，可以輕鬆檢測到的二進制故障模式[AWS 區域](https://aws.amazon.com/about-aws/global-infrastructure/regions_az/)會影響單一可用區域。這可能是完全實體硬體故障、電源中斷或影響大部分資源的潛在軟體錯誤。

 但是還有另一類失敗稱為*灰色失敗*, 其表現是微妙的，違抗快速和明確的檢測. 這反過來會導致更長的時間，以減輕故障引起的影響。本白皮書著重於灰色故障可能對異地同步備份架構造成的影響、如何偵測它們，以及如何減輕故障。

****  
本白皮書提供的指引主要適用於以下特定類別的工作負載：  
主要使用區域AWS服務
需要提高單一區域的韌性
願意進行大量投資以建立所需的可觀察性和彈性模式
在這些工作負載中，您可能不願意做出一些或全部的權衡[回應灰階故障](gray-failures.md#responding-to-gray-failures)，或者沒有使用多個區域的選項。這些類型的工作負載很可能代表整體產品組合的一小部分，因此應在工作負載層級與平台層級考慮此指引。