View a markdown version of this page

關於區域切換 - Amazon Application Recovery Controller (ARC)

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

關於區域切換

使用區域切換,您可以協調特定步驟來切換 AWS 區域 多區域應用程式執行所在的 。

區域切換是以您為特定復原需求設計和設定的計劃概念為基礎建置。每個計劃都包含由步驟組成的工作流程。每個步驟都會執行一或多個執行區塊,該區域切換會平行或依序執行,以完成應用程式復原。每個執行區塊都會處理不同的任務,例如切換資源或管理應用程式的流量重新導向。如需更多彈性,您可以透過新增子計畫來建立父系計畫。

每當您建立或更新計劃時,區域切換會執行計劃評估,以確保 IAM 許可、資源組態或執行容量沒有問題。區域切換會定期執行這些評估,並針對發現的任何問題產生警告。

區域切換也會計算每個計劃執行的實際復原時間值,以協助您評估計劃是否符合您的目標。您可以在 的區域切換儀表板中檢視復原時間和計畫執行的其他詳細資訊 AWS 管理主控台。如需詳細資訊,請參閱區域切換儀表板

若要進一步了解區域切換中的每個區域,請參閱下列各節。

區域切換計劃

區域切換計畫是區域切換中最上層的資源。您應該將您的計劃範圍限定在特定多區域應用程式。計劃可讓您在指定的 中執行一系列區域切換執行區塊,啟用或停用您的應用程式及其資源,包括跨帳戶資源,以建置工作流程來復原 AWS 區域 應用程式。

計劃是由一或多個工作流程組成,可讓您啟用或停用特定工作流程 AWS 區域。您可以在工作流程中設定執行區塊以循序執行,也可以指定某些區塊平行執行。

對於您為主動/被動多區域方法設定的計劃,您可以建立一個可用於啟用其中一個區域的工作流程,或兩個單獨的啟用工作流程,每個區域一個。對於您為主動/主動方法設定的計劃,您可以建立一個工作流程來啟用您的區域,以及一個工作流程來停用您的區域。

AWS 區域 是全球 AWS 叢集資料中心所在的地理位置。每個區域的設計都完全與其他區域隔離,提供容錯能力和穩定性。使用區域切換時,您需要考慮應用程式部署在哪些區域,以及您要用於復原的區域。

區域切換支援 AWS 區域 在提供服務的任何兩個之間進行復原。當您設定區域切換計劃時,您可以指定應用程式部署所在的區域,以及您想要使用的復原方法:主動/被動或主動/主動。

例如,您可能有主動/被動的多區域方法,其中 us-east-1 作為主要區域,us-west-2 作為待命區域。若要從影響 us-east-1 中應用程式的操作問題中復原應用程式,您可以執行區域切換計畫來啟用 us-west-2。這會導致應用程式從 us-east-1 中的資源切換到 us-west-2 中的資源。

區域切換計畫使用與您在建立計畫時指定的 IAM 角色相關聯的許可來執行。

您可以建立多個計劃,每個多區域應用程式各一個計劃,然後透過建立計劃,以所需的順序協調這些計劃的復原。父計畫是使用區域切換計畫執行區塊做為步驟的計畫。計劃階層僅限於兩個層級 (父系和子系),但您可以在相同的父系計劃下包含多個子系計劃。

工作流程和執行區塊

建立區域切換計畫後,您必須將一或多個工作流程新增至計畫,以定義您希望計畫為應用程式復原執行的步驟。對於每個工作流程,您可以新增包含執行區塊的步驟。每個執行區塊都會執行特定的復原動作,例如擴展資源或更新路由控制以重新路由流量。步驟會組織這些執行區塊,並控制它們是平行還是循序執行。透過建立父系計劃,您也可以協調多個應用程式復原到您正在啟用之區域的順序。

您可以將執行區塊組織成工作流程中的步驟。每個步驟都可以包含一或多個平行執行的執行區塊,而且您可以安排在工作流程中循序執行的步驟。此外,視資源而定,您可以選擇執行具有正常 (計劃) 或不良 (計劃) 執行的執行區塊。

  • 穩定執行:規劃的執行工作流程。當您的環境運作狀態良好時,您可以使用優雅工作流程來執行所有步驟,以有序地執行計劃。

  • 不穩健的執行:意外的執行。不良工作流程模式只會使用必要的步驟和動作。此模式會變更工作流程中執行區塊的行為,或略過特定的執行區塊。

  • 復原後執行:在成功復原後執行以準備未來區域事件的工作流程。復原後執行可以建立僅供讀取複本、透過 Lambda 函數執行自訂邏輯、新增手動核准閘道,以及嵌入用於複雜協同運作的子計畫。這些執行需要兩個區域都正常運作,並在先前受損的區域中執行。

最後,您也可以設定執行區塊的跨帳戶資源。首先,您必須遵循 中的指引來設定許可區域切換中的跨帳戶支援。設定必要的 IAM 角色之後,您可以在計劃工作流程的執行區塊中新增跨帳戶資源。若要新增跨帳戶資源,當您新增步驟時,您可以指定具有其他資源許可的目標 IAM 角色 AWS 帳戶。您也必須為跨帳戶角色指定您在信任政策中提供的外部 ID。如需建立所需 IAM 角色的詳細資訊,請參閱 跨帳戶資源許可

若要進一步了解工作流程,請參閱 建立區域切換計畫工作流程。如需每種執行區塊類型的詳細資訊,包括組態步驟、運作方式,以及做為計畫評估一部分評估的內容,請參閱 新增執行區塊

計畫評估

計劃評估是一種自動化程序,區域切換會在建立或更新計劃時執行,之後在穩定狀態期間每 30 分鐘執行一次。評估程序會驗證計劃組態和資源組態的數個關鍵層面。評估包括驗證 IAM 許可、資源組態和執行容量。

如果區域切換發現可能無法成功執行計劃的問題,會產生計劃評估警告,這會在主控台的計劃詳細資訊頁面上反白顯示。您也可以使用 Amazon EventBridge 使用計劃評估警告,也可以使用區域切換 API 檢視警告。如需計劃評估 API 的詳細資訊,請參閱《Amazon Application Recovery Controller (ARC) 的區域交換器 API 參考指南》中的 GetPlanEvaluationStatus

您可以在計劃詳細資訊頁面上的計劃評估索引標籤中,查看計劃評估表面問題的詳細資訊和建議補救措施。我們建議您也透過執行區域切換計畫來測試應用程式復原,而且不要僅倚賴區域切換計畫評估來測試復原計畫是否如預期般運作。

自動計劃執行報告

區域切換可以自動為計劃執行產生全面的 PDF 報告,以協助您滿足法規合規要求。這些報告提供災難復原測試和實際復原事件的證據,包括詳細的執行時間表、計劃組態和資源狀態。

當您為計劃設定自動產生報告時,區域切換會在每個計劃執行完成後建立 PDF 報告,並將其交付至您指定的 Amazon S3 儲存貯體。報告通常會在執行完成後 30 分鐘內提供。需支付 S3 儲存成本。

每個報告都包含:

  • 具有服務概觀和報告建立日期的執行摘要

  • 規劃執行時存在的組態詳細資訊

  • 包含步驟、受影響資源和狀態的詳細執行時間表

  • 規劃執行開始時出現的警告

  • Amazon CloudWatch 警示狀態和相關警示的警示歷史記錄

  • 對於父計畫、子計畫的組態和執行詳細資訊

  • 術語和概念詞彙表

若要啟用自動產生報告,請在建立或更新計劃時設定報告輸出目的地。您還必須確保計劃的執行 IAM 角色具有將報告寫入 Amazon S3 儲存貯體的必要許可,並存取產生報告內容所需的資源。如需所需許可的相關資訊,請參閱自動計劃執行報告許可

您可以檢視報告產生的狀態,並從 主控台的計劃執行詳細資訊頁面下載完成的報告。如果報告產生發生錯誤,例如許可不足或 Amazon S3 儲存貯體設定錯誤,區域切換會提供錯誤詳細資訊,協助您對問題進行疑難排解。

計劃評估會持續驗證您的報告組態,包括驗證執行角色是否具有所需的 IAM 許可。如果區域切換偵測到會阻止成功產生報告的組態問題,則會產生警告,您可以在計劃詳細資訊頁面上檢視這些警告。

區域警示和實際復原時間

區域切換會計算每個計劃執行的實際復原時間值,您可以在計劃執行後檢視該值。實際復原時間會顯示在計劃執行詳細資訊頁面上,讓您可以將實際時間與您建立計劃時指定的復原時間目標進行比較。

實際復原時間的計算方式為計劃執行完成所需的總時間,以及您設定的特定 Amazon CloudWatch 警示之前經過的任何額外時間都會返回綠色狀態。

若要支援計算計劃執行的準確實際復原時間,您必須為區域切換計劃設定區域 Amazon CloudWatch 警示,以提供每個區域中應用程式運作狀態的訊號。執行計劃時,區域切換會使用這些應用程式運作狀態警示來判斷您的應用程式何時再次運作良好。然後,區域切換會根據您設定的應用程式運作狀態警示,根據您的計劃執行新增至應用程式恢復運作狀態所需時間的實際復原時間,來計算實際復原時間。

將 CloudWatch 警示新增至區域切換計劃之前,請確定您已備妥正確的 IAM 政策。如需詳細資訊,請參閱應用程式運作狀態許可的 CloudWatch 警示