

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# AWS Resilience Hub 概念
<a name="concepts-terms"></a>

這些概念可協助您更加了解 協助改善應用程式彈性並防止應用程式中斷 AWS Resilience Hub的方法。

## 彈性
<a name="resiliency"></a>

能夠在指定的時間範圍內維持可用性，並從軟體和操作中斷中復原。

## 復原點目標 (RPO)
<a name="RPO"></a>

自上次資料復原點以來可接受的時間上限。這會決定最後一個復原點與服務中斷之間可接受的資料遺失。

## 復原時間目標 (RTO)
<a name="RTO"></a>

服務中斷與服務還原之間的可接受延遲上限。這會決定可接受的服務無法使用之時間長度。

## 估計工作負載復原時間目標
<a name="est-workload-RTO"></a>

估計工作負載復原時間目標 （估計工作負載 RTO) 是應用程式根據匯入的應用程式定義估計符合的 RTO，然後執行評估。

## 預估工作負載復原點目標
<a name="est-workload-RPO"></a>

估計工作負載復原點目標 （估計工作負載 RPO) 是應用程式根據匯入的應用程式定義估計符合的 RPO，然後執行評估。

## 應用程式
<a name="application"></a>

 AWS Resilience Hub 應用程式是 AWS 支援的 資源集合，這些資源會持續受到監控和評估，以管理其彈性狀態。

## 應用程式元件
<a name="app-component"></a>

一組以單一單位運作和失敗的相關 AWS 資源。例如，如果您有主要和複本資料庫，則兩個資料庫都屬於相同的應用程式元件 (AppComponent)。

AWS Resilience Hub 決定哪些 AWS 資源可以屬於哪種類型的 AppComponent。例如， `DBInstance`可以屬於 `AWS::ResilienceHub::DatabaseAppComponent`，但不能屬於 `AWS::ResilienceHub::ComputeAppComponent`。

## 應用程式合規狀態
<a name="app-compliance"></a>

AWS Resilience Hub 會為您的應用程式報告下列合規狀態類型。

**符合政策** 

應用程式估計符合政策中定義的 RTO 和 RPO 目標。其所有元件都符合定義的政策目標。例如，您為跨 AWS 區域的中斷選擇了 24 小時的 RTO 和 RPO 目標。 AWS Resilience Hub 可以看到您的備份已複製到您的備用區域。您仍需從備份標準操作程序 (SOP) 進行復原，並進行測試和計時。這是操作建議和整體彈性分數的一部分。

**已違反政策**

無法估計應用程式是否符合政策中定義的 RTO 和 RPO 目標。其一或多個 AppComponents不符合政策目標。例如，您為跨 AWS 區域的中斷選擇了 24 小時的 RTO 和 RPO 目標，但您的資料庫組態不包含任何跨區域復原方法，例如全域複寫和備份複本。

**未評估**

應用程式需要評估。目前尚未評估或追蹤。

**偵測到變更**

應用程式有尚未評估的新發佈版本。

## 漂移偵測
<a name="drift-status"></a>

AWS Resilience Hub 會在執行應用程式評估時執行偏離通知，以檢查 AppComponent 組態中的變更是否影響應用程式的合規狀態。此外，它還會檢查和偵測變更，例如新增或刪除應用程式輸入來源中的資源，並通知相同的 。為了比較， AWS Resilience Hub 使用應用程式元件符合政策的先前評估。 AWS Resilience Hub 會偵測下列類型的偏離：
+ **應用程式政策偏離** – 此偏離類型可識別所有 AppComponents 在先前的評估中符合政策，但在目前的評估中不符合。
+ **應用程式資源偏離** – 此偏離類型可識別目前應用程式版本中的所有偏離資源。

## 彈性評估
<a name="Resiliency-assessment"></a>

AWS Resilience Hub 使用差距和潛在補救措施的清單來衡量所選政策的有效性，以從災難中復原和繼續。它會使用 政策評估每個應用程式元件或應用程式合規狀態。此報告包含成本最佳化建議和潛在問題的參考。

## 彈性分數
<a name="Resiliency-score"></a>

AWS Resilience Hub 會產生分數，指出您的應用程式遵循我們有關符合應用程式彈性政策、警示、標準操作程序 (SOPs) 和測試的建議的程度。

## 中斷類型
<a name="disruption"></a>

AWS Resilience Hub 可協助您針對下列類型的中斷評估彈性：

**Application (應用程式)**

基礎設施運作狀態良好，但應用程式或軟體堆疊不會視需要運作。這可能發生在部署新的程式碼、組態變更、資料損毀或下游相依性故障之後。

**雲端基礎設施**

由於中斷，雲端基礎設施無法如預期運作。由於一或多個元件發生本機錯誤，可能會發生中斷。在大多數情況下，這種類型的中斷是透過重新啟動、回收或重新載入故障的元件來解決。

**雲端基礎設施可用區中斷**

一或多個可用區域無法使用。這種類型的中斷可以透過切換到不同的可用區域來解決。

**雲端基礎設施區域事件**

一或多個區域無法使用。這種類型的事件可以透過切換到不同的 來解決 AWS 區域。

## AWS FIS 實驗
<a name="fault-injection-experiments"></a>

AWS Resilience Hub 建議使用 AWS FIS 動作來驗證不同類型中斷的應用程式彈性的實驗。這些中斷包括應用程式、基礎設施、可用區域 (AZ) 或 Application Components AWS 區域 的事件。

這些實驗可讓您執行下列動作：
+ 注入失敗。
+ 確認警示可以偵測到中斷。
+ 驗證復原程序或標準操作程序 SOPs) 是否正常運作，以從中斷中復原應用程式。

SOPs 測試會測量預估工作負載 RTO 和預估工作負載 RPO。您可以測試不同的應用程式組態，並測量輸出 RTO 和 RPO 是否符合政策中定義的目標。

## SOP
<a name="SOP"></a>

標準操作程序 (SOP) 是一組規範性步驟，旨在在發生中斷或警示時有效復原您的應用程式。根據應用程式評估， AWS Resilience Hub 建議一組 SOPs，建議在中斷之前準備、測試和測量 SOPs，以確保及時復原。