View a markdown version of this page

Amazon Route 53 運作狀態檢查執行區塊 - Amazon Application Recovery Controller (ARC)

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon Route 53 運作狀態檢查執行區塊

Amazon Route 53 運作狀態檢查執行區塊可讓您指定在容錯移轉期間將應用程式流量重新導向至的區域。執行區塊會建立 Amazon Route 53 運作狀態檢查,然後連接至您帳戶中的 Route 53 DNS 記錄。當您執行區域切換計劃時,Route 53 運作狀態檢查狀態會更新,而流量會根據您的 DNS 組態重新導向。

重要

Route 53 託管區域必須與區域切換計劃位於相同的分割區中。

Configuration

若要設定 Route 53 運作狀態檢查執行區塊,請輸入下列值。

重要

設定執行區塊之前,請確定計劃的執行角色具有正確的 IAM 政策。如需詳細資訊,請參閱Route 53 運作狀態檢查執行區塊範例政策

  1. 步驟名稱:輸入名稱。

  2. 步驟描述 (選用):輸入步驟的描述。

  3. 託管區域 ID:Route 53 中網域和 DNS 記錄的託管區域 ID。

  4. 記錄名稱:輸入您使用的記錄的記錄名稱 (網域名稱),以及相關聯的運作狀態檢查,以重新導向應用程式的流量。區域切換會尋找記錄名稱的 Route 53 記錄集,並根據記錄集的值設定識別符內的區域名稱,嘗試將每個記錄集映射至區域。

  5. 記錄集識別符 (選用):如果區域切換無法在建立計畫後,從步驟 4 提供的記錄名稱自動將記錄集映射到區域,您可以選擇手動提供記錄集識別符。如果計劃評估傳回警告,指出需要更多資訊,請使用記錄集識別符來更新計劃,方法是針對每個區域包含下列項目:

    • 記錄集識別符:輸入記錄集的 設定識別符的值/路由流量

    • 區域:輸入與具有記錄集識別符資訊的記錄集相關聯的區域。

  6. 選擇儲存步驟。

  7. 在 Route 53 中設定運作狀態檢查。

    區域切換會針對執行區塊中定義的託管區域中的每個記錄名稱,為每個區域提供運作狀態檢查 ID。請確定您在 Route 53 中為帳戶中的對應記錄集設定運作狀態檢查,以便區域切換可以在計劃執行期間正確重新導向應用程式的流量。在計劃詳細資訊頁面上的運作狀態檢查索引標籤中,您可以檢視所有執行區塊和區域的運作狀態檢查。

Route 53 運作狀態檢查執行區塊如何做為高可用性的 DNS 容錯移轉機制

ARC 區域切換 Route53 運作狀態檢查執行區塊會建立兩組運作狀態檢查:如果您的工作負載部署在兩個區域中,則每個區域一個。它會將這些運作狀態檢查提供給您。您可以透過「監控」索引標籤中的區域切換主控台,或透過 ListRoute53HealthChecks API 來檢視它們。然後,將這些運作狀態檢查與 Route 53 DNS 記錄建立關聯。

執行 Route 53 運作狀態檢查執行區塊時,它會使用機庫下的 STOP (待命接管主要) 模式來變更運作狀態檢查的狀態,以協調 DNS 容錯移轉。當您協調從主要容錯移轉到次要容錯移轉時,主要運作狀態檢查會標記為「運作狀態不良」,次要運作狀態檢查則會標記為「運作狀態」。Route 53 會使用此運作狀態檢查狀態變更,以在容錯移轉期間重新導向流量。

對於主動/被動:主要區域的運作狀態檢查開始運作狀態良好;被動區域開始運作狀態不佳。當您使用 Route53 運作狀態檢查執行區塊進行容錯移轉時,這些狀態會翻轉。

對於作用中/作用中:所有運作狀態檢查都會開始運作狀態良好。當您在停用工作流程中使用 Route53 運作狀態檢查執行區塊時,工作流程會將停用區域的運作狀態檢查狀態設定為運作狀態不佳。當您在區域的啟用工作流程中使用 Route53 運作狀態檢查執行區塊時,工作流程會將啟用區域的運作狀態檢查狀態設為正常。

為什麼這是高度可用的容錯移轉機制?

兩個原因使它成為可靠的容錯移轉機制:

  1. Route 53 運作狀態檢查狀態轉換是 Route 53 資料平面的一部分,專為 100% 可用性而設計

    變更 Route53 運作狀態檢查狀態是資料平面操作。Route53 資料平面是全域分佈的,專為 100% 可用性而設計。Route53 運作狀態檢查狀態變更沒有控制平面相依性。這表示即使主要區域受損,運作狀態檢查狀態變更仍然有效。

  2. STOP 模式 (待命接管主要模式)

    STOP 模式是一種協調 DNS 容錯移轉的機制,發佈於此處的部落格文章:使用 Amazon Route 53 建立災難復原機制。Route53 運作狀態檢查執行區塊會使用此模式。STOP 模式必須使用運作狀態良好的區域做為「決策代理程式」,以變更受損區域中運作狀態檢查的狀態。STOP 模式不會依賴受損的區域。

以下是它的實際運作方式:

  • 當您建立 Route53 運作狀態檢查執行區塊時,運作狀態檢查是由工作負載的每個區域中的區域切換所建立,並透過監控索引標籤中的區域切換主控台或 ListRoute53HealthChecks API 提供給您。

  • 然後,您可以手動將這些記錄與每個區域的 DNS 記錄建立關聯。一個運作狀態檢查與主要區域的 DNS 記錄相關聯,另一個則與次要區域的 DNS 記錄相關聯。

  • 運作狀態檢查與主要區域的 DNS 記錄相關聯,但會監控待命 (次要) 區域中的資源 (例如:S3 中是否存在檔案),以變更運作狀態檢查的狀態。

  • 運作狀態檢查會反轉 – 如果無法連線待命資源,則主要區域的運作狀態檢查會預設為正常運作。如果發現待命資源,主要區域的運作狀態檢查會變更為運作狀態不佳。這可防止意外容錯移轉。

  • 若要觸發容錯移轉,檔案是由待命區域中的區域切換所建立。運作狀態檢查會偵測到它,標記主要運作狀態不佳,Route53 會翻轉 DNS。待命資源由區域切換服務管理,不依賴客戶。

當客戶僅從兩個區域操作時,沒有控制平面相依性 (全域分散式資料平面) 和沒有受損區域相依性 (STOP 模式) 的組合會使得此成為高度可用的 DNS 容錯移轉機制。請參閱此處記載的 STOP 模式:使用 Amazon Route 53 建立災難復原機制

做為計畫評估的一部分而評估的內容

當區域切換評估您的計劃時,區域切換會對 Route 53 運作狀態檢查執行區塊組態和許可執行多項檢查。區域切換會驗證運作狀態檢查是否連接到執行區塊組態中指定的 DNS 記錄。也就是說,區域切換會驗證特定 AWS 區域 的 DNS 記錄是否設定為使用該區域的運作狀態檢查。

比較 ARC 路由控制和 Route 53 運作狀態檢查執行區塊

區域切換中的 Amazon Route 53 運作狀態檢查執行區塊為 DNS 型流量管理提供了成本較低的替代方案。不過,此執行區塊取決於 AWS 區域 您正在啟用的 ,因此 區域必須可用。這符合大多數客戶的需求,因為他們正在啟用運作狀態良好的區域。

ARC 路由控制提供高度可靠的 DNS 型流量管理,具有 100% 的可用性 SLA。透過路由控制,您的營運團隊可以使用安全防護機制在區域之間轉移流量。路由控制提供具有 100% SLA 的單一租用戶解決方案。路由控制叢集分散在五個區域,可以容忍兩個區域離線。如果您有高度關鍵的應用程式,請考慮使用路由控制。

使用區域切換不需要路由控制。您可以使用區域切換來管理流量重新導向,方法是使用 Route 53 運作狀態檢查執行區塊,無需路由控制。

在下列情況中,路由控制會使用區域切換新增值:

  • 您需要流量控制機制本身的 100% 可用性 SLA。

  • 您的組織需要具有關鍵應用程式安全規則的手動操作控制。

  • 您想要defense-in-depth,以便營運團隊可以視需要手動覆寫自動流量路由。

Route 53 運作狀態檢查執行區塊不依賴於控制平面。運作狀態檢查記錄變更使用資料平面,因此不需要啟用區域來處理組態更新。在下列情況中,Route 53 運作狀態檢查執行區塊已足夠:

  • 您的應用程式可以取決於您正在啟用 AWS 區域 的 。

  • 在復原工作流程中,自動流量重新導向符合您的需求。

  • 成本最佳化是優先事項。Route 53 運作狀態檢查執行區塊的成本低於路由控制。

大多數客戶從 Route 53 運作狀態檢查執行區塊開始,做為預設流量路由機制,並僅為需要最高流量管理機制可靠性的最關鍵應用程式新增路由控制。