

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 部署防護機制以更新生產環境中的模型
<a name="deployment-guardrails"></a>

部署防護機制是 Amazon SageMaker AI 推論中的一組模型部署選項，可在生產環境中更新您的機器學習模型。使用全受控部署選項，您可以控制從生產環境中的目前模型切換到新模型。藍/綠部署中的流量轉移模式 (例如 Canary 和線性) 可讓您在更新過程中精細控制從目前模型到新模型的流量轉移程序。此外，還有內建的保護措施，例如自動還原，可協助您及早找出問題，並在問題大幅影響生產之前自動採取修正措施。

部署防防護機制提供以下優勢：
+ **更新生產環境時的部署安全性。**對生產環境的迴歸更新可能會導致意外的停機時間和業務影響，例如增加模型延遲和高錯誤率。部署防護機制可透過提供最佳實務和內建的操作安全防護機制，協助您降低這些風險。
+ **全受管的部署。**SageMaker AI 負責設定和協調這些部署，並將其與端點更新機制整合。您不需要建置和維護協調流程、監控或復原機制。您可以利用 SageMaker AI 來設定和協調這些部署，並專注於針對應用程式利用機器學習 (ML)。
+ **可見性。**您可以透過 [DescribeEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeEndpoint.html) API 或透過 Amazon CloudWatch Events (適用於[支援的端點](deployment-guardrails-exclusions.md)) 追蹤部署進度。要瞭解有關 SageMaker AI 中事件的詳細資訊，請參閱[Amazon SageMaker AI 傳送至 Amazon EventBridge 的事件](automating-sagemaker-with-eventbridge.md)中的「端點部署狀態變更」章節。請注意，如果您的端點使用 [排除](deployment-guardrails-exclusions.md) 頁面中列出的任何功能，則無法使用 CloudWatch 活動。

**注意**  
部署 防護機制僅適用於 [非同步推論](async-inference.md) 和 [即時推論](realtime-endpoints.md) 端點類型。

## 如何開始
<a name="deployment-guardrails-get-started"></a>

我們支援兩種部署類型，以更新生產環境中的模型：藍/綠部署和滾動部署。
+ [藍/綠部署](deployment-guardrails-blue-green.md)：您可以透過更新將舊機群 (藍色機群) 的流量轉移到新機群 (綠色機群)。藍/綠部署提供[多種流量轉移模式](https://docs.aws.amazon.com/sagemaker/latest/dg/deployment-guardrails-blue-green.html)。流量轉移模式是一種組態，用於指定 SageMaker AI 如何將端點流量路由至包含您更新的新機群。下列流量轉移模式可為您提供端點更新程序的不同層級控制：
  + [使用一次全部流量轉移](deployment-guardrails-blue-green-all-at-once.md) 將您的所有端點流量從藍色機群轉移到綠色機群。流量轉移到綠色機群後，您預先指定的 Amazon CloudWatch 警示會開始監控綠色機群一段時間 (*製作中期間*)。如果在製作中期間沒有觸發警報，則 SageMaker AI 會終止藍色機群。
  + [使用 Canary 流量轉移](deployment-guardrails-blue-green-canary.md) 將您的流量的一小部分 (*Canary*) 轉移到綠色機群，並對其進行監控一段製作中期間。如果 Canary 在綠色機群上成功，則 SageMaker AI 將剩餘的流量從藍色機群轉移到綠色機群，然後終止藍色機群。
  + [使用線性流量轉移](deployment-guardrails-blue-green-linear.md) 針對流量轉移步驟數量和每個步驟要轉移的流量百分比，提供更多的自訂功能。雖然 Canary 轉移可讓您分兩個步驟轉移流量，但線性轉移將其擴展到 *n* 個線性間隔的步驟。
+ [使用滾動式部署](deployment-guardrails-rolling.md)：您可以在 SageMaker AI 逐步佈建容量時更新端點，並按照指定的批次大小的步驟將流量轉移到新機群。新機群上的執行個體會以新部署設定進行更新，而且如果在製作中期間沒有觸發 CloudWatch 警示，則 SageMaker AI 會清除舊機群上的執行個體。此選項可讓您精細控制執行個體計數或每個步驟轉移的容量百分比。

您可以透過 [UpdateEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateEndpoint.html) 和 [CreateEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateEndpoint.html) SageMaker API 和 AWS Command Line Interface 命令來建立和管理您的部署。有關如何設置部署的詳細資訊，請參閱各個部署頁面。請注意，如果您的端點使用 [排除](deployment-guardrails-exclusions.md) 頁面中列出的任何功能，則無法使用部署防護機制。

要遵循說明如何使用部署護欄的指導範例，請參閱我們的範例 [Jupyter 筆記本](https://github.com/aws/amazon-sagemaker-examples/tree/master/sagemaker-inference-deployment-guardrails)適用於金絲雀和線性交通轉移模式。