自動擴展先決條件

您必須先建立 Amazon SageMaker AI 模型部署，才能使用自動擴展。您可以針對相同的端點擁有多個模型版本。每個模型稱為生產 (模型) 變體。如需關於部署模型端點的詳細資訊，請參閱將模型部署至 SageMaker AI 託管服務。

若要啟用模型的自動擴展，您可以透過 Application Auto Scaling API 使用 SageMaker AI 主控台、 AWS Command Line Interface (AWS CLI) 或 AWS SDK。

如果這是您第一次為模型設定擴展，建議您使用主控台設定模型自動擴展。
使用 AWS CLI 或 Application Auto Scaling API 時，流程是將模型註冊為可擴展的目標、定義擴展政策，然後將其套用。在 SageMaker AI 主控台導覽窗格的推論下，選擇端點。尋找模型的端點名稱，然後選擇以它來尋找變體名稱。您必須同時指定端點名稱和變體名稱，才能啟用模型的自動擴展。

結合 Amazon SageMaker AI、Amazon CloudWatch 和 Application Auto Scaling API 即可達成自動擴展。如需進一步瞭解所需最低許可，請參閱《Application Auto Scaling 使用者指南》中的 Application Auto Scaling 身分型政策範例。

SagemakerFullAccessPolicy IAM 政策具備執行自動擴展所需要的全部許可。如需 SageMaker AI IAM 許可的詳細資訊，請參閱如何使用 SageMaker AI 執行角色。

如果您管理自有許可政策，您必須加入下列許可：

服務連結角色

Auto Scaling 使用 AWSServiceRoleForApplicationAutoScaling_SageMakerEndpoint 服務連結角色。此服務連結角色會授予 Application Auto Scaling 許可以描述政策的警示、監控目前的容量多寡，以及擴展目標資源。系統會自動建立此角色。為了成功自動建立該角色，您必須有 iam:CreateServiceLinkedRole 動作的許可。如需詳細資訊，請參閱《應用程式自動擴展使用者指南》中的服務連結角色。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

自動擴展政策概觀

使用主控台設定模型自動擴展