本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
自動擴展先決條件
您必須先建立 Amazon SageMaker AI 模型部署,才能使用自動擴展。您可以針對相同的端點擁有多個模型版本。每個模型稱為生產 (模型) 變體。如需關於部署模型端點的詳細資訊,請參閱將模型部署至 SageMaker AI 託管服務。
若要啟用模型的自動擴展,您可以透過 Application Auto Scaling API 使用 SageMaker AI 主控台、 AWS Command Line Interface (AWS CLI) 或 AWS SDK。
-
如果這是您第一次為模型設定擴展,建議您 使用主控台設定模型自動擴展。
-
使用 AWS CLI 或 Application Auto Scaling API 時,流程是將模型註冊為可擴展的目標、定義擴展政策,然後套用。在 SageMaker AI 主控台導覽窗格的推論下,選擇端點。尋找模型的端點名稱,然後選擇以它來尋找變體名稱。您必須同時指定端點名稱和變體名稱,才能啟用模型的自動擴展。
結合 Amazon SageMaker AI、Amazon CloudWatch 和 Application Auto Scaling API 即可達成自動擴展。如需進一步瞭解所需最低許可,請參閱《Application Auto Scaling 使用者指南》中的 Application Auto Scaling 身分型政策範例。
SagemakerFullAccessPolicy IAM 政策具備執行自動擴展所需要的全部許可。如需 SageMaker AI IAM 許可的詳細資訊,請參閱 如何使用 SageMaker AI 執行角色。
如果您管理自有許可政策,您必須加入下列許可:
服務連結角色
Auto Scaling 使用 AWSServiceRoleForApplicationAutoScaling_SageMakerEndpoint 服務連結角色。此服務連結角色會授予 Application Auto Scaling 許可以描述政策的警示、監控目前的容量多寡,以及擴展目標資源。系統會自動建立此角色。為了成功自動建立該角色,您必須有 iam:CreateServiceLinkedRole 動作的許可。如需詳細資訊,請參閱《應用程式自動擴展使用者指南》中的服務連結角色。