

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 오토 스케일링 사전 조건
<a name="endpoint-auto-scaling-prerequisites"></a>

오토 스케일링을 사용하려면 먼저 Amazon SageMaker AI 모델 엔드포인트를 생성해야 합니다. 동일한 엔드포인트에 대해 여러 모델 버전을 가질 수 있습니다. 각 모델을 [프로덕션(모델) 변형](model-ab-testing.md)이라고 합니다. 모델 엔드포인트 배포에 대한 자세한 정보는 [SageMaker AI 호스팅 서비스에 모델 배포](ex1-model-deployment.md#ex1-deploy-model) 섹션을 참조하세요.

모델에 대한 Auto Scaling을 활성화하려면 Application Auto Scaling API를 통해 SageMaker AI 콘솔, AWS Command Line Interface (AWS CLI) 또는 AWS SDK를 사용할 수 있습니다.
+ 모델에 대한 크기 조정을 처음 구성하는 경우 [콘솔을 사용하여 모델 오토 스케일링 구성](endpoint-auto-scaling-add-console.md)을 사용하는 것이 좋습니다.
+  AWS CLI 또는 Application Auto Scaling API를 사용할 때 흐름은 모델을 확장 가능한 대상으로 등록하고 조정 정책을 정의한 다음 적용하는 것입니다. SageMaker AI 콘솔 탐색창의 **추론**에서 **엔드포인트**를 선택합니다. 모델의 엔드포인트 이름을 찾은 다음 선택하여 변형 이름을 찾습니다. 모델에 대한 오토 스케일링을 활성화하려면 엔드포인트 이름과 변형 이름을 모두 지정해야 합니다.

오토 스케일링은 Amazon SageMaker AI, Amazon CloudWatch 및 Application Auto Scaling API의 조합을 통해 수행됩니다. 최소 필수 권한에 대한 자세한 내용은 *Application Auto Scaling 사용 설명서*의 [Application Auto Scaling ID 기반 정책 예제](https://docs.aws.amazon.com/autoscaling/application/userguide/security_iam_id-based-policy-examples.html)를 참조하세요.

`SagemakerFullAccessPolicy` IAM 정책은 오토 스케일링을 수행하는 데 필요한 모든 IAM 권한을 갖습니다. SageMaker AI IAM 권한에 대한 자세한 내용은 [SageMaker AI 실행 역할을 사용하는 방법](sagemaker-roles.md) 섹션을 참조하세요.

본인만의 권한 정책을 사용하는 경우 다음 권한을 포함시켜야 합니다.

------
#### [ JSON ]

****  

```
{
  "Version":"2012-10-17",		 	 	 
  "Statement": [
    {
      "Effect": "Allow",
      "Action": [
        "sagemaker:DescribeEndpoint",
        "sagemaker:DescribeEndpointConfig",
        "sagemaker:UpdateEndpointWeightsAndCapacities"
      ],
      "Resource": "*"
    },
    {    
        "Effect": "Allow",
        "Action": [
            "application-autoscaling:*"
        ],
        "Resource": "*"
    },
    {
      "Effect": "Allow",
      "Action": "iam:CreateServiceLinkedRole",
      "Resource": "arn:aws:iam::*:role/aws-service-role/sagemaker.application-autoscaling.amazonaws.com/AWSServiceRoleForApplicationAutoScaling_SageMakerEndpoint",
      "Condition": {
        "StringLike": { "iam:AWSServiceName": "sagemaker.application-autoscaling.amazonaws.com"	}
      }
    },
    {
      "Effect": "Allow",
      "Action": [
        "cloudwatch:PutMetricAlarm",
        "cloudwatch:DescribeAlarms",
        "cloudwatch:DeleteAlarms"
      ],
      "Resource": "*"
    }
  ]
}
```

------

## 서비스 연결 역할
<a name="endpoint-auto-scaling-slr"></a>

오토 스케일링은 `AWSServiceRoleForApplicationAutoScaling_SageMakerEndpoint` 서비스 연결 역할을 사용합니다. 이 서비스 연결 역할은 정책에 대한 경보를 설명하고, 플릿의 현재 용량을 모니터링하고, 대상 리소스를 조정할 수 있는 Application Auto Scaling 권한을 부여합니다. 이 역할은 자동으로 생성됩니다. 역할 자동 생성이 성공하려면 `iam:CreateServiceLinkedRole` 작업에 대한 권한을 보유해야 합니다. 자세한 내용은 *Application Auto Scaling 사용 설명서*의 [서비스 연결 역할](https://docs.aws.amazon.com/autoscaling/application/userguide/application-auto-scaling-service-linked-roles.html)을 참조하세요.