

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 콘솔을 사용하여 모델 오토 스케일링 구성
<a name="endpoint-auto-scaling-add-console"></a>

**모델(콘솔)의 오토 스케일링을 구성하려면**

1. [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/)에서 Amazon SageMaker AI 콘솔을 엽니다.

1. 탐색 창에서 **추론**을 선택하고 **엔드포인트**를 선택합니다.

1. 엔드포인트를 선택한 다음 **엔드포인트 런타임 설정**에서 변형을 선택합니다.

1. **오토 스케일링 구성**을 선택합니다.

1. **변형 오토 스케일링 구성** 페이지의 **변형 오토 스케일링**에 대해 다음을 수행합니다.

   1. **최소 인스턴스 용량**에, 스케일링 정책에서 유지하고자 하는 인스턴스의 최소 수를 입력합니다. 최소 1개 이상의 인스턴스가 필요합니다.

   1. **최대 인스턴스 용량**에, 스케일링 정책에서 유지하고자 하는 인스턴스의 최대 수를 입력합니다.

1. **기본 제공 크기 조정 정책**의 경우 다음을 수행합니다.

   1. **대상 지표**의 경우 `SageMakerVariantInvocationsPerInstance`는 지표에 대해 자동으로 선택되며 변경할 수 없습니다.

   1. **대상 값**에서 모델에 대한 분당 인스턴스별 평균 호출 수를 입력합니다. 이 값을 결정하려면 [로드 테스트.](endpoint-scaling-loadtest.md)의 지침을 따릅니다.

   1. (선택 사항) **스케일 인 휴지 기간 축소(초)** 및 **스케일 아웃 휴지 기간 확대(초)**에서 각 휴지 기간을 초 단위로 입력합니다.

   1. (선택 사항) 트래픽이 감소할 때 오토 스케일링에서 인스턴스를 삭제하지 않게 하려면 **스케일 인 비활성화**를 선택하세요.

1. **저장**을 선택합니다.

이 절차는 Application Auto Scaling을 사용하여 확장 가능한 대상으로 모델을 등록합니다. 모델을 등록할 때 Application Auto Scaling은 유효성 검사 확인을 통해 다음 사항을 확인합니다.
+ 모델의 존재 여부
+ 권한이 효율적인지 여부
+ T2와 같은 확장 가능한 성능 인스턴스를 포함하여 변형을 등록하지 않습니다.
**참고**  
SageMaker AI는 T2와 같은 버스트 가능 인스턴스에 대한 오토 스케일링을 지원하지 않습니다. 왜냐하면 증가된 워크로드에 대한 용량 증가를 이미 허용하고 있기 때문입니다. 확장 가능한 성능 인스턴스에 대한 내용은 [Amazon EC2 인스턴스 유형](https://aws.amazon.com/ec2/instance-types/)을 참조하세요.