

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 오토 스케일링을 사용하는 엔드포인트 업데이트
<a name="endpoint-scaling-update"></a>

엔드포인트를 업데이트할 때 Application Auto Scaling은 엔드포인트의 어떤 모델이 오토 스케일링 대상인지 확인합니다. 업데이트로 인해 오토 스케일링 대상인 모델의 인스턴스 유형을 변경하면 업데이트는 실패합니다.

에는 모델을 업데이트하기 전에 오토 스케일링에서 모델을 등록 취소해야 한다는 경고가 AWS Management Console표시됩니다. [UpdateEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateEndpoint.html) API를 호출하여 엔드포인트를 업데이트하려는 경우 호출은 실패합니다. 엔드포인트를 업데이트하기 전에 [DeregisterScalableTarget](https://docs.aws.amazon.com/autoscaling/application/APIReference/API_DeregisterScalableTarget.html) Application Auto Scaling API 작업을 호출하여 이 엔드포인트에 대해 구성된 모든 크기 조정 정책을 삭제한 다음 크기 조정 가능 대상으로서 변형을 등록 취소합니다. 엔드포인트를 업데이트한 이후 업데이트된 변형을 크기 조정 가능한 대상으로 등록하고 크기 조정 정책을 첨부할 수 있습니다.

한 가지 예외가 있습니다. 오토 스케일링에 대해 구성된 변형의 모델을 변경하는 경우, Amazon SageMaker AI 오토 스케일링은 이 업데이트를 허용합니다. 이는 모델 변경이 일반적으로 크기 조정 작업을 변경하는 데 충분한 성능에 영향을 미치지 않기 때문입니다. 오토 스케일링에 대해 구성된 변형의 모델을 업데이트하는 경우 모델 변경이 성능과 크기 조정 작업에 큰 영향을 미치지 않도록 해야 합니다.

오토 스케일링이 적용된 SageMaker AI 엔드포인트를 업데이트할 경우 다음 단계를 완료하세요.

**오토 스케일링이 적용된 엔드포인트를 업데이트하려면**

1. [DeregisterScalableTarget](https://docs.aws.amazon.com/autoscaling/application/APIReference/API_DeregisterScalableTarget.html)을 호출하여 엔드포인트를 확장 가능 대상에서 등록 취소합니다.

1. 업데이트 작업이 진행되는 동안(또는 이전 단계에서 오토 스케일링을 해제한 경우)에는 오트 스케일링이 차단되므로 업데이트 중에 엔드포인트에 대한 인스턴스 수를 늘리기 위한 추가 예방 조치를 취할 수 있습니다. 이렇게 하려면 [UpdateEndpointWeightsAndCapacities](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateEndpointWeightsAndCapacities.html)를 호출하여 엔드포인트에서 호스팅되는 프로덕션 변형에 대한 인스턴스 수를 업데이트하세요.

1. 응답의 `EndpointStatus` 필드 값이 `InService`일 때까지 [DescribeEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeEndpoint.html)를 반복하여 호출합니다.

1. [DescribeEndpointConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeEndpointConfig.html)를 호출하여 현재 엔드포인트 구성의 값을 얻습니다.

1. [CreateEndpointConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateEndpointConfig.html)를 호출하여 새로운 엔드포인트 구성을 생성합니다. 기존 인스턴스 수 또는 가중치를 유지하려는 프로덕션 변형의 경우 이전 단계의 [DescribeEndpointConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeEndpointConfig.html) 호출에 대한 응답과 동일한 변형 이름을 사용합니다. 다른 모든 값에는 이전 단계에서 [DescribeEndpointConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeEndpointConfig.html)를 호출할 때 응답으로 받은 값을 사용합니다.

1. [UpdateEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateEndpoint.html)를 호출하여 엔드포인트를 업데이트합니다. 이전 단계에서 생성한 엔드포인트 구성을 `EndpointConfig` 필드로 지정합니다. 인스턴스 수 또는 가중치 같은 변형 속성을 유지하려면 `RetainAllVariantProperties` 파라미터 값을 `True`로 설정합니다. 이는 같은 이름의 프로덕션 변형이 새로운 `EndpointConfig`가 있는 `InitialInstanceCount` 필드의 값에 관계없이 `DescribeEndpoint` 호출에 대한 응답에서 가장 최근의 `DesiredInstanceCount`로 업데이트되도록 지정합니다.

1. (선택 사항) [RegisterScalableTarget](https://docs.aws.amazon.com/autoscaling/application/APIReference/API_RegisterScalableTarget.html) 및 [PutScalingPolicy](https://docs.aws.amazon.com/autoscaling/application/APIReference/API_PutScalingPolicy.html)을 호출하여 오토 스케일링 다시 활성화.

**참고**  
1단계와 7단계는 다음과 같은 변경 사항으로 엔드포인트를 업데이트하는 경우에만 필요합니다.  
오토 스케일링이 구성된 프로덕션 변형에 대한 인스턴스 유형 변경
오토 스케일링이 구성된 프로덕션 변형 제거