View a markdown version of this page

Amazon CloudWatch 지표를 사용하여 용량 예약 사용량 모니터링 - Amazon SageMaker AI

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Amazon CloudWatch 지표를 사용하여 용량 예약 사용량 모니터링

Amazon CloudWatch 지표를 사용하여 SageMaker 훈련 계획과 관련된 용량 예약의 사용률을 모니터링할 수 있습니다. 이 기능을 사용하면 개별 플랜 수준과 계정의 모든 플랜에서 인스턴스 사용량에 대한 과거 및 실시간 지표에 모두 액세스할 수 있으므로 용량 및 비용에 대해 정보에 입각한 결정을 내릴 수 있습니다. 이러한 지표는 계정에 직접 게시되며 SageMaker 훈련 계획 서비스는 해당 지표에 액세스할 수 없습니다.

온보딩 고려 사항

지표를 게시하려면 서비스 AWSServiceRoleForSageMakerCapacityReservation 연결 역할(SLR)이 계정에 있어야 합니다. 계정 역할에 iam:CreateServiceLinkedRole 권한을 추가해야 합니다. SageMaker AI는 다음에를 호출할 때 필요한 SLR을 자동으로 설정합니다CreateTrainingPlan. SLR이 설정되면 새 플랜 구매에 CloudWatch 지표를 사용할 수 있습니다.

IAM 정책에 다음 문을 추가해야 합니다.

{ "Effect": "Allow", "Action": "iam:CreateServiceLinkedRole", "Resource": "*", "Condition": { "StringEquals": { "iam:AWSServiceName": "capacityreservation.sagemaker.amazonaws.com" } } }
참고

Resource 필드가 "*" (의 경우 필수CreateServiceLinkedRole)로 설정된 동안 Condition 블록은 SageMaker AI 용량 예약 SLR만 생성하도록이 권한을 제한합니다. 또한 어떤 이유로든 역할이 삭제되면 API 또는 콘솔을 통해 다음 CreateTrainingPlan 호출 시 역할이 다시 생성됩니다.

수동으로 서비스 연결 역할 생성

다음 명령을 실행하여 SageMaker AI를 사용하여 설정하는 AWS CLI 대신를 통해 SLR을 생성할 수도 있습니다.

aws iam create-service-linked-role --aws-service-name capacityreservation.sagemaker.amazonaws.com

이 명령은 계정에 AWSServiceRoleForSageMakerCapacityReservation 역할을 생성합니다. 서비스 연결 역할에 대한 자세한 내용은 서비스 연결 역할 사용을 참조하세요.

중요

서비스는 SLR이 생성된 후에만 지표 게시를 시작합니다. SLR 생성 전에 구매한 플랜에는 CloudWatch의 이전 사용률 데이터가 표시되지 않습니다.

용량 예약 사용량 지표

SageMaker AI는 aws/sagemaker/CapacityReservations 네임스페이스에 다음 지표를 게시합니다.

지표 설명
UsedInstanceCount 현재 사용 중인 인스턴스 수입니다. 단위: 수
AvailableInstanceCount 사용 가능한 인스턴스 수입니다. 단위: 수
TotalInstanceCount 훈련 계획의 총 인스턴스 수입니다. 단위: 수
InstanceUtilization 현재 사용 중인 예약 용량 인스턴스의 비율입니다. 단위: 백분율

용량 예약 지표 차원

다음 차원을 사용하여 지표를 필터링할 수 있습니다.

차원 설명
ReservationName 이름을 기준으로 지표를 필터링합니다.
ComponentType SageMaker HyperPod 클러스터, 훈련 작업, 추론 엔드포인트 또는 Studio 앱과 같은 SageMaker AI 구성 요소를 기준으로 지표를 필터링합니다.
AvailabilityZone 가용 영역을 기준으로 지표를 필터링합니다.
InstanceType 인스턴스 유형별로 지표를 필터링합니다.
ReservationType 예약 유형(TrainingPlan)을 기준으로 지표를 필터링합니다.

용량 예약에 대한 Amazon CloudWatch 지표 보기

Amazon CloudWatch 콘솔 또는를 사용하여 용량 예약 지표를 볼 수 있습니다 AWS CLI.

Amazon CloudWatch 콘솔을 사용하여 용량 예약 지표를 보려면
  1. https://console.aws.amazon.com/cloudwatch/에서 CloudWatch 콘솔을 엽니다.

  2. 탐색 창에서 지표를 선택한 다음 모든 지표를 선택합니다.

  3. aws/sagemaker/CapacityReservations 네임스페이스를 선택합니다.

  4. 필터링할 지표 차원을 선택합니다.

  5. 지표 옆의 확인란을 선택하여 그래프로 표시합니다.

를 사용하여 사용 가능한 지표를 나열하려면 다음 명령을 AWS CLI실행합니다.

aws cloudwatch list-metrics --namespace "aws/sagemaker/CapacityReservations"