

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# Amazon SageMaker HyperPod 클러스터의 훈련 계획 사용률
<a name="training-plan-utilization-for-hyperpod"></a>

Amazon SageMaker HyperPod 클러스터에 SageMaker 훈련 계획을 사용하려면 클러스터를 생성하거나 업데이트할 때 클러스터 인스턴스 수준에서 사용할 훈련 계획을 지정합니다.

**참고**  
훈련 계획을 HyperPod 클러스터에서 사용하려면 상태가 `Scheduled` 또는 `Active`여야 합니다.
클러스터 구성이 훈련 계획에 지정된 가용 영역(AZ)과 일치하는지 확인합니다.  
VPC 설정, 리소스 위치 및 보안 그룹 구성은 SageMaker HyperPod 설명서의 [사용자 지정 Amazon VPC를 사용하여 SageMaker HyperPod 설정](sagemaker-hyperpod-prerequisites.md#sagemaker-hyperpod-prerequisites-optional-vpc) 섹션을 참조하세요.  
Amazon FSx for Lustre로 HyperPod를 설정하는 경우 리전 및 AZ 선택에 대해 알아보고, VPC 구성 요구 사항을 검토하고, [(선택 사항) Amazon FSx for Lustre로 SageMaker HyperPod 설정](sagemaker-hyperpod-prerequisites.md#sagemaker-hyperpod-prerequisites-optional-fsx)의 AZ 조율 모범 사례를 이해합니다.
각 인스턴스 그룹에 대한 계획을 선택할 수 있습니다. 그러나 클러스터의 기본 인스턴스 그룹에 대한 훈련 계획을 사용하지 않는 것이 좋습니다. 프라이머리 노드에는 고정된 기간과 잠재적으로 불연속적인 훈련 계획 용량에 맞지 않는 지속적이고 안정적인 리소스가 필요하기 때문입니다.

**Topics**
+ [SageMaker AI 콘솔을 사용하여 훈련 계획에 SageMaker HyperPod 클러스터 생성](use-training-plan-for-hyperpod-creation-using-console.md)
+ [SageMaker AI 콘솔을 사용하여 훈련 계획에서 SageMaker HyperPod 클러스터 업데이트](use-training-plan-for-hyperpod-update-using-console.md)
+ [SageMaker API를 사용하여 훈련 계획에 SageMaker HyperPod 클러스터를 생성하거나 AWS CLI](use-training-plan-for-hyperpod-creation-using-api-cli-sdk.md)
+ [SageMaker API를 사용하여 훈련 계획에서 SageMaker HyperPod 클러스터를 업데이트하거나 AWS CLI](use-training-plan-for-hyperpod-update-using-api-cli-sdk.md)

# SageMaker AI 콘솔을 사용하여 훈련 계획에 SageMaker HyperPod 클러스터 생성
<a name="use-training-plan-for-hyperpod-creation-using-console"></a>

SageMaker AI 콘솔 UI의 훈련 계획을 사용하여 SageMaker HyperPod 클러스터를 생성하려면 다음 단계를 따르세요.

1. [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/)에서 SageMaker AI 콘솔로 이동합니다.

1. 왼쪽 탐색 창에서 **Hyperpod**를 선택하고 **클러스터 생성**을 선택합니다.

1. 인스턴스 그룹을 구성할 때 컴퓨팅 용량 요구 사항에 맞는 계획을 선택할 수 있습니다.

![\[SageMaker HyperPod 클러스터 내에서 인스턴스 그룹을 생성하기 위한 모달 창을 보여주는 SageMaker AI 콘솔 인터페이스입니다. 양식에 인스턴스 그룹 이름, 인스턴스 유형, 수량, 인스턴스 용량(온디맨드 및 훈련 계획 옵션 포함), 생성 시 수명 주기 스크립트의 디렉터리 경로에 대한 필드가 포함되어 있습니다.\]](http://docs.aws.amazon.com/ko_kr/sagemaker/latest/dg/images/training-plans/tp-create-hyperpod-cluster.png)


클러스터를 검토하고 생성합니다. 훈련 계획을 사용하는 인스턴스 그룹은 훈련 계획이 `Active`가 되면 사용 가능한 용량에 따라 지정된 목표 인스턴스 수로 스케일 업됩니다. 각 예약 용량 기간이 종료되기 30분 전에 인스턴스 그룹은 0개의 인스턴스로 스케일 다운을 시작합니다. 이 스케일 다운된 상태는 다음 예약 용량 기간이 시작되거나 계획이 종료될 때까지 지속됩니다. 이 프로세스 전체에서 정상 인스턴스 그룹은 현재 인스턴스 수와 관계없이 처음 생성 후 `InService` 상태를 유지합니다.

# SageMaker AI 콘솔을 사용하여 훈련 계획에서 SageMaker HyperPod 클러스터 업데이트
<a name="use-training-plan-for-hyperpod-update-using-console"></a>

SageMaker AI 콘솔 UI를 사용하여 기존 SageMaker HyperPod 클러스터에 훈련 계획을 업데이트, 제거 또는 추가할 수 있습니다. SageMaker HyperPod 클러스터의 인스턴스 그룹을 업데이트하려면 다음 단계를 따르세요.

1. [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/)에서 SageMaker AI 콘솔로 이동합니다.

1. 왼쪽 탐색 창에서 **HyperPod**를 선택합니다.

1. 클러스터 이름과 연결된 하이퍼링크를 따라 클러스터의 세부 정보 페이지로 이동합니다.

1. 인스턴스 그룹을 구성할 때 새 컴퓨팅 용량 요구 사항에 맞게 계획을 업데이트할 수 있습니다.

![\[SageMaker HyperPod 클러스터 내에서 인스턴스 그룹을 업데이트하기 위한 모달 창을 보여주는 SageMaker AI 콘솔 인터페이스입니다. 양식에 인스턴스 그룹 이름, 인스턴스 유형, 수량, 인스턴스 용량(온디맨드 및 훈련 계획 옵션 포함), 생성 시 수명 주기 스크립트의 디렉터리 경로에 대한 필드가 포함되어 있습니다.\]](http://docs.aws.amazon.com/ko_kr/sagemaker/latest/dg/images/training-plans/tp-update-hyperpod-clusters.png)


클러스터를 검토하고 업데이트합니다.

# SageMaker API를 사용하여 훈련 계획에 SageMaker HyperPod 클러스터를 생성하거나 AWS CLI
<a name="use-training-plan-for-hyperpod-creation-using-api-cli-sdk"></a>

Amazon SageMaker HyperPod 클러스터에 SageMaker 훈련 계획을 사용하려면 [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateCluster.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateCluster.html) API 작업을 직접적으로 호출할 때 [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html)의 [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html#sagemaker-Type-ClusterInstanceGroupSpecification-TrainingPlanArn](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html#sagemaker-Type-ClusterInstanceGroupSpecification-TrainingPlanArn) 파라미터에 사용할 훈련 계획의 ARN을 지정합니다.

계획의 지정된 AZ와 연결된 서브넷이 클러스터 구성의 `VPCConfig`에 포함되어 있는지 확인합니다. [``DescribeTrainingPlan](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlan.html) API 직접 호출의 응답으로 훈련 계획의 `AvailabilityZone`을 가져올 수 있습니다.

다음 샘플은 새 SageMaker HyperPod 클러스터를 생성하고 인스턴스 그룹에 `create-cluster` AWS CLI 명령 `--instance-groups` 속성의 훈련 계획을 제공하는 방법을 보여줍니다.

```
# Create a cluster         
aws sagemaker create-cluster \
  --cluster-name cluster-name \
  --instance-groups '[ \
        { \
            "InstanceCount": 1,\
            "InstanceGroupName": "controller-nodes",\
            "InstanceType": "ml.t3.xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id:role/execution_role",\
            "ThreadsPerCore": 1,\
        },\
        { \
            "InstanceCount": 2, \
            "InstanceGroupName": "worker-nodes",\
            "InstanceType": "p4d.24xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id}:role/execution_role}",\
            "ThreadsPerCore": 1,\
            "TrainingPlanArn": training_plan_arn,\
        }]'
```

를 사용하여 HyperPod 클러스터를 생성하는 방법에 대한 자세한 내용은 섹션을 AWS CLI참조하세요[https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-cluster.html](https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-cluster.html).

클러스터를 생성한 후 `DescribeCluster` API를 직접적으로 호출하여 훈련 계획에서 인스턴스 그룹에 용량이 제대로 할당되었는지 확인할 수 있습니다.

```
aws sagemaker describe-cluster --cluster-name cluster-name
```

# SageMaker API를 사용하여 훈련 계획에서 SageMaker HyperPod 클러스터를 업데이트하거나 AWS CLI
<a name="use-training-plan-for-hyperpod-update-using-api-cli-sdk"></a>

`update-cluster` AWS CLI 명령을 사용하여 기존 클러스터의 인스턴스 그룹을 업데이트하여 훈련 계획을 추가, 업데이트 또는 제거할 수 있습니다. 다음 샘플은 SageMaker HyperPod 클러스터를 업데이트하고 인스턴스 그룹에 새 훈련 계획을 제공하는 방법을 보여줍니다.

```
# Update a cluster
aws sagemaker update-cluster \
  --cluster-name cluster-name \
  --instance-groups '[ \
        { \
            "InstanceCount": 1,\
            "InstanceGroupName": "controller-nodes",\
            "InstanceType": "ml.t3.xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id:role/execution_role",\
            "ThreadsPerCore": 1,\
        },\
        { \
            "InstanceCount": 2, \
            "InstanceGroupName": "worker-nodes",\
            "InstanceType": "p4d.24xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id}:role/execution_role}",\
            "ThreadsPerCore": 1,\
            "TrainingPlanArn": training_plan_arn,\
        },\
        {\
            "InstanceCount": 1,\
            "InstanceGroupName": "worker-nodes-2",\
            "InstanceType": "p4d.24xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id:role/execution_role",\
            "ThreadsPerCore": 1,\
            "TrainingPlanArn": training_plan_arn,\
        }\
    ]'
```