

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Rencana pelatihan pemanfaatan untuk cluster Amazon SageMaker HyperPod
<a name="training-plan-utilization-for-hyperpod"></a>

Untuk menggunakan rencana SageMaker pelatihan untuk SageMaker HyperPod klaster Amazon, Anda menentukan rencana pelatihan yang ingin Anda gunakan di tingkat instans cluster saat membuat atau memperbarui klaster Anda. 

**catatan**  
Rencana pelatihan harus dalam `Active` status `Scheduled` atau yang akan digunakan oleh HyperPod cluster.
Pastikan konfigurasi klaster sejajar dengan Availability Zone (AZ) yang ditentukan dalam rencana pelatihan Anda.  
Untuk pengaturan VPC, lokasi sumber daya, dan konfigurasi grup keamanan, lihat [Menyiapkan SageMaker HyperPod dengan VPC Amazon khusus](sagemaker-hyperpod-prerequisites.md#sagemaker-hyperpod-prerequisites-optional-vpc) di dokumentasi. SageMaker HyperPod  
Jika menyiapkan HyperPod dengan Amazon FSx untuk Lustre, pelajari tentang pemilihan Wilayah dan AZ, tinjau persyaratan konfigurasi VPC, dan pahami praktik terbaik penyelarasan AZ di. [(Opsional) Menyiapkan SageMaker HyperPod dengan Amazon FSx untuk Lustre](sagemaker-hyperpod-prerequisites.md#sagemaker-hyperpod-prerequisites-optional-fsx)
Anda dapat memilih paket untuk setiap grup instans Anda. Namun, kami tidak merekomendasikan penggunaan rencana pelatihan untuk grup instans utama klaster, karena node primer memerlukan sumber daya yang berkelanjutan dan stabil yang tidak selaras dengan durasi tetap dan sifat kapasitas rencana pelatihan yang berpotensi terputus-putus.

**Topics**
+ [Buat SageMaker HyperPod cluster tentang rencana pelatihan menggunakan konsol SageMaker AI](use-training-plan-for-hyperpod-creation-using-console.md)
+ [Perbarui SageMaker HyperPod cluster tentang rencana pelatihan menggunakan konsol SageMaker AI](use-training-plan-for-hyperpod-update-using-console.md)
+ [Buat SageMaker HyperPod klaster pada rencana pelatihan menggunakan SageMaker API, atau AWS CLI](use-training-plan-for-hyperpod-creation-using-api-cli-sdk.md)
+ [Memperbarui SageMaker HyperPod klaster pada rencana pelatihan menggunakan SageMaker API, atau AWS CLI](use-training-plan-for-hyperpod-update-using-api-cli-sdk.md)

# Buat SageMaker HyperPod cluster tentang rencana pelatihan menggunakan konsol SageMaker AI
<a name="use-training-plan-for-hyperpod-creation-using-console"></a>

Untuk membuat SageMaker HyperPod cluster menggunakan rencana pelatihan dari UI konsol SageMaker AI, ikuti langkah-langkah berikut:

1. Arahkan ke konsol SageMaker AI di [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Di panel navigasi kiri, pilih **Hyperpod**, lalu **Buat** cluster.

1. Saat mengonfigurasi grup instans, Anda dapat memilih paket yang sesuai dengan kebutuhan kapasitas komputasi Anda.

![\[SageMaker Antarmuka konsol AI menampilkan jendela modal untuk membuat grup instance dalam sebuah SageMaker HyperPod cluster. Formulir ini mencakup bidang untuk nama grup instance, jenis instans, kuantitas, kapasitas instans (dengan opsi untuk rencana sesuai permintaan dan pelatihan), dan jalur direktori untuk skrip siklus hidup saat dibuat.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/training-plans/tp-create-hyperpod-cluster.png)


Tinjau dan buat cluster Anda. Kelompok instans yang menggunakan rencana pelatihan meningkatkan jumlah instans target yang ditentukan ketika rencana pelatihan menjadi`Active`, tergantung pada kapasitas yang tersedia. Tiga puluh menit sebelum setiap periode Kapasitas Cadangan berakhir, grup instans mulai memperkecil hingga nol instance. Status yang diperkecil ini berlanjut hingga periode Kapasitas Cadangan berikutnya dimulai atau rencana berakhir. Sepanjang proses ini, grup instans yang sehat mempertahankan `InService` status setelah pembuatan awalnya, terlepas dari jumlah instans saat ini.

# Perbarui SageMaker HyperPod cluster tentang rencana pelatihan menggunakan konsol SageMaker AI
<a name="use-training-plan-for-hyperpod-update-using-console"></a>

Anda dapat memperbarui, menghapus, atau menambahkan rencana pelatihan ke SageMaker HyperPod cluster yang ada menggunakan UI konsol SageMaker AI. Untuk memperbarui grup instance SageMaker HyperPod klaster, ikuti langkah-langkah berikut:

1. Arahkan ke konsol SageMaker AI di [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Di panel navigasi kiri, pilih **Hyperpod**.

1. Arahkan ke halaman detail cluster dengan mengikuti hyperlink yang terkait dengan nama cluster.

1. Saat mengonfigurasi grup instans, Anda dapat memperbarui paket agar selaras dengan kebutuhan kapasitas komputasi baru Anda.

![\[SageMaker Antarmuka konsol AI menampilkan jendela modal untuk memperbarui grup instans dalam sebuah SageMaker HyperPod cluster. Formulir ini mencakup bidang untuk nama grup instance, jenis instans, kuantitas, kapasitas instans (dengan opsi untuk rencana sesuai permintaan dan pelatihan), dan jalur direktori untuk skrip siklus hidup saat dibuat.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/training-plans/tp-update-hyperpod-clusters.png)


Tinjau dan perbarui klaster Anda.

# Buat SageMaker HyperPod klaster pada rencana pelatihan menggunakan SageMaker API, atau AWS CLI
<a name="use-training-plan-for-hyperpod-creation-using-api-cli-sdk"></a>

Untuk menggunakan rencana SageMaker pelatihan untuk SageMaker HyperPod klaster Amazon Anda, tentukan ARN dari rencana pelatihan yang ingin Anda gunakan dalam [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html#sagemaker-Type-ClusterInstanceGroupSpecification-TrainingPlanArn](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html#sagemaker-Type-ClusterInstanceGroupSpecification-TrainingPlanArn)parameter [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html)saat memanggil operasi [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateCluster.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateCluster.html)API. 

Pastikan subnet yang terkait dengan AZ yang ditunjuk dari paket Anda disertakan dalam konfigurasi klaster Anda. `VPCConfig` Anda dapat mengambil rencana pelatihan dalam respons panggilan [``DescribeTrainingPlan](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlan.html)API. `AvailabilityZone`

Contoh berikut menggambarkan cara membuat SageMaker HyperPod cluster baru dan menyediakan grup instance dengan rencana pelatihan dalam `--instance-groups` atribut `create-cluster` AWS CLI perintah. 

```
# Create a cluster         
aws sagemaker create-cluster \
  --cluster-name cluster-name \
  --instance-groups '[ \
        { \
            "InstanceCount": 1,\
            "InstanceGroupName": "controller-nodes",\
            "InstanceType": "ml.t3.xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id:role/execution_role",\
            "ThreadsPerCore": 1,\
        },\
        { \
            "InstanceCount": 2, \
            "InstanceGroupName": "worker-nodes",\
            "InstanceType": "p4d.24xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id}:role/execution_role}",\
            "ThreadsPerCore": 1,\
            "TrainingPlanArn": training_plan_arn,\
        }]'
```

Untuk informasi tentang cara membuat HyperPod klaster menggunakan AWS CLI, lihat [https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-cluster.html](https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-cluster.html).

Setelah membuat klaster, Anda dapat memverifikasi bahwa grup instans Anda telah menetapkan kapasitas dengan benar dari rencana pelatihan dengan memanggil `DescribeCluster` API.

```
aws sagemaker describe-cluster --cluster-name cluster-name
```

# Memperbarui SageMaker HyperPod klaster pada rencana pelatihan menggunakan SageMaker API, atau AWS CLI
<a name="use-training-plan-for-hyperpod-update-using-api-cli-sdk"></a>

Anda dapat menambahkan, memperbarui, atau menghapus rencana pelatihan dengan memperbarui grup instance dari cluster yang ada menggunakan `update-cluster` AWS CLI perintah. Contoh berikut mengilustrasikan cara memperbarui SageMaker HyperPod cluster dan menyediakan grup instans dengan rencana pelatihan baru.

```
# Update a cluster
aws sagemaker update-cluster \
  --cluster-name cluster-name \
  --instance-groups '[ \
        { \
            "InstanceCount": 1,\
            "InstanceGroupName": "controller-nodes",\
            "InstanceType": "ml.t3.xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id:role/execution_role",\
            "ThreadsPerCore": 1,\
        },\
        { \
            "InstanceCount": 2, \
            "InstanceGroupName": "worker-nodes",\
            "InstanceType": "p4d.24xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id}:role/execution_role}",\
            "ThreadsPerCore": 1,\
            "TrainingPlanArn": training_plan_arn,\
        },\
        {\
            "InstanceCount": 1,\
            "InstanceGroupName": "worker-nodes-2",\
            "InstanceType": "p4d.24xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id:role/execution_role",\
            "ThreadsPerCore": 1,\
            "TrainingPlanArn": training_plan_arn,\
        }\
    ]'
```