

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Pesan rencana pelatihan untuk pekerjaan atau HyperPod cluster pelatihan Anda
<a name="reserve-capacity-with-training-plans"></a>

Paket SageMaker pelatihan Amazon adalah kemampuan yang memungkinkan Anda memesan dan membantu memaksimalkan penggunaan kapasitas GPU untuk beban kerja pelatihan model AI skala besar. Fitur ini menyediakan akses ke jenis instans yang sangat dicari yang mencakup berbagai opsi komputasi yang dipercepat GPU, termasuk teknologi GPU NVIDIA terbaru dan chip trainium. AWS Dengan rencana SageMaker pelatihan, Anda dapat mengamankan akses yang dapat diprediksi ke sumber daya komputasi dengan permintaan tinggi dan berkinerja tinggi ini dalam jadwal dan anggaran yang Anda tentukan, tanpa perlu mengelola infrastruktur yang mendasarinya. Fleksibilitas ini sangat berharga bagi organisasi yang menghadapi tantangan untuk memperoleh dan menjadwalkan instance komputasi kelebihan langganan ini untuk beban kerja AI yang sangat penting bagi misi mereka.

## Apa itu rencana SageMaker pelatihan
<a name="training-plans-what-is"></a>

SageMaker Rencana pelatihan memungkinkan Anda untuk memesan kapasitas komputasi yang disesuaikan dengan kebutuhan sumber daya target Anda, seperti pekerjaan SageMaker pelatihan atau SageMaker HyperPod cluster. Layanan secara otomatis menangani reservasi, penyediaan sumber daya komputasi yang dipercepat, penyiapan infrastruktur, eksekusi beban kerja, dan pemulihan dari kegagalan infrastruktur.

SageMaker rencana pelatihan terdiri dari satu atau lebih blok Kapasitas Cadangan, masing-masing ditentukan oleh parameter berikut:
+ Jenis contoh tertentu
+ Jumlah contoh
+ Zona Ketersediaan
+ Durasi
+ Waktu mulai dan berakhir

**catatan**  
Rencana pelatihan khusus untuk sumber daya target mereka (baik SageMaker Training Job atau SageMaker HyperPod) dan tidak dapat dipertukarkan.
Beberapa blok Kapasitas Cadangan dalam satu rencana pelatihan mungkin terputus-putus. Ini berarti mungkin ada celah antara blok Kapasitas Cadangan.

## Manfaat rencana SageMaker pelatihan
<a name="training-plans-benefits"></a>

SageMaker rencana pelatihan menawarkan manfaat berikut:
+ **Akses yang Dapat Diprediksi**: Cadangan kapasitas GPU untuk beban kerja pembelajaran mesin Anda dalam kerangka waktu yang ditentukan.
+ **Manajemen Biaya**: Rencana dan anggaran untuk persyaratan pelatihan skala besar sebelumnya.
+ **Manajemen Sumber Daya Otomatis**: rencana SageMaker pelatihan menangani penyediaan dan pengelolaan infrastruktur.
+ **Fleksibilitas**: Buat rencana pelatihan untuk berbagai sumber daya, termasuk pekerjaan SageMaker pelatihan dan SageMaker HyperPod cluster.
+ **Toleransi Kesalahan**: Manfaatkan pemulihan otomatis dari kegagalan infrastruktur dan migrasi beban kerja di seluruh Availability Zone untuk pekerjaan pelatihan SageMaker AI.

## SageMaker rencana pelatihan reservasi terlebih dahulu dan waktu mulai yang fleksibel
<a name="training-plan-reservation-timing"></a>

SageMaker rencana pelatihan memungkinkan Anda untuk memesan kapasitas komputasi terlebih dahulu, dengan waktu dan durasi mulai yang fleksibel. 
+ **Pemesanan di muka**: Anda dapat memesan rencana pelatihan hingga 8 minggu (56 hari) sebelum tanggal mulai.
+ **Waktu tunggu minimum**: penawaran rencana SageMaker pelatihan mungkin tersedia untuk dimulai dalam waktu 30 menit setelah reservasi, tergantung ketersediaan.
**catatan**  
Anda dapat mencari dan membeli paket yang akan dapat diakses dalam waktu 30 menit. Untuk memastikan aktivasi tepat waktu, transaksi pembayaran harus berhasil diselesaikan setidaknya 5 menit sebelum waktu mulai yang diinginkan. Misalnya, jika Anda ingin rencana dimulai pada pukul 14:00, Anda dapat melakukan pencarian menit terakhir hingga pukul 13.30 dan menyelesaikan pembelian Anda pada pukul 13:55 untuk menjamin paket siap pada pukul 14:00.
+ **Durasi reservasi dan kuantitas instans**: rencana SageMaker pelatihan memungkinkan Anda memesan instans dengan opsi durasi dan kuantitas tertentu. Untuk jenis instans yang tersedia dalam opsi tertentu Wilayah AWS, durasi, dan kuantitas, lihat[Jenis instans yang didukung Wilayah AWS,, dan harga](#training-plans-supported-instances-and-regions).
+ **Waktu akhir**: Rencana Pelatihan selalu berakhir pada pukul 11:30 UTC pada hari terakhir reservasi.
+ **Penghentian rencana pelatihan**: Jika Anda menggunakan pekerjaan pelatihan sebagai sumber daya target dan 30 menit tetap dalam Kapasitas Cadangan, rencana SageMaker pelatihan memulai proses penghentian instans yang sedang berjalan di dalam blok tersebut hingga Kapasitas Cadangan berikutnya menjadi aktif. Anda mempertahankan akses penuh ke rencana pelatihan Anda hingga 30 menit sebelum waktu akhir blok Kapasitas Cadangan terakhir.

  Jika sumber daya target Anda adalah SageMaker HyperPod cluster, batas waktu ini adalah satu jam.

## SageMaker rencana pelatihan alur kerja pengguna
<a name="training-plans-workflow"></a>

SageMaker rencana pelatihan bekerja melalui langkah-langkah berikut:

Langkah admin:

1. **Cari dan tinjau**: Temukan penawaran paket yang tersedia yang sesuai dengan persyaratan komputasi Anda, seperti jenis instans, hitungan, waktu mulai, dan durasi.

1. **Buat rencana**: Pesan rencana pelatihan yang memenuhi kebutuhan Anda menggunakan ID penawaran paket pilihan Anda.

1. **Pembayaran dan penjadwalan**: Setelah pembayaran di muka berhasil, status paket menjadi. `Scheduled`

Langkah-langkah untuk pengguna rencana/insinyur ML:

1. **Alokasi sumber daya**: Gunakan paket Anda untuk mengantri pekerjaan pelatihan SageMaker AI atau mengalokasikan ke grup instans SageMaker HyperPod klaster.

1. **Aktivasi**: Ketika tanggal mulai rencana tiba, itu menjadi`Active`. Berdasarkan kapasitas cadangan yang tersedia, rencana SageMaker pelatihan secara otomatis meluncurkan pekerjaan pelatihan atau grup instans penyediaan.

**catatan**  
Status rencana pelatihan beralih dari `Scheduled` `Active` kapan periode Kapasitas Cadangan dimulai, dan kemudian kembali ke `Scheduled` saat menunggu periode Kapasitas Cadangan berikutnya dimulai. 

Diagram berikut memberikan gambaran komprehensif tentang bagaimana rencana SageMaker pelatihan berinteraksi dengan yang berbeda[target resources](#training-plans-target-resources), menggambarkan siklus hidup rencana dan perannya dalam alokasi sumber daya untuk pekerjaan pelatihan dan cluster. SageMaker SageMaker HyperPod 
+ **Rencana pelatihan untuk SageMaker Training Job**: Diagram pertama menggambarkan end-to-end alur kerja interaksi antara rencana pelatihan dan Training SageMaker Job.   
![\[Penagihan, Reservasi kapasitas dengan rencana pelatihan, dan SageMaker Training Job. Ilustrasi siklus hidup rencana pelatihan, dan status pekerjaan pelatihan yang dikelola oleh Administrator dan Insinyur ML.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/training-plans/tp-training-plan-for-training-jobs.png)
+ **Rencana pelatihan untuk SageMaker HyperPod cluster**: Diagram kedua menggambarkan end-to-end alur kerja interaksi antara rencana pelatihan dan kelompok instance. SageMaker HyperPod   
![\[Penagihan, Reservasi kapasitas dengan rencana pelatihan, dan alur kerja manajemen grup instans. Ilustrasi siklus hidup rencana pelatihan dan status grup instans yang dikelola oleh Administrator dan Insinyur ML.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/training-plans/tp-training-plan-for-hyperpod.png)

## Jenis instans yang didukung Wilayah AWS,, dan harga
<a name="training-plans-supported-instances-and-regions"></a>

Rencana pelatihan mendukung reservasi untuk jenis instans berkinerja tinggi tertentu berikut, masing-masing tersedia dalam pilihan: Wilayah AWS
+ **ml.p4d.24xlarge**
+ **ml.p5.48xbesar**
+ **ml.p5e.48xlarge**
+ **ml.p5en.48xlarge**
+ **ml.trn1.32xbesar**
+ **ml.trn2.48xlarge**
+ **ml.p6-b200.48xlarge**
+ **ml.c6i-32xlargesc**

**UltraServers**
+ **ml.p6e-gb200.36xlarge**
+ **ml.p6e-gb200.72xbesar**

**catatan**  
Ketersediaan jenis instans dapat berubah seiring waktu. Untuk up-to-date informasi terbanyak tentang jenis instans yang tersedia menurut Wilayah, serta harga masing-masing, lihat [SageMaker Harga](https://aws.amazon.com/sagemaker-ai/pricing/). Gulir ke bawah ke bagian **paket pelatihan SageMaker HyperPod fleksibel Amazon** di bawah **Harga Sesuai Permintaan**. Pilih Wilayah untuk melihat daftar jenis instans yang tersedia.

Ketersediaan di beberapa wilayah memungkinkan untuk memilih lokasi yang paling cocok untuk beban kerja, dengan mempertimbangkan faktor-faktor seperti persyaratan residensi data dan kedekatan dengan layanan lain AWS .

**penting**  
Anda dapat menggunakan rencana SageMaker pelatihan untuk memesan instans dengan durasi reservasi dan opsi kuantitas instans berikut.  
Durasi reservasi tersedia dalam kenaikan 1 hari dari 1 hingga 182 hari.
Opsi kuantitas instance reservasi adalah 1, 2, 4, 8, 16, 32 atau 64 instance.
Pastikan bahwa Pekerjaan Pelatihan atau kuota HyperPod layanan memungkinkan jumlah maksimum instans per jenis instans yang melebihi jumlah instans yang ditentukan dalam paket Anda. Untuk melihat kuota Anda saat ini atau meminta peningkatan kuota, lihat. [Lihat kuota rencana SageMaker pelatihan menggunakan konsol AWS manajemen](training-plan-quotas.md)

## UltraServers di SageMaker AI
<a name="training-plans-ultraservers"></a>

UltraServers di SageMaker AI menawarkan serangkaian contoh yang saling berhubungan melalui domain jaringan bandwidth tinggi. Misalnya, P6e- GB200 UltraServer menghubungkan hingga 18 `p6e-gb200.36xlarge` instance di bawah satu domain NVIDIA. NVLink Dengan 4 NVIDIA Blackwell GPUs per instans, setiap P6e- GB200 UltraServer mendukung 72 GPUs, sehingga Anda dapat menjalankan beban kerja AI terbesar Anda dengan kinerja tinggi pada AI. SageMaker 

Saat Anda menggunakan UltraServers SageMaker AI, Anda mendapatkan kinerja yang dikombinasikan dengan infrastruktur terkelola SageMaker AI, fitur ketahanan kesalahan bawaan, kemampuan pemantauan terintegrasi, dan integrasi asli dengan SageMaker AI dan AWS layanan lainnya. Integrasi ini memungkinkan Anda untuk fokus pada pengembangan dan penerapan model sementara SageMaker AI menangani peningkatan berat pengelolaan infrastruktur AI yang tidak terdiferensiasi.

**catatan**  
UltraServers hanya tersedia di Zona Lokal Dallas (us-east-1-dfw-2a), yang merupakan perpanjangan dari Wilayah AS Timur (Virginia N.). Untuk informasi selengkapnya, lihat [Memulai dengan AWS Local Zone s](https://docs.aws.amazon.com/local-zones/latest/ug/getting-started.html)

### Pertimbangan-pertimbangan
<a name="training-plans-ultraservers-considerations"></a>

Pertimbangkan hal berikut saat menggunakan UltraServers dengan SageMaker AI:
+ Anda dapat menggunakan UltraServers keduanya [ SageMaker HyperPod](https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker-hyperpod.html)dan [pekerjaan SageMaker pelatihan](https://docs.aws.amazon.com/sagemaker/latest/dg/train-model.html).
+ Anda hanya dapat membeli UltraServers dalam unit penuh. Untuk informasi selengkapnya tentang informasi instans dan harga, lihat paket pelatihan SageMaker HyperPod fleksibel Amazon di [harga Amazon SageMaker AI](https://aws.amazon.com/sagemaker-ai/pricing/).
+ Jika Anda menggunakan UltraServers dengan HyperPod, HyperPod secara otomatis menambahkan label topologi ke sumber daya Anda untuk membantu Anda dengan alokasi sumber daya. Untuk informasi selengkapnya, lihat [Menggunakan penjadwalan sadar topologi](https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker-hyperpod-topology.html) di Amazon. SageMaker HyperPod
+ SageMaker AI dan UltraServers menawarkan berbagai kemampuan yang meningkatkan ketahanan beban kerja Anda, termasuk pemeriksaan preemptive dan deteksi dan mitigasi kesalahan otomatis. Bergantung pada apa masalahnya, SageMaker AI dapat menjalankan tindakan untuk memulihkan beban kerja Anda, seperti memulai ulang instance, mengganti instance yang gagal dengan suku cadang, dan mengganti gagal. UltraServers
+ Untuk ketahanan tambahan, Anda dapat mengonfigurasi instance dalam an UltraServer untuk digunakan sebagai suku cadang. Menyimpan instance cadangan di dalam UltraServer memastikan bahwa SageMaker AI dapat dengan cepat merespons kegagalan instans sambil meminimalkan dampak apa pun pada pekerjaan Anda. Kami menyarankan Anda menyimpan satu instance cadangan per UltraServer. Anda tidak perlu memesan instans cadangan apa pun, tetapi ini mungkin menghambat opsi dukungan dan memperlambat pemulihan kegagalan. Anda membeli UltraServers secara keseluruhan, sehingga jumlah suku cadang yang Anda pesan tidak memengaruhi harga.
+ Untuk melihat status dan instance di dalam UltraServer, gunakan operasi [ ListTrainingPlans](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ListTrainingPlans.html)API atau AWS konsol untuk melihat rencana pelatihan. Dengan menggunakan alat ini, Anda dapat melihat jumlah total instance yang tersedia, instance yang saat ini digunakan, instance yang tidak sehat, jumlah suku cadang yang dikonfigurasi, dan informasi lainnya. Status kesehatan yang mungkin adalah`ok`,`impaired`, dan`insufficient-data`.

## SageMaker rencana pelatihan perilaku pencarian
<a name="training-plans-search-behavior"></a>

Saat mencari penawaran rencana pelatihan, rencana SageMaker pelatihan menggunakan pendekatan berikut untuk memaksimalkan ketersediaan sumber daya dan fleksibilitas bagi pengguna, bahkan ketika permintaan tinggi dan blok Kapasitas Cadangan langka:
+ **Pencarian berkelanjutan awal**: rencana SageMaker pelatihan pertama-tama mencoba menemukan satu blok berkelanjutan dari Kapasitas Cadangan yang cocok dengan durasi yang ditentukan dalam tanggal mulai dan berakhir, sambil memenuhi semua kriteria tertentu lainnya, termasuk sumber daya target, jenis instans yang diminta, dan jumlah instance.
+ **Pencarian dua blok**: rencana SageMaker pelatihan tidak mengembalikan hasil “tidak ada kapasitas” jika satu blok Kapasitas Cadangan berkelanjutan yang memenuhi semua kriteria tidak tersedia. Sebagai gantinya, ia secara otomatis mencoba memenuhi permintaan menggunakan dua blok Kapasitas Cadangan terpisah, membagi total durasi di dua segmen waktu.

  Pendekatan dua blok ini memberikan lebih banyak fleksibilitas dalam alokasi sumber daya, berpotensi mengamankan instance permintaan tinggi yang seharusnya tidak tersedia.

**catatan**  
SageMaker rencana pelatihan mengembalikan hingga tiga penawaran dari satu atau dua segmen. Misalnya, untuk rencana durasi 48 jam, rencana SageMaker pelatihan mungkin menawarkan rencana dengan dua blok 24 jam, satu blok 48 jam terus menerus, dan dua blok dengan durasi yang tidak merata.

## Pertimbangan-pertimbangan
<a name="training-plans-considerations"></a>

**penting**  
Rencana pelatihan tidak dapat dimodifikasi setelah dibeli.
Rencana pelatihan tidak dapat dibagikan di seluruh AWS akun atau di dalam AWS Organisasi Anda.
+ Saat mencari penawaran rencana pelatihan, rencana SageMaker pelatihan menyesuaikan strategi pencariannya berdasarkan: [target resources](#training-plans-target-resources)

  **Untuk SageMaker HyperPod cluster**:
  + Penawaran terbatas pada satu Availability Zone (AZ).
  + Ini memastikan kinerja jaringan yang konsisten dan lokalitas data dalam cluster.

  **Untuk pekerjaan SageMaker pelatihan**:
  + Penawaran dapat menjangkau beberapa Availability Zone. 
  + Ini sangat relevan ketika penawaran rencana berisi beberapa kapasitas cadangan terputus-putus.
  + Misalnya, rencana mungkin mencakup kapasitas dalam AZ-A untuk satu blok Kapasitas Cadangan dan AZ-B untuk yang lain. SageMaker Rencana pelatihan dapat secara otomatis memindahkan beban kerja di seluruh Availability Zones (AZs) berdasarkan ketersediaan sumber daya.

    Pendekatan multi-AZ untuk pekerjaan pelatihan ini memberikan fleksibilitas yang lebih besar dalam alokasi sumber daya, meningkatkan peluang menemukan kapasitas yang sesuai untuk beban kerja Anda. Namun, Anda harus menyadari bahwa pekerjaan Anda mungkin berjalan berbeda AZs selama bagian yang berbeda dari periode reservasi Anda.
+ Ketika disajikan dengan penawaran dua blok, pengguna harus mempertimbangkan dengan cermat apakah alokasi split ini memenuhi persyaratan beban kerja mereka. Ini mungkin memerlukan penyesuaian penjadwalan pekerjaan atau distribusi beban kerja untuk mengakomodasi sifat reservasi yang tidak berkelanjutan.

# IAM untuk rencana SageMaker pelatihan
<a name="training-plan-iam-permissions"></a>

SageMaker rencana pelatihan memerlukan izin khusus untuk dua peran berbeda::

1. **Peran pembuat rencana**: Pengguna yang diberi peran *Pembuat Rencana* memerlukan izin untuk mencari penawaran rencana pelatihan, membuat rencana pelatihan baru, membuat daftar, dan menjelaskan rencana pelatihan.

1. **Merencanakan peran pengguna**: Pengguna dengan peran *Pengguna Paket* memerlukan izin untuk menggunakan rencana pelatihan dalam pekerjaan SageMaker pelatihan atau saat membuat dan memperbarui SageMaker HyperPod klaster.

Sebelum menggunakan rencana SageMaker pelatihan, perbarui izin berdasarkan metode akses Anda:
+ Untuk Konsol Manajemen AWS atau SageMaker SDKs pengguna: Perbarui izin peran IAM yang dikonfigurasi untuk pengguna konsol atau pengguna API.
+ Untuk AWS CLI pengguna: Pastikan AWS CLI profil Anda dikonfigurasi dengan benar dengan kredensil dan izin yang sesuai.
+ Untuk pengguna aplikasi Studio seperti JupyterLab, atur izin pada peran eksekusi yang terkait dengan ruang yang digunakan oleh aplikasi.

Anda dapat menyetel izin ini menggunakan kebijakan terkelola atau izin individual yang lebih terperinci.

Untuk informasi tentang cara memperbarui kebijakan izin untuk peran, lihat [Memperbarui izin untuk peran](https://docs.aws.amazon.com/IAM/latest/UserGuide/id_roles_update-role-permissions.html). Untuk informasi tentang cara menemukan dan memperbarui peran eksekusi, lihat[Dapatkan peran eksekusi Anda](sagemaker-roles.md#sagemaker-roles-get-execution-role).

**catatan**  
Administrator harus mempertimbangkan dengan cermat pengguna mana yang membutuhkan kemampuan untuk membuat rencana pelatihan dan menetapkan izin yang sesuai.

## Kebijakan terkelola
<a name="training-plan-managed-policies"></a>
+ Untuk pembuat rencana: [https://docs.aws.amazon.com/aws-managed-policy/latest/reference/AmazonSageMakerTrainingPlanCreateAccess.html](https://docs.aws.amazon.com/aws-managed-policy/latest/reference/AmazonSageMakerTrainingPlanCreateAccess.html)menyediakan akses untuk membuat dan mengelola rencana pelatihan.
+ Untuk pengguna paket: [https://docs.aws.amazon.com/aws-managed-policy/latest/reference/AmazonSageMakerFullAccess.html](https://docs.aws.amazon.com/aws-managed-policy/latest/reference/AmazonSageMakerFullAccess.html)sertakan izin untuk menggunakan rencana pelatihan.

**catatan**  
Kebijakan `AmazonSageMakerFullAccess` terkelola dirancang sebagai ease-of-use kebijakan terutama untuk tujuan eksperimen. Meskipun menyediakan akses luas ke fitur SageMaker AI, termasuk penggunaan rencana pelatihan, penting untuk dicatat:  
Kebijakan ini tidak disarankan untuk lingkungan produksi karena izinnya yang luas.
Ini tidak termasuk izin untuk membuat rencana pelatihan, seperti yang `CreateTrainingPlan` dianggap sebagai tindakan administratif yang membutuhkan pembayaran di muka.
Untuk kasus penggunaan produksi, kami sangat menyarankan untuk membuat kebijakan khusus yang mematuhi prinsip hak istimewa paling sedikit, hanya memberikan izin khusus yang diperlukan untuk setiap peran.

## Izin individu
<a name="training-plan-individual-permissions"></a>

Daftar berikut merinci izin terperinci yang harus ditetapkan dalam pernyataan kebijakan IAM tentang peran, berdasarkan tindakan spesifik yang perlu dilakukan pengguna dengan SageMaker rencana pelatihan:

### Daftar izin rencana pelatihan
<a name="training-plan-individual-permissions-list"></a>
+ `SearchTrainingPlanOfferings`: Izin ini memungkinkan pengguna untuk mencari penawaran rencana pelatihan yang tersedia.

  ```
  {
    "Sid": "SearchTrainingPlanOfferingsPermissions",
    "Effect": "Allow",
    "Action": [
      "sagemaker:SearchTrainingPlanOfferings"
    ],
    "Resource": "*"
  }
  ```
+ `CreateTrainingPlan`: Izin ini memungkinkan pengguna untuk membuat rencana pelatihan baru.
**catatan**  
Anda juga harus menyertakan izin untuk `CreateReservedCapacity` dan`AddTags`, dan menentukan keduanya `training-plan` dan jenis `reserved-capacity` sumber daya.

  ```
  {
    "Sid": "CreateTrainingPlanPermissions",
    "Effect": "Allow",
    "Action": [
      "sagemaker:CreateTrainingPlan",
      "sagemaker:CreateReservedCapacity",
      "sagemaker:AddTags"
    ],
    "Resource": [
      "arn:aws:sagemaker:*:*:training-plan/*",
      "arn:aws:sagemaker:*:*:reserved-capacity/*"
    ]
  }
  ```
+ `DescribeTrainingPlan`: Izin ini memungkinkan pengguna untuk melihat detail rencana pelatihan yang ada.

  ```
  {
    "Sid": "DescribeTrainingPlanPermissions",
    "Effect": "Allow",
    "Action": [
      "sagemaker:DescribeTrainingPlan"
    ],
    "Resource": [
      "arn:aws:sagemaker:::training-plan/*"
    ]
  }
  ```
+ `ListTrainingPlans`: Izin ini memungkinkan pengguna untuk membuat daftar semua rencana pelatihan di AWS akun mereka.

  ```
  {
    "Sid": "ListTrainingPlansPermissions",
    "Effect": "Allow",
    "Action": [
      "sagemaker:ListTrainingPlans"
    ],
    "Resource": "*"
  }
  ```

### Izin individu per jenis pengguna
<a name="training-plan-permissions-per-user-type"></a>

Bagian ini memberikan rincian rinci tentang izin individu yang diperlukan untuk setiap peran, seperti yang disebutkan di [IAM untuk rencana SageMaker pelatihan](#training-plan-iam-permissions) bagian. 

Untuk pembuat paket, izin berikut diperlukan:
+ `sagemaker:SearchTrainingPlanOfferings`
+ `sagemaker:CreateTrainingPlan`
+ `sagemaker:CreateReservedCapacity`
+ `sagemaker:AddTags`
+ `sagemaker:DescribeTrainingPlan`
+ `sagemaker:ListTrainingPlans`

Pengguna paket memerlukan izin ini:
+ `sagemaker:CreateTrainingJob`(Untuk SageMaker Training Job)
+ `sagemaker:CreateCluster`dan `sagemaker:UpdateCluster` (untuk SageMaker HyperPod)
+ Akses ke `training-plan` dan `reserved-capacity` sumber daya; Saat mengonfigurasi kebijakan IAM untuk rencana SageMaker pelatihan, sertakan izin untuk keduanya `training-plan` dan sumber daya. `reserved-capacity` Sumber daya ini diperlukan untuk pekerjaan SageMaker pelatihan dan SageMaker HyperPod cluster. Hal ini memungkinkan peran IAM Anda untuk berinteraksi dengan sumber daya rencana SageMaker pelatihan dan mengelola Kapasitas Cadangan.
  + Untuk pekerjaan SageMaker pelatihan, pastikan kebijakan Anda mencakup `"arn:aws:sagemaker:::training-plan/"` dan `"arn:aws:sagemaker:::reserved-capacity/"` sumber daya ARNs.

------
#### [ JSON ]

****  

```
{
  "Version":"2012-10-17",		 	 	 
  "Statement": [
    {
      "Effect": "Allow",
      "Action": [
        "sagemaker:CreateTrainingJob"
      ],
      "Resource": [
        "arn:aws:sagemaker:us-east-2:111122223333:training-job/",
        "arn:aws:sagemaker:us-east-2:111122223333:training-plan/",
        "arn:aws:sagemaker:us-east-2:111122223333:reserved-capacity/*"
      ]
    }
  ]
}
```

------

Demikian pula, untuk SageMaker HyperPod konfigurasi, sertakan ini sama ARNs selain sumber daya khusus cluster.

------
#### [ JSON ]

****  

```
{
  "Version":"2012-10-17",		 	 	 
  "Statement": [
    {
      "Effect": "Allow",
      "Action": [
        "sagemaker:CreateCluster",
        "sagemaker:UpdateCluster"
      ],
      "Resource": [
        "arn:aws:sagemaker:us-east-2:111122223333:cluster/",
        "arn:aws:sagemaker:us-east-2:111122223333:training-plan/",
        "arn:aws:sagemaker:us-east-2:111122223333:reserved-capacity/*"
      ]
    }
  ]
}
```

------

# Pembuatan rencana pelatihan
<a name="training-plan-creation"></a>

Untuk mencadangkan kapasitas komputasi menggunakan kemampuan rencana SageMaker pelatihan, ikuti langkah-langkah berikut:

1. **Identifikasi sumber daya target Anda:** Mulailah dengan menentukan apakah Anda memerlukan kapasitas untuk pekerjaan SageMaker pelatihan atau SageMaker HyperPod cluster.

1. **Tentukan persyaratan kapasitas Anda:** Tentukan kebutuhan kapasitas Anda secara rinci. Ini termasuk memilih jenis instans yang sesuai untuk beban kerja Anda, menentukan jumlah instans yang diperlukan, dan menentukan durasi penggunaan. Untuk informasi tentang jenis instans yang didukung dalam opsi tertentu Wilayah AWS, durasi, dan kuantitas, lihat[Jenis instans yang didukung Wilayah AWS,, dan harga](reserve-capacity-with-training-plans.md#training-plans-supported-instances-and-regions).

1. **Cari penawaran rencana pelatihan yang tersedia:** Setelah Anda menentukan persyaratan Anda, gunakan fungsi pencarian rencana SageMaker pelatihan untuk menemukan penawaran rencana pelatihan yang tersedia di satu atau beberapa segmen. Setiap penawaran mencakup detail seperti waktu mulai, zona ketersediaan khusus untuk Kapasitas Cadangan, dan harga paket. Tinjau penawaran ini, dengan mempertimbangkan faktor-faktor seperti efektivitas biaya, preferensi geografis, dan keselarasan dengan kebutuhan yang Anda tentukan.

   Jika tidak ada paket yang sesuai, sesuaikan kriteria pencarian Anda dan cari serangkaian penawaran baru.

1. **Buat rencana pelatihan berdasarkan penawaran yang sesuai: Setelah mengidentifikasi penawaran** yang sesuai, lanjutkan untuk membuat rencana pelatihan Anda. Proses ini melibatkan pemilihan penawaran yang Anda pilih dan memulai reservasi.
   + Reservasi rencana pelatihan membuat faktur.
   + Pembayaran untuk jumlah total dikumpulkan sebagai bagian dari proses pemenuhan. Setelah pembayaran selesai, rencana siap untuk menjadwalkan pekerjaan SageMaker pelatihan Anda atau membuat HyperPod cluster.

   Untuk mempelajari tentang cara menggunakan rencana pelatihan untuk pekerjaan SageMaker pelatihan Anda, lihat[Rencana pelatihan pemanfaatan untuk pekerjaan SageMaker pelatihan](training-plan-utilization-for-training-jobs.md).

    Untuk mempelajari tentang cara menggunakan rencana pelatihan untuk HyperPod cluster Anda, lihat[Rencana pelatihan pemanfaatan untuk cluster Amazon SageMaker HyperPod](training-plan-utilization-for-hyperpod.md).

Anda dapat membuat rencana pelatihan menggunakan konsol SageMaker AI atau metode terprogram. Konsol SageMaker AI menawarkan antarmuka grafis visual dengan tampilan komprehensif opsi Anda, sementara pembuatan terprogram dapat dilakukan menggunakan AWS CLI atau SageMaker SDKs berinteraksi langsung dengan API rencana pelatihan.

Untuk instruksi step-by-step konsol dan referensi API terperinci, lihat bagian masing-masing dalam dokumentasi ini.

**Topics**
+ [SageMaker pembuatan rencana pelatihan menggunakan konsol SageMaker AI](training-plan-creation-using-console.md)
+ [SageMaker pembuatan rencana pelatihan menggunakan SageMaker API, atau AWS CLI](training-plan-creation-using-api-cli-sdk.md)

# SageMaker pembuatan rencana pelatihan menggunakan konsol SageMaker AI
<a name="training-plan-creation-using-console"></a>

SageMaker Rencana pelatihan menawarkan cara mudah untuk membuat rencana pelatihan melalui UI konsol SageMaker AI, memungkinkan pengguna untuk dengan mudah menjadwalkan sumber daya pelatihan pembelajaran mesin mereka. Panduan ini memandu Anda melalui proses pembuatan rencana pelatihan untuk pekerjaan SageMaker pelatihan dan SageMaker HyperPod cluster menggunakan konsol SageMaker AI. Dengan mengikuti langkah-langkah ini, Anda akan mencari penawaran rencana pelatihan, meninjau opsi yang tersedia, dan membeli paket yang paling sesuai dengan kebutuhan Anda.

Untuk membuat rencana pelatihan secara visual menggunakan UI:

1. Mulailah dengan menavigasi ke konsol SageMaker AI di. [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/)

1. Pilih **Rencana Pelatihan** di menu panel kiri.

1. Dari sana, pilih tombol **Buat rencana pelatihan** di area konten utama untuk memulai proses pengaturan jadwal pelatihan khusus Anda.

![\[SageMaker Konsol AI yang menampilkan halaman rencana pelatihan. Antarmuka menampilkan informasi tentang cara kerja rencana pelatihan, termasuk langkah-langkah untuk meminta, memantau, dan menggunakan rencana. Panel navigasi kiri menyoroti opsi “Rencana Pelatihan”, dan tombol “Buat rencana pelatihan” terlihat di area konten utama.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/training-plans/tp-console.png)


Selanjutnya, cari penawaran paket yang sesuai dengan persyaratan komputasi Anda.

**Topics**
+ [Cari penawaran rencana pelatihan](search-training-plan-offerings.md)
+ [Pesan rencana pelatihan terbaik](choose-best-training-plan.md)
+ [Daftar rencana pelatihan](list-training-plans.md)
+ [Lihat detail rencana pelatihan](training-plan-details.md)

# Cari penawaran rencana pelatihan
<a name="search-training-plan-offerings"></a>

Setelah Anda memilih **Rencana Pelatihan** di panel kiri konsol SageMaker AI, lalu **Buat rencana pelatihan**, formulir **Temukan rencana pelatihan** akan terbuka. Formulir ini memungkinkan Anda untuk menentukan persyaratan Anda dan mencari penawaran rencana pelatihan yang sesuai.

Ikuti langkah-langkah ini untuk melengkapi formulir:

1. Identifikasi **Target** Anda: Rencana pelatihan khusus untuk sumber daya target mereka. Tentukan apakah Anda ingin menggunakan rencana untuk menjalankan pekerjaan SageMaker pelatihan atau SageMaker HyperPod cluster.

1. Untuk **jenis Compute**, Anda dapat memilih antara **Instance** atau **UltraServer**. UltraServers menghubungkan beberapa instans Amazon EC2 menggunakan interkoneksi akselerator bandwidth tinggi latensi rendah. Untuk informasi selengkapnya, lihat [Amazon EC2 UltraServers](https://aws.amazon.com/ec2/ultraservers/). Untuk mempelajari tentang bagaimana Anda dapat menggunakan UltraServers SageMaker AI, lihat[UltraServers di SageMaker AI](reserve-capacity-with-training-plans.md#training-plans-ultraservers).

1. Pilih **jenis Instance** dan **jumlah Instance** yang Anda inginkan: Untuk jenis instans yang tersedia dalam opsi tertentu Wilayah AWS, durasi, dan kuantitas, lihat[Jenis instans yang didukung Wilayah AWS,, dan harga](reserve-capacity-with-training-plans.md#training-plans-supported-instances-and-regions).

1. Tentukan parameter waktu Anda: Pilih tanggal mulai dan akhir yang Anda inginkan, dan tentukan durasi paket dalam jendela ini.

1. Pilih **Temukan rencana pelatihan**.

![\[SageMaker Konsol AI yang menampilkan halaman penawaran rencana pelatihan Penelusuran. Antarmuka menampilkan opsi untuk memilih sumber daya target untuk rencana (Training job atau HyperPod cluster), menentukan jenis dan hitungan instans, menetapkan tanggal mulai dan berakhir, dan durasi input. Tombol Temukan rencana pelatihan terlihat di bagian bawah formulir.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/training-plans/tp-search-training-plan-offerings.png)


SageMaker rencana pelatihan mencari penawaran yang sesuai dengan kebutuhan kapasitas Anda. Ketika kecocokan ditemukan dalam kerangka waktu yang ditentukan, mereka muncul di bagian bawah halaman. Setiap penawaran rencana pelatihan mencakup rincian berikut:
+ Total durasi paket
+ Tanggal mulai dan berakhir
+ Total harga dimuka: 

  Arahkan kursor ke harga untuk melihat rincian tarif per jam instans, jumlah instans, dan total jam
+ Jumlah total segmen rencana

Mengklik tautan detail segmen akan membuka tampilan modal dengan detail spesifik segmen:
+ Durasi
+ Tanggal mulai dan berakhir
+ Zona ketersediaan

![\[SageMaker Konsol AI yang menampilkan halaman penawaran rencana pelatihan Penelusuran dengan bidang input untuk persyaratan paket dan bagian Paket yang tersedia menampilkan detail dari tiga paket yang ditemukan dengan durasi, harga, dan status ketersediaan yang bervariasi.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/training-plans/tp-available-offerings.png)


Jika tidak ditemukan rencana yang sesuai atau paket yang tersedia tidak memenuhi kebutuhan Anda, sesuaikan kriteria pencarian Anda dengan memodifikasi parameter dalam formulir **Persyaratan rencana pelatihan**. Setelah Anda menemukan penawaran yang sesuai, pilih dan pilih **Berikutnya** untuk melanjutkan ke halaman reservasi paket. Di halaman ini, Anda dapat memberi nama paket Anda, lalu meninjau dan mengonfirmasi pilihan Anda sebelum menyelesaikan reservasi Anda.

**catatan**  
Paket yang ditandai `Immediately available` akan dimulai dalam 30 menit, asalkan pembayaran selesai tidak kurang dari 5 menit sebelum waktu mulai yang dijadwalkan.

# Pesan rencana pelatihan terbaik
<a name="choose-best-training-plan"></a>

Pencarian rencana pelatihan telah mengembalikan penawaran yang sesuai dengan kebutuhan kapasitas dan anggaran Anda. 

1. Masukkan nama untuk paket Anda dan kemudian pilih **Berikutnya**.

1. Tinjau dan **Kirim** pesanan pembelian Anda.
**penting**  
Rencana pelatihan tidak dapat dimodifikasi setelah dibeli.
Rencana pelatihan tidak dapat dibagikan di seluruh AWS akun atau di dalam AWS Organisasi Anda.

   Setelah mengirimkan pesanan Anda
   + Rencana pelatihan awalnya muncul seperti `Pending` dalam daftar rencana pelatihan Anda.
   + Faktur dibuat secara otomatis setelah penerimaan pesanan.
   + Total pembayaran dikumpulkan selama proses pemenuhan.
   + Setelah pembayaran berhasil diproses, status paket berubah menjadi `Scheduled` dan paket menjadi tersedia untuk digunakan.

![\[SageMaker Konsol AI yang menampilkan halaman “Tinjau dan beli” untuk rencana pelatihan. Halaman ini menampilkan detail rencana pelatihan, informasi segmen, harga, nama paket, dan tag. Opsi untuk mengedit, membatalkan, kembali, atau membuat paket tersedia.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/training-plans/tp-review-and-purchase-training-plan.png)


# Daftar rencana pelatihan
<a name="list-training-plans"></a>

Untuk melihat rencana pelatihan Anda:

1. Arahkan ke konsol SageMaker AI di [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Pilih **Rencana Pelatihan** di menu panel kiri. Ini menampilkan daftar semua rencana pelatihan Anda, termasuk nama, status, jenis sumber daya target, dan detail kunci lainnya.

   Setelah membeli paket, Anda diarahkan ke daftar ini. Paket yang baru dibuat muncul dengan `Pending` status hingga pembayaran selesai. Status biasanya diperbarui dalam beberapa menit setelah pemrosesan pembayaran.

![\[SageMaker Konsol AI yang menampilkan daftar halaman rencana pelatihan. Halaman ini menyertakan tabel yang mencantumkan rencana pelatihan dengan detail seperti nama, status, total instance, instance yang sedang digunakan, zona, tanggal mulai, dan tanggal akhir. Tombol untuk membuat rencana pelatihan baru terlihat.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/training-plans/tp-list-training-plans.png)


# Lihat detail rencana pelatihan
<a name="training-plan-details"></a>

Dari daftar rencana pelatihan, ikuti nama rencana untuk melihat detailnya. Secara khusus, Anda dapat memeriksa penggunaan kapasitas Anda saat ini, dan daftar beban kerja Anda di halaman detail paket Anda. 

Halaman detail menunjukkan:
+ Ikhtisar rencana pelatihan: Status, target, jenis instans, dan durasi.
+ Bagian yang dapat diperluas untuk detail segmen, harga, nama paket, dan tag.
+ Pemanfaatan kapasitas:
  + Total: Jumlah total instans yang dicadangkan dalam rencana pelatihan ini.
  + Digunakan: Jumlah instans yang saat ini digunakan dari rencana pelatihan ini.
  + Instans yang tersedia: Jumlah instans yang saat ini tersedia untuk digunakan dalam rencana pelatihan ini.

Di bagian bawah halaman, tautan memungkinkan Anda untuk melihat pekerjaan pelatihan atau daftar grup instans SageMaker HyperPod cluster yang terkait dengan rencana ini, tergantung pada sumber daya targetnya. 

![\[SageMaker Halaman konsol AI menampilkan detail rencana pelatihan. Halaman ini menampilkan informasi rencana dasar, status, dan detail contoh. Di bawah ini adalah bagian yang dapat diperluas untuk detail tambahan. Di bagian bawah, bagian pemanfaatan kapasitas menunjukkan contoh total, sedang digunakan, dan tersedia untuk rencana tersebut.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/training-plans/tp-view-training-plan.png)


# SageMaker pembuatan rencana pelatihan menggunakan SageMaker API, atau AWS CLI
<a name="training-plan-creation-using-api-cli-sdk"></a>

SageMaker rencana pelatihan mendukung pembuatan program rencana pelatihan melalui API-nya. Anda dapat berinteraksi dengan API rencana pelatihan menggunakan AWS CLI atau SageMaker SDKs.

SageMaker Tindakan API rencana pelatihan menyediakan alur kerja yang komprehensif untuk mengelola rencana pelatihan secara terprogram:
+ **`SearchTrainingPlanOfferings`:** Memungkinkan pengguna untuk menanyakan dan menemukan sumber daya komputasi yang tersedia dengan menentukan parameter seperti jenis instans, hitungan, dan jendela waktu yang diinginkan. API mengembalikan daftar peringkat penawaran rencana pelatihan yang paling sesuai dengan kebutuhan pengguna.
+ **`CreateTrainingPlan`:** Memungkinkan reservasi penawaran rencana pelatihan tertentu, mengubah kapasitas komputasi potensial menjadi kapasitas cadangan terjadwal dengan rencana pelatihan ARN yang unik.
+ **`ListTrainingPlans`:** Menyediakan metode untuk mengambil dan meninjau semua rencana pelatihan yang ada di AWS akun pengguna, dengan kemampuan penyaringan dan penyortiran opsional.
+ **`DescribeTrainingPlan`:** Menawarkan wawasan terperinci tentang rencana pelatihan tertentu, termasuk tahapan siklus hidupnya dari hingga ke`Pending`. `Active` `Expired`
+ **`ExtendTrainingPlan`:** Memperluas rencana pelatihan yang ada dengan membeli penawaran ekstensi. Untuk informasi selengkapnya, lihat [Perpanjangan rencana pelatihan](training-plan-extension.md).
+ **`DescribeTrainingPlanExtensionHistory`:** Mengambil riwayat ekstensi untuk rencana pelatihan. Untuk informasi selengkapnya, lihat [Perpanjangan rencana pelatihan](training-plan-extension.md).

**Topics**
+ [Cari penawaran rencana pelatihan](search-training-plan-offerings-api-cli-sdk.md)
+ [Pesan rencana pelatihan terbaik](choose-best-training-plan-using-api-cli-sdk.md)
+ [Daftar rencana pelatihan](list-training-plans-using-api-cli-sdk.md)
+ [Lihat detail rencana pelatihan](training-plan-details-using-api-cli-sdk.md)

# Cari penawaran rencana pelatihan
<a name="search-training-plan-offerings-api-cli-sdk"></a>

Untuk membuat rencana pelatihan, mulailah dengan memanggil operasi [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html)API, meneruskan persyaratan paket Anda (seperti jenis instans, hitungan, dan jendela waktu yang diinginkan) sebagai parameter input. Rencana pelatihan khusus untuk sumber daya target mereka. Pastikan Anda menentukan sumber daya target mana yang akan digunakan untuk rencana (`training-job`atau`hyperpod-cluster`). API menampilkan daftar penawaran yang tersedia yang sesuai dengan kebutuhan Anda. Jika tidak ada penawaran yang cocok ditemukan, Anda mungkin perlu menyesuaikan kebutuhan Anda dan mencari lagi.

Panggilan API ini mengambil penawaran rencana pelatihan yang paling sesuai dengan kebutuhan kapasitas Anda. Setiap yang [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TrainingPlanOffering.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TrainingPlanOffering.html)dikembalikan dalam respons diidentifikasi oleh ID penawaran unik. Penawaran pertama dalam daftar mewakili kecocokan terbaik untuk kebutuhan Anda. Jika tidak ada rencana pelatihan yang sesuai tersedia dalam tanggal yang Anda tentukan, daftarnya kosong. Sesuaikan kriteria pencarian Anda dan cari serangkaian penawaran baru.
+ Durasi reservasi tersedia dalam kenaikan 1 hari dari 1 hingga 182 hari.
+ Opsi kuantitas instance reservasi adalah 1, 2, 4, 8, 16, 32 atau 64 instance.

Untuk mempelajari tentang daftar instans yang tersedia yang didukung oleh rencana SageMaker pelatihan, lihat[Jenis instans yang didukung Wilayah AWS,, dan harga](reserve-capacity-with-training-plans.md#training-plans-supported-instances-and-regions).

Contoh berikut menggunakan AWS CLI perintah untuk meminta penawaran rencana pelatihan dengan jenis instans tertentu, jumlah, dan informasi waktu.

```
# List training plan offerings with instance type, instance count, duration in hours, start time after, and end time before.
aws sagemaker search-training-plan-offerings \
--target-resources "training-job" \
--instance-type "ml.p4d.24xlarge" \
--instance-count 1 \
--duration-hours 15 \
--start-time-after "1737484800"
--end-time-before "1737657600"
```

Dokumen JSON ini adalah contoh respons dari API rencana SageMaker pelatihan. Tanggapan tersebut memberikan informasi tentang beberapa penawaran rencana pelatihan yang tersedia yang sesuai dengan persyaratan kapasitas yang ditentukan. Ini mencakup tiga penawaran berbeda dengan durasi yang bervariasi, biaya di muka, dan start/end waktu, semuanya menggunakan jenis instans yang sama dan menargetkan pekerjaan pelatihan.

```
{
    "TrainingPlanOfferings": [
        {
            "TrainingPlanOfferingId": "tpo-SHA-256-hash-value",
            "TargetResources": [
                "training-job"
            ],
            "RequestedStartTimeAfter": "2025-01-21T11:08:27.704000-08:00",
            "DurationHours": 15,
            "DurationMinutes": 51,
            "UpfrontFee": "xxxx.xx",
            "CurrencyCode": "USD",
            "ReservedCapacityOfferings": [
                {
                    "InstanceType": "ml.p4d.24xlarge",
                    "InstanceCount": 1,
                    "AvailabilityZone": "us-west-2a",
                    "DurationHours": 15,
                    "DurationMinutes": 51,
                    "StartTime": "2025-01-21T11:39:00-08:00",
                    "EndTime": "2025-01-22T03:30:00-08:00"
                }
            ]
        },
        {
            "TrainingPlanOfferingId": "tpo-SHA-256-hash-value",
            "TargetResources": [
                "training-job"
            ],
            "RequestedStartTimeAfter": "2025-01-21T11:08:27.704000-08:00",
            "DurationHours": 39,
            "DurationMinutes": 51,
            "UpfrontFee": "xxxx.xx",
            "CurrencyCode": "USD",
            "ReservedCapacityOfferings": [
                {
                    "InstanceType": "ml.p4d.24xlarge",
                    "InstanceCount": 1,
                    "AvailabilityZone": "us-west-2a",
                    "DurationHours": 39,
                    "DurationMinutes": 51,
                    "StartTime": "2025-01-21T11:39:00-08:00",
                    "EndTime": "2025-01-23T03:30:00-08:00"
                }
            ]
        },
        {
            "TrainingPlanOfferingId": "tpo-SHA-256-hash-value",
            "TargetResources": [
                "training-job"
            ],
            "RequestedStartTimeAfter": "2025-01-21T11:08:27.704000-08:00",
            "DurationHours": 24,
            "DurationMinutes": 0,
            "UpfrontFee": "xxxx.xx",
            "CurrencyCode": "USD",
            "ReservedCapacityOfferings": [
                {
                    "InstanceType": "ml.p4d.24xlarge",
                    "InstanceCount": 1,
                    "AvailabilityZone": "us-west-2a",
                    "DurationHours": 24,
                    "DurationMinutes": 0,
                    "StartTime": "2025-01-22T03:30:00-08:00",
                    "EndTime": "2025-01-23T03:30:00-08:00"
                }
            ]
        }
    ]
}
```

Berikut ini adalah contoh perintah tentang cara menggunakan AWS CLI untuk mencari penawaran rencana pelatihan yang mencakup. UltraServers

```
aws sagemaker search-training-plan-offerings \
--ultra-server-type ml.c6i-32xlargesc \
--ultra-server-count 1 \
--duration-hours 24 \
--target-resources hyperpod-cluster
--start-time-after "1737484800" \
--end-time-before "1737657600"
```

```
{
    "TrainingPlanOfferings": [
        {
            "TrainingPlanOfferingId": "tpo-SHA-256-hash-value",
            "TargetResources": [
                "training-job"
            ],
            "RequestedStartTimeAfter": "2025-07-21T16:59:25.760000+00:00",
            "DurationHours": 24,
            "DurationMinutes": 0,
            "UpfrontFee": "0.24",
            "CurrencyCode": "USD",
            "ReservedCapacityOfferings": [
                {
                    "ReservedCapacityType": "UltraServer",
                    "UltraServerType": "ml.u-p6e-gb200x72",
                    "UltraServerCount": 1,
                    "InstanceType": "ml.p6e-gb200.36xlarge",
                    "InstanceCount": 18,
                    "AvailabilityZone": "us-east-2a",
                    "DurationHours": 24,
                    "DurationMinutes": 0,
                    "StartTime": "2025-07-22T11:30:00+00:00",
                    "EndTime": "2025-07-23T11:30:00+00:00"
                }
            ]
        }
    ]
}
```

Bagian berikut menentukan parameter permintaan input wajib dan opsional untuk operasi `SearchTrainingPlanOfferings` API.

## Parameter yang diperlukan
<a name="search-training-plan-options-required-params"></a>

Saat memanggil [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html)API untuk mencantumkan penawaran rencana pelatihan yang memenuhi persyaratan Anda, Anda harus memberikan nilai berikut:
+ `TargetResources`: Sumber daya target (`training-job`atau`hyperpod-cluster`) yang rencananya akan digunakan. Nilai default-nya adalah `training-job`. Rencana pelatihan khusus untuk sumber daya target mereka.
  + Rencana pelatihan yang dirancang untuk pekerjaan SageMaker pelatihan hanya dapat digunakan untuk menjadwalkan dan menjalankan pekerjaan pelatihan.
  + Rencana pelatihan untuk HyperPod cluster dapat digunakan secara eksklusif untuk menyediakan sumber daya komputasi ke grup instance cluster.
+ `InstanceType`: Jenis contoh untuk ketentuan. `InstanceType`Harus dari tipe yang didukung. 

  Untuk mempelajari tentang daftar instans yang tersedia yang didukung oleh rencana SageMaker pelatihan, lihat[Jenis instans yang didukung Wilayah AWS,, dan harga](reserve-capacity-with-training-plans.md#training-plans-supported-instances-and-regions).
+ `InstanceCount`: Jumlah contoh untuk penyediaan. Jika jumlah instans lebih besar dari 1, itu harus menjadi kekuatan 2.
+ `DurationHour`: Total durasi paket yang Anda minta dalam jam. `DurationHour`Dibulatkan ke kelipatan terdekat dari 24.

## Parameter opsional
<a name="search-training-plan-options-optional-params"></a>

Bagian berikut memberikan detail tentang beberapa parameter opsional yang dapat Anda teruskan ke permintaan `SearchTrainingPlanOfferings` API Anda.
+ `StartTimeAfter`: Tentukan waktu mulai rencana yang diminta. Itu `StartTimeAfter` harus menjadi nilai `timestamp` atau `ISO 8601 date/time` nilai di masa depan.
+ `EndTimeBefore`: Tentukan waktu akhir rencana yang diminta dalam `ISO 8601 date/time` format `timestamp` atau format. `EndTimeBefore`Harus setidaknya 24 jam setelah waktu mulai.
+ `UltraServerType`: Tentukan jenis UltraServer yang akan dicari. Untuk informasi lebih lanjut tentang UltraServers, lihat[UltraServers di SageMaker AI](reserve-capacity-with-training-plans.md#training-plans-ultraservers).
+ `UltraServerCount`: Tentukan jumlah UltraServers yang akan dicari.

# Pesan rencana pelatihan terbaik
<a name="choose-best-training-plan-using-api-cli-sdk"></a>

Setelah meninjau penawaran rencana pelatihan yang tersedia yang paling sesuai dengan kebutuhan Anda, Anda dapat memesan paket tertentu dengan memanggil operasi API. [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingPlan.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingPlan.html) Ketika dibuat, rencana awalnya memasuki `Pending` negara bagian dan tetap di sana sampai proses reservasi selesai. Respons terhadap panggilan API mengembalikan rencana pelatihan Amazon Resource Name (ARN). Catat ARN ini untuk tujuan pelacakan dan pemantauan di kemudian hari. Reservasi rencana pelatihan dipenuhi secara asinkron di backend. Pembayaran untuk jumlah total dikumpulkan secara otomatis sebagai bagian dari proses pemenuhan. Setelah transaksi pembayaran selesai dan kapasitas cadangan yang diminta diamankan, rencana pelatihan diatur ke `Scheduled` negara bagian, dan siap untuk penjadwalan.

**penting**  
Rencana pelatihan tidak dapat dimodifikasi setelah dibeli.
Rencana pelatihan tidak dapat dibagikan di seluruh AWS akun atau di dalam AWS Organisasi Anda.

Contoh berikut menggunakan AWS CLI perintah untuk meminta rencana pelatihan tertentu, melewati ID rencana sebagai parameter.

```
aws sagemaker create-training-plan \
--training-plan-offering-id "tpo-SHA-256-hash-value" \
--training-plan-name "name" \
```

Dokumen JSON ini adalah contoh respons dari API rencana SageMaker pelatihan. Tanggapan tersebut berisi Nama Sumber Daya Amazon (ARN) dari rencana pelatihan yang telah berhasil dibuat.

**catatan**  
Rencana pelatihan tetap dalam `Pending` status sampai proses pemenuhan selesai.

```
{
   "TrainingPlanArn":"arn:aws:sagemaker:us-east-1:123456789123:training-plan/large-models-fine-tuning"
}
```

Bagian berikut menentukan parameter permintaan input wajib dan opsional untuk operasi [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingPlan.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingPlan.html)API.

## Parameter yang diperlukan
<a name="choose-best-training-plan-using-api-cli-sdk-required-params"></a>

Saat memanggil [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingPlan.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingPlan.html)API untuk memesan rencana pelatihan tertentu, Anda harus memberikan nilai berikut:
+ `TrainingPlanOfferingId`: ID paket yang Anda pilih. Anda dapat mengambil ID penawaran paket dalam respons panggilan `SearchTrainingPlanOfferings` API Anda. Formatnya harus dimulai dengan`pto-*`.
+ `TrainingPlanName`: Nama rencana yang Anda buat. 

# Daftar rencana pelatihan
<a name="list-training-plans-using-api-cli-sdk"></a>

Anda dapat membuat daftar semua rencana pelatihan yang telah dibuat di AWS akun dan Wilayah Anda dengan memanggil [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ListTrainingPlans.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ListTrainingPlans.html)API.

Contoh berikut menggunakan AWS CLI perintah untuk mengambil daftar rencana pelatihan Anda.

```
aws sagemaker list-training-plans \
--start-time-after "2024-09-26T00:00:01.000Z"
```

Dokumen JSON ini adalah contoh respons dari API rencana SageMaker pelatihan. Tanggapan tersebut memberikan rincian tentang satu rencana pelatihan yang telah berhasil dibuat dan dipesan.

```
{
   "[TrainingPlanSummaries](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TrainingPlanSummary.html)": [ 
      { 
         "AvailableInstanceCount": 2,
         "CurrencyCode": "USD",
         "DurationHours": 48,
         "DurationMinutes": 0,
         "EndTime": "2024-09-28T04:30:00-07:00",
         "InUseInstanceCount": 2,
         "[ReservedCapacitySummaries](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ReservedCapacitySummary.html)": [ 
            { 
               "AvailabilityZone": "string",
               "DurationHours": 48,
               "DurationMinutes": 0,
               "EndTime": "2024-09-28T04:30:00-07:00",
               "InstanceType": "ml.p5.48xlarge",
               "ReservedCapacityArn": "arn:aws:sagemaker:us-east-1:123456789123:reserved-capacity/large-models-fine-tuning-rc1",
               "StartTime": "2024-09-26T04:30:00-07:00",
               "Status": "Scheduled",
               "TotalInstanceCount": 4,
               "UltraServerCount": 4,
               "UltraServerType": "ml.p6e-gb200.36xlarge"
            }
         ],
         "StartTime": "2024-09-26T04:30:00-07:00",
         "Status": "Scheduled",
         "StatusMessage": "Payment confirmed, training plan scheduled."
         "TargetResources": [ "training-job" ],
         "TotalInstanceCount": 4,
         "TotalUltraServerCount": 4,
         "TrainingPlanArn": "arn:aws:sagemaker:us-east-1:123456789123:training-plan/large-models-fine-tuning",
         "TrainingPlanName": "large-models-fine-tuning",
         "UpfrontFee": "xxxx.xx"
      }
   ]
}
```

Bagian berikut memberikan rincian beberapa parameter opsional yang dapat Anda teruskan ke permintaan `ListTrainingPlans` API Anda.

## Parameter opsional
<a name="list-training-plans-optional-params"></a>

Bagian berikut memberikan detail tentang beberapa parameter opsional yang dapat Anda teruskan ke permintaan `ListTrainingPlans` API Anda.
+ `StartTimeAfter`: Waktu mulai dari rentang waktu aktual dari rencana yang terdaftar, ditentukan sebagai a `timestamp` atau`ISO 8601 date/time`. 
+ `StartTimeBefore`: Waktu akhir dari rentang waktu aktual dari rencana yang terdaftar, ditentukan sebagai a `timestamp` atau`ISO 8601 date/time`. 
+ `Filters`: Kriteria yang digunakan untuk memfilter hasil, dengan hingga 5 pasangan Nama-Nilai di mana “Nama” adalah nama bidang a [TrainingPlanSummary](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TrainingPlanSummary.html)dan “Nilai” adalah nilai yang perlu dipertimbangkan untuk filter. Sebagai contoh, `Name=Status,Value=Active`.

Contoh berikut menggunakan AWS CLI perintah untuk mengambil daftar rencana pelatihan Anda, menggunakan beberapa parameter opsional yang dijelaskan di atas.

```
aws sagemaker list-training-plans --max-results 10 --sort-by StartTime --sort-order Descending --start-time-after 13000000 --filters Name=Status,Value=Active
```

# Lihat detail rencana pelatihan
<a name="training-plan-details-using-api-cli-sdk"></a>

Untuk memantau status atau mengambil detail rencana pelatihan, Anda dapat menggunakan [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlan.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlan.html)API. Respons API mencakup `Status` bidang, yang mencerminkan status rencana pelatihan saat ini:
+ Jika pembelian paket gagal, status diatur ke`Failed`.
+ Setelah pembayaran berhasil, status beralih dari `Pending` ke`Scheduled`, berdasarkan tanggal mulai rencana. 
+ Ketika rencana mencapai tanggal mulai, status berubah menjadi`Active`.
+ Untuk rencana dengan beberapa kapasitas cadangan terputus-putus, status kembali ke `Scheduled` antara periode aktif, hingga tanggal mulai kapasitas cadangan berikutnya. 
+ Setelah tanggal akhir rencana, statusnya menjadi`Expired`.

Setelah statusnya`Scheduled`, Anda dapat memanfaatkan kapasitas yang disediakan dalam rencana untuk pekerjaan SageMaker pelatihan atau beban kerja HyperPod cluster Anda.

**catatan**  
Pekerjaan pelatihan yang terkait dengan rencana tetap dalam `Pending` status sampai rencana menjadi`Active`. 
Untuk HyperPod klaster yang menggunakan rencana pelatihan untuk kapasitas komputasi, status grup instans muncul seperti `InService` sekali dibuat. 

Contoh berikut menggunakan AWS CLI perintah untuk mengambil rincian rencana pelatihan dengan namanya.

```
aws sagemaker describe-training-plan \
--training-plan-name "name"
```

Dokumen JSON ini adalah contoh respons dari API rencana SageMaker pelatihan. Tanggapan ini memberikan rincian tentang rencana pelatihan yang telah berhasil dibuat.

```
      { 
         "AvailableInstanceCount": 2,
         "CurrencyCode": "USD",
         "DurationHours": 48,
         "DurationMinutes": 0,
         "EndTime": "2024-09-28T04:30:00-07:00",
         "InUseInstanceCount": 2,
         "[ReservedCapacitySummaries](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ReservedCapacitySummary.html)": [ 
            { 
               "AvailabilityZone": "string",
               "DurationHours": 48,
               "DurationMinutes": 0,
               "EndTime": "2024-09-28T04:30:00-07:00",
               "InstanceType": "ml.p5.48xlarge",
               "ReservedCapacityArn": "arn:aws:sagemaker:us-east-1:123456789123:reserved-capacity/large-models-fine-tuning-rc1",
               "StartTime": "2024-09-26T04:30:00-07:00",
               "Status": "Scheduled",
               "TotalInstanceCount": 4,
               "UltraServerCount": 4,
               "UltraServerType": "ml.p6e-gb200.36xlarge"
            }
         ],
         "StartTime": "2024-09-26T04:30:00-07:00",
         "Status": "Scheduled",
         "StatusMessage": "Payment confirmed, training plan scheduled."
         "TargetResources": [ "training-job" ],
         "TotalInstanceCount": 4,
         "TotalUltraServerCount": 4,
         "TrainingPlanArn": "arn:aws:sagemaker:us-east-1:123456789123:training-plan/large-models-fine-tuning",
         "TrainingPlanName": "large-models-fine-tuning",
         "UpfrontFee": "xxxx.xx"
      }
```

Bagian berikut menentukan parameter permintaan input wajib untuk operasi `DescribeTrainingPlan` API.

## Parameter yang diperlukan
<a name="training-plan-details-required-params"></a>
+ `TrainingPlanName`: Nama rencana pelatihan yang ingin Anda gambarkan.

# Perpanjangan rencana pelatihan
<a name="training-plan-extension"></a>

SageMaker rencana pelatihan memungkinkan Anda untuk memperluas rencana pelatihan yang ada untuk menghindari gangguan beban kerja. Saat rencana pelatihan mendekati kedaluwarsa, Anda dapat memperluasnya langsung melalui konsol SageMaker AI atau secara terprogram menggunakan API atau. AWS CLI Ini menghilangkan kebutuhan untuk membuat rencana baru dan mengkonfigurasi ulang beban kerja Anda dengan rencana pelatihan baru ARN.

Dengan ekstensi rencana pelatihan, pekerjaan atau SageMaker HyperPod cluster SageMaker pelatihan lari Anda terus bekerja dengan mulus tanpa gangguan setelah rencana diperpanjang. Rencana yang diperpanjang mencerminkan tanggal akhir yang baru, dan Anda dapat mengambil riwayat semua ekstensi untuk rencana pelatihan Anda.

**penting**  
Harap dicatat ekstensi tidak dapat dibatalkan atau dimodifikasi untuk menambah atau menghapus instance.

## Fitur utama
<a name="training-plan-extension-features"></a>
+ Perluas rencana pelatihan melalui konsol atau API
+ Perpanjang paket dengan kenaikan 1 hari hingga 14 hari, atau kenaikan 7 hari hingga 182 hari
+ Perpanjang rencana beberapa kali
+ Lihat/ Daftar riwayat ekstensi untuk rencana pelatihan Anda di konsol atau melalui API
+ Kelanjutan mulus menjalankan beban kerja di SageMaker AI tanpa konfigurasi ulang

## Prasyarat
<a name="training-plan-extension-prerequisites"></a>

Sebelum memperpanjang rencana pelatihan, pastikan hal-hal berikut:
+ Rencana pelatihan harus memiliki status `Active` atau`Scheduled`.
+ Paket tidak boleh memiliki ekstensi dalam `Payment Pending` status.
+ Ekstensi dapat diminta hingga minimal 1 jam atau maksimal 56 hari sebelum paket berakhir.

**Topics**
+ [Fitur utama](#training-plan-extension-features)
+ [Prasyarat](#training-plan-extension-prerequisites)
+ [Perpanjang rencana pelatihan menggunakan konsol SageMaker AI](training-plan-extension-using-console.md)
+ [Memperluas rencana pelatihan menggunakan SageMaker API atau AWS CLI](training-plan-extension-using-api-cli-sdk.md)

# Perpanjang rencana pelatihan menggunakan konsol SageMaker AI
<a name="training-plan-extension-using-console"></a>

SageMaker Rencana pelatihan menawarkan cara mudah untuk memperluas rencana pelatihan Anda yang ada melalui UI konsol SageMaker AI. Panduan ini memandu Anda melalui proses memperluas rencana pelatihan untuk pekerjaan SageMaker pelatihan dan SageMaker HyperPod cluster menggunakan konsol SageMaker AI.

Untuk memperpanjang rencana pelatihan menggunakan konsol:

1. Arahkan ke konsol SageMaker AI di [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Pilih **Rencana Pelatihan** di panel navigasi kiri.

1. Pilih rencana pelatihan yang ingin Anda perluas dari daftar.

1. Pilih tombol **Perpanjang**.

1. Masukkan tanggal akhir yang diinginkan untuk ekstensi Anda dan pilih **Cari** untuk menemukan penawaran ekstensi yang tersedia.

1. Tinjau daftar penawaran ekstensi, yang mencakup detail seperti durasi, zona ketersediaan, biaya di muka, dan waktu mulai dan akhir.

1. Pilih penawaran ekstensi yang paling sesuai dengan kebutuhan Anda.

1. Tinjau detail ekstensi di dialog konfirmasi, lalu pilih **Kirim** untuk mengonfirmasi pembelian Anda.

Setelah perpanjangan dibeli, tanggal akhir rencana pelatihan diperbarui untuk mencerminkan durasi baru yang diperpanjang.

## Lihat riwayat ekstensi
<a name="training-plan-extension-history-console"></a>

Untuk melihat riwayat ekstensi untuk rencana pelatihan:

1. Arahkan ke halaman **Rencana Pelatihan** di konsol SageMaker AI.

1. Pilih rencana pelatihan yang ingin Anda lihat.

1. Di halaman detail rencana pelatihan, lihat bagian **Ekstensi** untuk melihat semua ekstensi sebelumnya, termasuk ID penawaran ekstensi, tanggal mulai dan berakhir, status, dan kapan ekstensi dibuat.

## Nilai status ekstensi
<a name="training-plan-extension-status-values-console"></a>

Ekstensi dapat memiliki nilai status berikut:
+ `Pending`: Perpanjangan telah diminta dan sedang menunggu pemrosesan pembayaran.
+ `Active`: Ekstensi telah berhasil dibeli dan aktif.
+ `Scheduled`: Perpanjangan dijadwalkan untuk dimulai di masa depan.
+ `Failed`: Pembelian ekstensi gagal (misalnya, karena masalah pembayaran).
+ `Expired`: Periode perpanjangan telah berakhir.

# Memperluas rencana pelatihan menggunakan SageMaker API atau AWS CLI
<a name="training-plan-extension-using-api-cli-sdk"></a>

SageMaker rencana pelatihan mendukung perluasan rencana pelatihan secara terprogram melalui API-nya. Anda dapat berinteraksi dengan API rencana pelatihan menggunakan AWS CLI atau SageMaker SDKs.

Ekstensi rencana pelatihan melibatkan tindakan API berikut:
+ **`SearchTrainingPlanOfferings`:** Cari penawaran ekstensi yang tersedia dengan menentukan ARN rencana pelatihan Anda dan durasi ekstensi yang diinginkan. API mengembalikan penawaran ekstensi di bidang. `TrainingPlanExtensionOfferings`
+ **`ExtendTrainingPlan`:** Beli penawaran ekstensi khusus untuk memperpanjang rencana pelatihan Anda dengan menyediakan`TrainingPlanExtensionOfferingId`. Ini mencadangkan kapasitas komputasi tambahan dan memperbarui tanggal akhir rencana pelatihan Anda.
+ **`DescribeTrainingPlanExtensionHistory`:** Lihat riwayat ekstensi lengkap untuk rencana pelatihan, termasuk semua ekstensi sebelumnya dengan status, tanggal, dan informasi pembayarannya.

**Topics**
+ [Cari penawaran ekstensi](search-extension-offerings-api-cli-sdk.md)
+ [Beli ekstensi](extend-training-plan-api-cli-sdk.md)
+ [Lihat riwayat ekstensi](describe-extension-history-api-cli-sdk.md)

# Cari penawaran ekstensi
<a name="search-extension-offerings-api-cli-sdk"></a>

Gunakan [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html)API dengan `TrainingPlanArn` parameter untuk menemukan penawaran ekstensi yang tersedia untuk rencana pelatihan Anda.

Contoh berikut menggunakan AWS CLI perintah untuk mencari penawaran ekstensi untuk rencana pelatihan yang ada.

```
aws sagemaker search-training-plan-offerings \
--training-plan-arn "arn:aws:sagemaker:us-east-2:123456789012:training-plan/my-training-plan" \
--duration-hours 48
```

Dokumen JSON ini adalah contoh respons dari API rencana SageMaker pelatihan. Tanggapan termasuk `TrainingPlanExtensionOfferings` berisi penawaran ekstensi yang tersedia untuk rencana pelatihan yang ditentukan.

```
{
    "TrainingPlanOfferings": [],
    "TrainingPlanExtensionOfferings": [
        {
            "TrainingPlanExtensionOfferingId": "tpeo-SHA-256-hash-value",
            "AvailabilityZone": "us-east-2a",
            "StartDate": "2025-09-23T12:00:00Z",
            "EndDate": "2025-09-25T12:00:00Z",
            "DurationHours": 48,
            "UpfrontFee": "xxxx.xx",
            "CurrencyCode": "USD"
        }
    ]
}
```

Bagian berikut menentukan parameter permintaan input wajib dan opsional untuk operasi `SearchTrainingPlanOfferings` API saat mencari penawaran ekstensi.

## Parameter yang diperlukan
<a name="search-extension-offerings-required-params"></a>

Saat memanggil [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html)API untuk mencari penawaran ekstensi, Anda harus memberikan nilai berikut:
+ `TrainingPlanArn`: Rencana pelatihan yang ingin Anda perpanjang. `TrainingPlanArn`Harus mereferensikan rencana pelatihan yang ada dengan status `Active` atau`Scheduled`.

## Parameter opsional
<a name="search-extension-offerings-optional-params"></a>

Bagian berikut memberikan detail tentang beberapa parameter opsional yang dapat Anda teruskan ke permintaan `SearchTrainingPlanOfferings` API saat mencari penawaran ekstensi.
+ `DurationHours`: Durasi yang diinginkan dalam jam untuk ekstensi. `DurationHours`Dibulatkan ke kelipatan terdekat dari 24.

# Beli ekstensi
<a name="extend-training-plan-api-cli-sdk"></a>

Setelah memilih penawaran ekstensi, gunakan [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ExtendTrainingPlan.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ExtendTrainingPlan.html)API untuk membeli ekstensi.

Contoh berikut menggunakan AWS CLI perintah untuk memperpanjang rencana pelatihan.

```
aws sagemaker extend-training-plan \
--training-plan-extension-offering-id "tpeo-SHA-256-hash-value"
```

Dokumen JSON ini adalah contoh respons dari API rencana SageMaker pelatihan. Tanggapan tersebut mencakup daftar ekstensi untuk rencana pelatihan.

```
{
    "TrainingPlanExtensions": [
        {
            "TrainingPlanExtensionOfferingId": "tpeo-SHA-256-hash-value",
            "ExtendedAt": "2025-09-17T10:00:00Z",
            "StartDate": "2025-09-23T12:00:00Z",
            "EndDate": "2025-09-25T12:00:00Z",
            "Status": "Pending",
            "PaymentStatus": "Pending",
            "AvailabilityZone": "us-east-2a",
            "DurationHours": 48,
            "UpfrontFee": "xxxx.xx",
            "CurrencyCode": "USD"
        }
    ]
}
```

Bagian berikut mendefinisikan parameter permintaan input wajib untuk operasi `ExtendTrainingPlan` API.

## Parameter yang diperlukan
<a name="extend-training-plan-required-params"></a>

Saat memanggil [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ExtendTrainingPlan.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ExtendTrainingPlan.html)API untuk memperpanjang rencana pelatihan, Anda harus memberikan nilai berikut:
+ `TrainingPlanExtensionOfferingId`: ID dari penawaran ekstensi yang Anda beli. Anda dapat mengambil ID ini dari `TrainingPlanExtensionOfferings` respons panggilan `SearchTrainingPlanOfferings` API Anda. Formatnya harus dimulai dengan`tpeo-*`.

# Lihat riwayat ekstensi
<a name="describe-extension-history-api-cli-sdk"></a>

Gunakan [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlanExtensionHistory.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlanExtensionHistory.html)API untuk melihat riwayat ekstensi lengkap untuk rencana pelatihan.

Contoh berikut menggunakan AWS CLI perintah untuk mengambil riwayat ekstensi.

```
aws sagemaker describe-training-plan-extension-history \
--training-plan-arn "arn:aws:sagemaker:us-east-2:123456789012:training-plan/my-training-plan"
```

Dokumen JSON ini adalah contoh respons dari API rencana SageMaker pelatihan. Tanggapan tersebut mencakup daftar paginasi semua ekstensi untuk rencana pelatihan.

```
{
    "TrainingPlanExtensions": [
        {
            "TrainingPlanExtensionOfferingId": "tpeo-SHA-256-hash-value",
            "ExtendedAt": "2025-09-17T10:00:00Z",
            "StartDate": "2025-09-23T12:00:00Z",
            "EndDate": "2025-09-25T12:00:00Z",
            "Status": "Active",
            "PaymentStatus": "Completed",
            "AvailabilityZone": "us-east-2a",
            "DurationHours": 48,
            "UpfrontFee": "xxxx.xx",
            "CurrencyCode": "USD"
        }
    ],
    "NextToken": null
}
```

Bagian berikut menentukan parameter permintaan input wajib dan opsional untuk operasi `DescribeTrainingPlanExtensionHistory` API.

## Parameter yang diperlukan
<a name="describe-extension-history-required-params"></a>

Saat memanggil [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlanExtensionHistory.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlanExtensionHistory.html)API, Anda harus memberikan nilai berikut:
+ `TrainingPlanArn`: Rencana pelatihan untuk mengambil riwayat ekstensi untuk.

## Parameter opsional
<a name="describe-extension-history-optional-params"></a>

Bagian berikut memberikan detail tentang beberapa parameter opsional yang dapat Anda teruskan ke permintaan `DescribeTrainingPlanExtensionHistory` API Anda.
+ `NextToken`: Jika respons sebelumnya terpotong, Anda menerima token ini. Gunakan dalam permintaan Anda berikutnya untuk menerima set hasil berikutnya.
+ `MaxResults`: Jumlah maksimum ekstensi untuk kembali dalam respons.

## Nilai status ekstensi
<a name="extension-status-values-api"></a>

Ekstensi dapat memiliki nilai status berikut:
+ `Pending`: Perpanjangan telah diminta dan sedang menunggu pemrosesan pembayaran.
+ `Active`: Ekstensi telah berhasil dibeli dan aktif.
+ `Scheduled`: Perpanjangan dijadwalkan untuk dimulai di masa depan.
+ `Failed`: Pembelian ekstensi gagal (misalnya, karena masalah pembayaran).
+ `Expired`: Periode perpanjangan telah berakhir.

# Rencana pelatihan pemanfaatan untuk pekerjaan SageMaker pelatihan
<a name="training-plan-utilization-for-training-jobs"></a>

Anda dapat menggunakan rencana SageMaker pelatihan untuk pekerjaan pelatihan Anda dengan menentukan rencana pilihan Anda saat membuat pekerjaan pelatihan.

**catatan**  
Rencana pelatihan harus dalam `Active` status `Scheduled` atau yang akan digunakan oleh pekerjaan pelatihan.

Jika kapasitas yang diperlukan tidak segera tersedia untuk pekerjaan pelatihan, pekerjaan menunggu sampai tersedia, atau sampai `StoppingCondition` terpenuhi, atau pekerjaan telah `Pending` untuk kapasitas selama 2 hari, mana yang lebih dulu. Jika kondisi berhenti terpenuhi, pekerjaan dihentikan. Jika pekerjaan telah tertunda selama 2 hari, itu diakhiri dengan a. `InsufficientCapacityError`

**penting**  
**Proses penghentian Kapasitas Cadangan:** Anda memiliki akses penuh ke semua instans cadangan hingga 30 menit sebelum waktu akhir Kapasitas Cadangan. Jika ada 30 menit tersisa dalam Kapasitas Cadangan Anda, rencana SageMaker pelatihan memulai proses penghentian instans yang sedang berjalan dalam Kapasitas Cadangan tersebut.  
Untuk memastikan Anda tidak kehilangan kemajuan karena penghentian ini, kami sarankan untuk memeriksa pekerjaan pelatihan Anda.

## Pos pemeriksaan pekerjaan pelatihan Anda
<a name="training-jobs-checkpointing"></a>

Saat menggunakan rencana SageMaker pelatihan untuk pekerjaan SageMaker pelatihan Anda, pastikan untuk menerapkan pos pemeriksaan dalam skrip pelatihan Anda. Ini memungkinkan Anda untuk menyimpan kemajuan pelatihan Anda sebelum Kapasitas Cadangan berakhir. Checkpointing sangat penting ketika bekerja dengan kapasitas yang dicadangkan, karena memungkinkan Anda untuk melanjutkan pelatihan dari titik terakhir yang disimpan jika pekerjaan Anda terganggu antara dua kapasitas yang dicadangkan atau ketika rencana pelatihan Anda mencapai tanggal berakhirnya.

Untuk mencapai ini, Anda dapat menggunakan variabel `SAGEMAKER_CURRENT_CAPACITY_BLOCK_EXPIRATION_TIMESTAMP` lingkungan. Variabel ini membantu menentukan kapan harus memulai proses checkpointing. Dengan memasukkan logika ini ke dalam skrip pelatihan Anda, Anda memastikan bahwa kemajuan model Anda disimpan pada interval yang sesuai.

Berikut adalah contoh bagaimana Anda dapat menerapkan logika checkpointing ini dalam skrip pelatihan Python Anda:

```
import os
import time
from datetime import datetime, timedelta

def is_close_to_expiration(threshold_minutes=30):
    # Retrieve the expiration timestamp from the environment variable
    expiration_time_str = os.environ.get('SAGEMAKER_CURRENT_CAPACITY_BLOCK_EXPIRATION_TIMESTAMP', '0')
    
    # If the timestamp is not set (default '0'), return False
    if expiration_time_str == '0':
        return False
    
    # Convert the timestamp string (in milliseconds) to a datetime object
    expiration_time = datetime(1970, 1, 1) + timedelta(milliseconds=int(expiration_time_str))
    
    # Calculate the time difference between now and the expiration time
    time_difference = expiration_time - datetime.now()
    
    # Return True if we're within the threshold time of expiration
    return time_difference < timedelta(minutes=threshold_minutes)

def start_checkpointing():
    # Placeholder function for checkpointing logic
    print("Starting checkpointing process...")
    # TODO: Implement actual checkpointing logic here
    # For example:
    # - Save model state
    # - Save optimizer state
    # - Save current epoch and iteration numbers
    # - Save any other relevant training state

# Main training loop
num_epochs = 100
final_checkpointing_done = False
for epoch in range(num_epochs):
    # TODO: Replace this with your actual training code
    # For example:
    # - Load a batch of data
    # - Forward pass
    # - Calculate loss
    # - Backward pass
    # - Update model parameters
    
    # Check if we're close to capacity expiration and haven't done final checkpointing
    if not final_checkpointing_done and is_close_to_expiration():
        start_checkpointing()
        final_checkpointing_done = True
    
    # Simulate some training time (remove this in actual implementation)
    time.sleep(1)
print("Training completed.")
```

**catatan**  
Penyediaan pekerjaan pelatihan mengikuti urutan First-In-First-Out (FIFO), tetapi pekerjaan klaster yang lebih kecil yang dibuat kemudian mungkin diberi kapasitas sebelum pekerjaan klaster yang lebih besar dibuat sebelumnya, jika pekerjaan yang lebih besar tidak dapat dipenuhi.
SageMaker kolam hangat yang dikelola pelatihan kompatibel dengan rencana SageMaker pelatihan. Untuk penggunaan kembali cluster, Anda harus memberikan `TrainingPlanArn` nilai yang identik dalam `CreateTrainingJob` permintaan berikutnya untuk menggunakan kembali cluster yang sama.

**Topics**
+ [Pos pemeriksaan pekerjaan pelatihan Anda](#training-jobs-checkpointing)
+ [Buat pekerjaan pelatihan menggunakan konsol SageMaker AI](use-training-plan-for-training-jobs-using-console.md)
+ [Membuat pekerjaan pelatihan menggunakan API, AWS CLI, SageMaker SDK](use-training-plan-for-training-jobs-using-api-cli-sdk.md)

# Buat pekerjaan pelatihan menggunakan konsol SageMaker AI
<a name="use-training-plan-for-training-jobs-using-console"></a>

Anda dapat menggunakan rencana SageMaker pelatihan untuk pekerjaan pelatihan Anda menggunakan SageMaker AI UI. Saat membuat pekerjaan pelatihan, rencana yang tersedia disarankan kepada Anda jika pilihan instans dan wilayah Anda cocok dengan paket yang tersedia.

Untuk membuat pekerjaan pelatihan menggunakan kapasitas cadangan rencana pelatihan di SageMaker konsol:

1. Arahkan ke konsol SageMaker AI di [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Di panel navigasi kiri, pilih **Pelatihan**, lalu **Pelatihan pekerjaan**.

1. Pilih tombol **Buat pekerjaan pelatihan**.

1. Saat mengonfigurasi sumber daya untuk pekerjaan pelatihan Anda, cari bagian **Kapasitas instans**. Jika ada paket yang tersedia yang cocok dengan jenis dan wilayah instans pilihan Anda, mereka akan ditampilkan di sini. Pilih rencana pelatihan yang sesuai dengan kebutuhan kapasitas komputasi Anda.

   Jika tidak ada rencana yang sesuai, Anda dapat menyesuaikan jenis atau wilayah instans Anda, atau melanjutkan tanpa menggunakan rencana pelatihan.

1. Setelah memilih rencana pelatihan (atau memilih untuk melanjutkan tanpa satu), selesaikan sisa konfigurasi pekerjaan pelatihan Anda dan pilih **Buat pekerjaan pelatihan** untuk memulai proses.

![\[SageMaker Halaman konsol AI untuk membuat pekerjaan pelatihan baru. Halaman ini menampilkan berbagai opsi konfigurasi termasuk pengaturan pekerjaan, opsi algoritme, konfigurasi sumber daya, pemilihan rencana pelatihan, dan kondisi penghentian.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/training-plans/tp-create-training-job.png)


Tinjau dan luncurkan pekerjaan Anda. Pekerjaan Anda mulai berjalan segera setelah rencana pelatihan menjadi`Active`, kapasitas tertunda.

# Membuat pekerjaan pelatihan menggunakan API, AWS CLI, SageMaker SDK
<a name="use-training-plan-for-training-jobs-using-api-cli-sdk"></a>

Untuk menggunakan rencana SageMaker pelatihan untuk pekerjaan SageMaker pelatihan Anda, tentukan `TrainingPlanArn` parameter rencana yang diinginkan di `ResourceConfig` saat memanggil operasi [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingJob.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingJob.html)API. Anda dapat menggunakan tepat satu rencana per pekerjaan.

**penting**  
`InstanceType`Bidang yang ditetapkan di `ResourceConfig` bagian `CreateTrainingJob` permintaan harus sesuai dengan rencana pelatihan Anda. `InstanceType`

## Jalankan pekerjaan pelatihan pada rencana menggunakan CLI
<a name="training-job-cli"></a>

Contoh berikut menunjukkan cara membuat pekerjaan SageMaker pelatihan dan mengaitkannya dengan rencana pelatihan yang disediakan menggunakan `TrainingPlanArn` atribut dalam `create-training-job` AWS CLI perintah. 

Untuk informasi selengkapnya tentang cara membuat pekerjaan pelatihan menggunakan AWS CLI [CreateTrainingJob](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingJob.html)perintah, lihat [https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-training-job.html](https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-training-job.html).

```
# Create a training job
aws sagemaker create-training-job \
  --training-job-name training-job-name \
  ...
    
  --resource-config '{
        "InstanceType": "ml.p5.48xlarge",
        "InstanceCount": 8,
        "VolumeSizeInGB": 10,
        "TrainingPlanArn": "training-plan-arn"
        }
    }' \
    ...
```

Perintah AWS CLI contoh ini menciptakan pekerjaan pelatihan baru di SageMaker AI yang melewati rencana pelatihan dalam `--resource-config` argumen.

```
aws sagemaker create-training-job \
  --training-job-name job-name \
  --role-arn arn:aws:iam::111122223333:role/DataAndAPIAccessRole \
  --algorithm-specification '{"TrainingInputMode": "File","TrainingImage": "111122223333.dkr.ecr.us-east-1.amazonaws.com/algo-image:tag", "ContainerArguments": [" "]}' \
  --input-data-config '[{"ChannelName":"training","DataSource":{"S3DataSource":{"S3DataType":"S3Prefix","S3Uri":"s3://bucketname/input","S3DataDistributionType":"ShardedByS3Key"}}}]' \
  --output-data-config '{"S3OutputPath": "s3://bucketname/output"}' \
  --resource-config '{"VolumeSizeInGB":10,"InstanceCount":4,"InstanceType":"ml.p5.48xlarge", "TrainingPlanArn" : "arn:aws:sagemaker:us-east-1:111122223333:training-plan/plan-name"}' \
  --stopping-condition '{"MaxRuntimeInSeconds": 1800}' \
  --region us-east-1
```

Setelah membuat pekerjaan pelatihan, Anda dapat memverifikasi bahwa itu telah ditetapkan dengan benar ke rencana pelatihan dengan memanggil `DescribeTrainingJob` API.

```
aws sagemaker describe-training-job --training-job-name training-job-name
```

## Jalankan pekerjaan pelatihan pada rencana menggunakan SageMaker AI Python SDK
<a name="training-job-sdk"></a>

Atau, Anda dapat membuat pekerjaan pelatihan yang terkait dengan rencana pelatihan menggunakan [SageMaker Python](https://sagemaker.readthedocs.io/en/stable/v2.html) SDK.

Jika Anda menggunakan SageMaker Python SDK dari JupyterLab Studio untuk membuat pekerjaan pelatihan, pastikan bahwa peran eksekusi yang digunakan oleh ruang yang menjalankan JupyterLab aplikasi Anda memiliki izin yang diperlukan untuk menggunakan rencana pelatihan. SageMaker Untuk mempelajari tentang izin yang diperlukan untuk menggunakan rencana SageMaker pelatihan, lihat[IAM untuk rencana SageMaker pelatihan](training-plan-iam-permissions.md).

Contoh berikut menunjukkan cara membuat pekerjaan SageMaker pelatihan dan mengaitkannya dengan rencana pelatihan yang disediakan menggunakan `training_plan` atribut dalam `Estimator` objek saat menggunakan SageMaker Python SDK.

Untuk informasi selengkapnya tentang SageMaker Estimator, lihat [Menggunakan SageMaker estimator untuk menjalankan pekerjaan pelatihan](https://docs.aws.amazon.com/sagemaker/latest/dg/docker-containers-adapt-your-own-private-registry-estimator.html).

```
import sagemaker
import boto3
from sagemaker import get_execution_role
from sagemaker.estimator import Estimator
from sagemaker.inputs import TrainingInput

# Set up the session and SageMaker client
session = boto3.Session()
region = session.region_name
sagemaker_session = session.client('sagemaker')

# Get the execution role for the training job
role = get_execution_role()

# Define the input data configuration
trainingInput = TrainingInput(
    s3_data='s3://input-path',
    distribution='ShardedByS3Key',
    s3_data_type='S3Prefix'
)

estimator = Estimator(
    entry_point='train.py',
    image_uri="123456789123.dkr.ecr.{}.amazonaws.com/image:tag",
    role=role,
    instance_count=4,
    instance_type='ml.p5.48xlarge',
    training_plan="training-plan-arn",
    volume_size=20,
    max_run=3600,
    sagemaker_session=sagemaker_session,
    output_path="s3://output-path"
)

# Create the training job
estimator.fit(inputs=trainingInput, job_name=job_name)
```

Setelah membuat pekerjaan pelatihan, Anda dapat memverifikasi bahwa itu telah ditetapkan dengan benar ke rencana pelatihan dengan memanggil `DescribeTrainingJob` API.

```
# Check job details
sagemaker_session.describe_training_job(TrainingJobName=job_name)
```

# Rencana pelatihan pemanfaatan untuk cluster Amazon SageMaker HyperPod
<a name="training-plan-utilization-for-hyperpod"></a>

Untuk menggunakan rencana SageMaker pelatihan untuk SageMaker HyperPod klaster Amazon, Anda menentukan rencana pelatihan yang ingin Anda gunakan di tingkat instans cluster saat membuat atau memperbarui klaster Anda. 

**catatan**  
Rencana pelatihan harus dalam `Active` status `Scheduled` atau yang akan digunakan oleh HyperPod cluster.
Pastikan konfigurasi klaster sejajar dengan Availability Zone (AZ) yang ditentukan dalam rencana pelatihan Anda.  
Untuk pengaturan VPC, lokasi sumber daya, dan konfigurasi grup keamanan, lihat [Menyiapkan SageMaker HyperPod dengan VPC Amazon khusus](sagemaker-hyperpod-prerequisites.md#sagemaker-hyperpod-prerequisites-optional-vpc) di dokumentasi. SageMaker HyperPod  
Jika menyiapkan HyperPod dengan Amazon FSx untuk Lustre, pelajari tentang pemilihan Wilayah dan AZ, tinjau persyaratan konfigurasi VPC, dan pahami praktik terbaik penyelarasan AZ di. [(Opsional) Menyiapkan SageMaker HyperPod dengan Amazon FSx untuk Lustre](sagemaker-hyperpod-prerequisites.md#sagemaker-hyperpod-prerequisites-optional-fsx)
Anda dapat memilih paket untuk setiap grup instans Anda. Namun, kami tidak merekomendasikan penggunaan rencana pelatihan untuk grup instans utama klaster, karena node primer memerlukan sumber daya yang berkelanjutan dan stabil yang tidak selaras dengan durasi tetap dan sifat kapasitas rencana pelatihan yang berpotensi terputus-putus.

**Topics**
+ [Buat SageMaker HyperPod cluster tentang rencana pelatihan menggunakan konsol SageMaker AI](use-training-plan-for-hyperpod-creation-using-console.md)
+ [Perbarui SageMaker HyperPod cluster tentang rencana pelatihan menggunakan konsol SageMaker AI](use-training-plan-for-hyperpod-update-using-console.md)
+ [Buat SageMaker HyperPod klaster pada rencana pelatihan menggunakan SageMaker API, atau AWS CLI](use-training-plan-for-hyperpod-creation-using-api-cli-sdk.md)
+ [Memperbarui SageMaker HyperPod klaster pada rencana pelatihan menggunakan SageMaker API, atau AWS CLI](use-training-plan-for-hyperpod-update-using-api-cli-sdk.md)

# Buat SageMaker HyperPod cluster tentang rencana pelatihan menggunakan konsol SageMaker AI
<a name="use-training-plan-for-hyperpod-creation-using-console"></a>

Untuk membuat SageMaker HyperPod cluster menggunakan rencana pelatihan dari UI konsol SageMaker AI, ikuti langkah-langkah berikut:

1. Arahkan ke konsol SageMaker AI di [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Di panel navigasi kiri, pilih **Hyperpod**, lalu **Buat** cluster.

1. Saat mengonfigurasi grup instans, Anda dapat memilih paket yang sesuai dengan kebutuhan kapasitas komputasi Anda.

![\[SageMaker Antarmuka konsol AI menampilkan jendela modal untuk membuat grup instance dalam sebuah SageMaker HyperPod cluster. Formulir ini mencakup bidang untuk nama grup instance, jenis instans, kuantitas, kapasitas instans (dengan opsi untuk rencana sesuai permintaan dan pelatihan), dan jalur direktori untuk skrip siklus hidup saat dibuat.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/training-plans/tp-create-hyperpod-cluster.png)


Tinjau dan buat cluster Anda. Kelompok instans yang menggunakan rencana pelatihan meningkatkan jumlah instans target yang ditentukan ketika rencana pelatihan menjadi`Active`, tergantung pada kapasitas yang tersedia. Tiga puluh menit sebelum setiap periode Kapasitas Cadangan berakhir, grup instans mulai memperkecil hingga nol instance. Status yang diperkecil ini berlanjut hingga periode Kapasitas Cadangan berikutnya dimulai atau rencana berakhir. Sepanjang proses ini, grup instans yang sehat mempertahankan `InService` status setelah pembuatan awalnya, terlepas dari jumlah instans saat ini.

# Perbarui SageMaker HyperPod cluster tentang rencana pelatihan menggunakan konsol SageMaker AI
<a name="use-training-plan-for-hyperpod-update-using-console"></a>

Anda dapat memperbarui, menghapus, atau menambahkan rencana pelatihan ke SageMaker HyperPod cluster yang ada menggunakan UI konsol SageMaker AI. Untuk memperbarui grup instance SageMaker HyperPod klaster, ikuti langkah-langkah berikut:

1. Arahkan ke konsol SageMaker AI di [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Di panel navigasi kiri, pilih **Hyperpod**.

1. Arahkan ke halaman detail cluster dengan mengikuti hyperlink yang terkait dengan nama cluster.

1. Saat mengonfigurasi grup instans, Anda dapat memperbarui paket agar selaras dengan kebutuhan kapasitas komputasi baru Anda.

![\[SageMaker Antarmuka konsol AI menampilkan jendela modal untuk memperbarui grup instans dalam sebuah SageMaker HyperPod cluster. Formulir ini mencakup bidang untuk nama grup instance, jenis instans, kuantitas, kapasitas instans (dengan opsi untuk rencana sesuai permintaan dan pelatihan), dan jalur direktori untuk skrip siklus hidup saat dibuat.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/training-plans/tp-update-hyperpod-clusters.png)


Tinjau dan perbarui klaster Anda.

# Buat SageMaker HyperPod klaster pada rencana pelatihan menggunakan SageMaker API, atau AWS CLI
<a name="use-training-plan-for-hyperpod-creation-using-api-cli-sdk"></a>

Untuk menggunakan rencana SageMaker pelatihan untuk SageMaker HyperPod klaster Amazon Anda, tentukan ARN dari rencana pelatihan yang ingin Anda gunakan dalam [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html#sagemaker-Type-ClusterInstanceGroupSpecification-TrainingPlanArn](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html#sagemaker-Type-ClusterInstanceGroupSpecification-TrainingPlanArn)parameter [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html)saat memanggil operasi [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateCluster.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateCluster.html)API. 

Pastikan subnet yang terkait dengan AZ yang ditunjuk dari paket Anda disertakan dalam konfigurasi klaster Anda. `VPCConfig` Anda dapat mengambil rencana pelatihan dalam respons panggilan [``DescribeTrainingPlan](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlan.html)API. `AvailabilityZone`

Contoh berikut menggambarkan cara membuat SageMaker HyperPod cluster baru dan menyediakan grup instance dengan rencana pelatihan dalam `--instance-groups` atribut `create-cluster` AWS CLI perintah. 

```
# Create a cluster         
aws sagemaker create-cluster \
  --cluster-name cluster-name \
  --instance-groups '[ \
        { \
            "InstanceCount": 1,\
            "InstanceGroupName": "controller-nodes",\
            "InstanceType": "ml.t3.xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id:role/execution_role",\
            "ThreadsPerCore": 1,\
        },\
        { \
            "InstanceCount": 2, \
            "InstanceGroupName": "worker-nodes",\
            "InstanceType": "p4d.24xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id}:role/execution_role}",\
            "ThreadsPerCore": 1,\
            "TrainingPlanArn": training_plan_arn,\
        }]'
```

Untuk informasi tentang cara membuat HyperPod klaster menggunakan AWS CLI, lihat [https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-cluster.html](https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-cluster.html).

Setelah membuat klaster, Anda dapat memverifikasi bahwa grup instans Anda telah menetapkan kapasitas dengan benar dari rencana pelatihan dengan memanggil `DescribeCluster` API.

```
aws sagemaker describe-cluster --cluster-name cluster-name
```

# Memperbarui SageMaker HyperPod klaster pada rencana pelatihan menggunakan SageMaker API, atau AWS CLI
<a name="use-training-plan-for-hyperpod-update-using-api-cli-sdk"></a>

Anda dapat menambahkan, memperbarui, atau menghapus rencana pelatihan dengan memperbarui grup instance dari cluster yang ada menggunakan `update-cluster` AWS CLI perintah. Contoh berikut mengilustrasikan cara memperbarui SageMaker HyperPod cluster dan menyediakan grup instans dengan rencana pelatihan baru.

```
# Update a cluster
aws sagemaker update-cluster \
  --cluster-name cluster-name \
  --instance-groups '[ \
        { \
            "InstanceCount": 1,\
            "InstanceGroupName": "controller-nodes",\
            "InstanceType": "ml.t3.xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id:role/execution_role",\
            "ThreadsPerCore": 1,\
        },\
        { \
            "InstanceCount": 2, \
            "InstanceGroupName": "worker-nodes",\
            "InstanceType": "p4d.24xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id}:role/execution_role}",\
            "ThreadsPerCore": 1,\
            "TrainingPlanArn": training_plan_arn,\
        },\
        {\
            "InstanceCount": 1,\
            "InstanceGroupName": "worker-nodes-2",\
            "InstanceType": "p4d.24xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id:role/execution_role",\
            "ThreadsPerCore": 1,\
            "TrainingPlanArn": training_plan_arn,\
        }\
    ]'
```

# Lihat kuota rencana SageMaker pelatihan menggunakan konsol AWS manajemen
<a name="training-plan-quotas"></a>

**penting**  
Untuk informasi harga tentang paket SageMaker pelatihan, lihat halaman [ SageMaker Harga Amazon](https://aws.amazon.com/sagemaker/pricing/). Arahkan ke bagian **paket pelatihan SageMaker HyperPod fleksibel Amazon** di bawah **Harga Sesuai Permintaan**. Pilih Wilayah yang Anda inginkan untuk melihat jenis instans yang tersedia dan harga yang sesuai.
Pastikan bahwa Pekerjaan Pelatihan atau kuota HyperPod layanan memungkinkan jumlah maksimum instans per jenis instans yang melebihi jumlah instans yang ditentukan dalam paket Anda.

Anda dapat melihat kuota dan batasan saat ini untuk rencana SageMaker pelatihan menggunakan Konsol AWS Manajemen. 

Untuk mencari nilai kuota tertentu:

1. Buka konsol [Service Quotas](https://console.aws.amazon.com/servicequotas/home/services/sagemaker/quotas).

1. Di panel navigasi kiri, pilih **AWS layanan**.

1. Dari daftar AWS layanan, cari dan pilih **Amazon SageMaker AI**.

1. Dalam daftar **Kuota layanan**, Anda dapat melihat nama kuota layanan, nilai yang diterapkan (jika tersedia), kuota AWS default, dan apakah nilai kuota dapat disesuaikan.

Untuk menemukan kuota tertentu, Anda dapat menggunakan bilah pencarian di bagian atas daftar **Kuota layanan**. Ketik `Limit Name` kuota yang Anda cari. Misalnya, untuk menemukan kuota jumlah rencana pelatihan per wilayah, Anda akan mengetik **training-plan-total\$1count** di bilah pencarian.

Tabel berikut menguraikan nama batas kuota untuk rencana SageMaker pelatihan.


**SageMaker batas kuota rencana pelatihan**  

| Batasi Nama | Nama Tampilan | 
| --- | --- | 
| training-plan-total\$1hitung | Jumlah rencana pelatihan per Wilayah | 
| reserved-capacity-ml-p4d-24xbesar | Jumlah instans ml.p4d.24xlarge dalam kapasitas cadangan di seluruh rencana pelatihan per Wilayah | 
| reserved-capacity-ml-p5-48xbesar | Jumlah instans ml.p5.48xlarge dalam kapasitas cadangan di seluruh rencana pelatihan per Wilayah | 
| reserved-capacity-ml-p5e-48xbesar | Jumlah instans ml.p5e.48xlarge dalam kapasitas cadangan di seluruh rencana pelatihan per Wilayah | 
| reserved-capacity-ml-p5en-48xlarge | Jumlah instans ml.p5en.48xlarge dalam kapasitas cadangan di seluruh rencana pelatihan per Wilayah | 
| reserved-capacity-ml-trn1-32xbesar | Jumlah instans ml-trn1-32xlarge dalam kapasitas cadangan di seluruh rencana pelatihan per Wilayah | 
| reserved-capacity-ml-trn2-48xbesar | Jumlah instans ml.trn2.48xlarge dalam kapasitas cadangan di seluruh rencana pelatihan per Wilayah | 

Jika Anda membutuhkan batas yang lebih tinggi untuk rencana SageMaker pelatihan Anda, Anda mungkin dapat meminta peningkatan kuota. Kemampuan untuk meningkatkan kuota tergantung pada apakah itu dapat disesuaikan, yang dapat Anda lihat di konsol **kuota Layanan**.

Untuk meminta peningkatan kuota:

1. Arahkan ke kuota tertentu di konsol **kuota Layanan**.

1. Jika kuota dapat disesuaikan, Anda dapat meminta peningkatan kuota di tingkat akun atau tingkat sumber daya berdasarkan nilai yang tercantum di kolom **Adjustability**.

1. Untuk **Meningkatkan nilai kuota**, masukkan nilai baru. Nilai baru lebih besar dari nilai saat ini.

1. Pilih **Permintaan**.

1. Permintaan kenaikan kuota dapat ditinjau dan disetujui oleh AWS. Untuk melihat permintaan yang tertunda atau yang baru saja diselesaikan di konsol, buka tab **Riwayat permintaan** dari halaman detail layanan, atau pilih **Dasbor** dari panel navigasi. Untuk permintaan yang tertunda, pilih status permintaan untuk membuka tanda terima permintaan. Status awal dari permintaan adalah `Pending`. Setelah status berubah`Quota requested`, Anda akan melihat nomor kasus dengan AWS Support. Pilih nomor kasus untuk membuka tiket untuk permintaan Anda.

*Untuk mempelajari lebih lanjut tentang meminta peningkatan kuota secara umum, lihat [Meminta peningkatan kuota dalam Panduan Pengguna Service Quotas](https://docs.aws.amazon.com/servicequotas/latest/userguide/request-quota-increase.html)AWS .*

# Catatan rilis
<a name="training-plan-release-notes"></a>

Lihat catatan rilis berikut untuk melacak pembaruan terbaru untuk rencana SageMaker pelatihan.

## Rencana SageMaker pelatihan Amazon Catatan Rilis: 04 Desember 2024
<a name="training-plan-release-notes-20241204"></a>

**Fitur Baru**
+ Meluncurkan rencana SageMaker pelatihan Amazon di AWS re:Invent 2024.