

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Menjalankan pekerjaan pelatihan di HyperPod Slurm
<a name="cluster-specific-configurations-run-training-job-hyperpod-slurm"></a>

SageMaker HyperPod Resep mendukung pengiriman pekerjaan pelatihan ke cluster GPU/Trainium slurm. Sebelum Anda mengirimkan pekerjaan pelatihan, perbarui konfigurasi cluster. Gunakan salah satu metode berikut untuk memperbarui konfigurasi cluster:
+ Memodifikasi `slurm.yaml`
+ Ganti melalui baris perintah

Setelah Anda memperbarui konfigurasi cluster, instal lingkungan.

## Konfigurasikan cluster
<a name="cluster-specific-configurations-configure-cluster-slurm-yaml"></a>

Untuk mengirimkan pekerjaan pelatihan ke cluster Slurm, tentukan konfigurasi. Slurm-specific Memodifikasi `slurm.yaml` untuk mengkonfigurasi cluster Slurm. Berikut ini adalah contoh konfigurasi cluster Slurm. Anda dapat memodifikasi file ini untuk kebutuhan pelatihan Anda sendiri:

```
job_name_prefix: 'sagemaker-'
slurm_create_submission_file_only: False 
stderr_to_stdout: True
srun_args:
  # - "--no-container-mount-home"
slurm_docker_cfg:
  docker_args:
    # - "--runtime=nvidia" 
  post_launch_commands: 
container_mounts: 
  - "/fsx:/fsx"
```

1. `job_name_prefix`: Tentukan awalan nama pekerjaan untuk dengan mudah mengidentifikasi kiriman Anda ke cluster Slurm.

1. `slurm_create_submission_file_only`: Setel konfigurasi ini ke True untuk dry run guna membantu Anda men-debug.

1. `stderr_to_stdout`: Tentukan apakah Anda mengarahkan kesalahan standar (stderr) ke output standar (stdout).

1. `srun_args`: Sesuaikan konfigurasi srun tambahan, seperti mengecualikan node komputasi tertentu. Untuk informasi selengkapnya, lihat dokumentasi srun.

1. `slurm_docker_cfg`: Peluncur SageMaker HyperPod resep meluncurkan wadah Docker untuk menjalankan pekerjaan pelatihan Anda. Anda dapat menentukan argumen Docker tambahan dalam parameter ini.

1. `container_mounts`: Tentukan volume yang Anda pasang ke wadah untuk peluncur resep, untuk pekerjaan pelatihan Anda untuk mengakses file dalam volume tersebut.