

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# HyperPod 在 Slurm 組態檔案中管理哪些特定組態
<a name="sagemaker-hyperpod-lifecycle-best-practices-slurm-what-hyperpod-overrides-in-slurm-conf"></a>

當您在 HyperPod 上建立 Slurm 叢集時，HyperPod 代理程式會在 `/opt/slurm/etc/` 設定 [https://slurm.schedmd.com/slurm.conf.html](https://slurm.schedmd.com/slurm.conf.html) 和 [https://slurm.schedmd.com/gres.conf.html](https://slurm.schedmd.com/gres.conf.html) 檔案，以根據您的 HyperPod 叢集建立請求和生命週期指令碼來管理 Slurm 叢集。下列清單顯示 HyperPod 代理程式處理和覆寫哪些特定參數。

**重要**  
強烈建議您**不要**變更 HyperPod 管理的這些參數。
+ 在 [https://slurm.schedmd.com/slurm.conf.html](https://slurm.schedmd.com/slurm.conf.html) 中，HyperPod 會設定下列基本參數：`ClusterName`、`SlurmctldHost`、`PartitionName` 和 `NodeName`。

  此外，為了啟用 [自動節點復原和自動恢復](sagemaker-hyperpod-resiliency-slurm-auto-resume.md) 功能，HyperPod 需要 `TaskPlugin` 和 `SchedulerParameters` 參數設定如下。HyperPod 代理程式預設會使用必要值來設定這兩個參數。

  ```
  TaskPlugin=task/none
  SchedulerParameters=permit_job_expansion
  ```
+ 在 [https://slurm.schedmd.com/gres.conf.html](https://slurm.schedmd.com/gres.conf.html) 中，HyperPod 會管理 GPU 節點的 `NodeName`。