

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# Slurm 設定ファイルで HyperPod が管理する特定の設定
<a name="sagemaker-hyperpod-lifecycle-best-practices-slurm-what-hyperpod-overrides-in-slurm-conf"></a>

HyperPod で Slurm クラスターを作成すると、HyperPod エージェントは `/opt/slurm/etc/` で [https://slurm.schedmd.com/slurm.conf.html](https://slurm.schedmd.com/slurm.conf.html) ファイルと [https://slurm.schedmd.com/gres.conf.html](https://slurm.schedmd.com/gres.conf.html) ファイルをセットアップし、HyperPod クラスターの作成リクエストとライフサイクルスクリプトに基づいて Slum クラスターを管理します。次のリストは、HyperPod エージェントが処理および上書きする特定のパラメータを示しています。

**重要**  
HyperPod によって管理されるこれらのパラメータを変更**しない**ことを強くお勧めします。
+ [https://slurm.schedmd.com/slurm.conf.html](https://slurm.schedmd.com/slurm.conf.html) では、HyperPod は基本パラメータ (`ClusterName`、`SlurmctldHost`、`PartitionName`、`NodeName`) を設定します。

  さらに、[自動ノード復旧と自動再開](sagemaker-hyperpod-resiliency-slurm-auto-resume.md) 機能を有効にするには、次のように設定された `TaskPlugin` パラメータと `SchedulerParameters`パラメータが HyperPod に必要です。HyperPod エージェントは、これらの 2 つのパラメータをデフォルトで必要な値を使用して設定します。

  ```
  TaskPlugin=task/none
  SchedulerParameters=permit_job_expansion
  ```
+ [https://slurm.schedmd.com/gres.conf.html](https://slurm.schedmd.com/gres.conf.html) では、HyperPod は `NodeName` GPU ノードを管理します。