

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# Slurm 組態自訂
<a name="slurm-configuration-settings-v3"></a>

從 3.6.0 AWS ParallelCluster 版開始，您可以在 AWS ParallelCluster 叢集`slurm.conf`Slurm組態中自訂組態。

在叢集組態中，您可以使用下列叢集組態設定來自訂組態Slurm參數：
+ 如果您同時指定 Slurm / [`SlurmSettings`](Scheduling-v3.md#Scheduling-v3-SlurmSettings) [`CustomSlurmSettings`](Scheduling-v3.md#yaml-Scheduling-SlurmSettings-CustomSlurmSettings)或 parameter. AWS ParallelCluster fails，即可自訂整個叢集的[`CustomSlurmSettingsIncludeFile`](Scheduling-v3.md#yaml-Scheduling-SlurmSettings-CustomSlurmSettingsIncludeFile)參數。
+ 使用 [`SlurmQueues`](Scheduling-v3.md#Scheduling-v3-SlurmQueues) / [`CustomSlurmSettings`](Scheduling-v3.md#yaml-Scheduling-SlurmQueues-CustomSlurmSettings)（映射到Slurm分割區） 自訂佇列的Slurm參數。
+ 使用 / [`SlurmQueues`](Scheduling-v3.md#Scheduling-v3-SlurmQueues) / [`CustomSlurmSettings`](Scheduling-v3.md#yaml-Scheduling-SlurmQueues-ComputeResources-CustomSlurmSettings)（映射至Slurm節點） [`ComputeResources`](Scheduling-v3.md#Scheduling-v3-SlurmQueues-ComputeResources) 自訂運算資源的Slurm參數。

## Slurm 使用 時的組態自訂限制和考量事項 AWS ParallelCluster
<a name="slurm-configuration-considerations-v3"></a>


+ 對於 `CustomSlurmSettings`和 `CustomSlurmSettingsIncludeFile`設定，您只能指定和更新包含在您用來設定叢集的[Slurm版本](slurm-workload-manager-v3.md)所支援的 AWS ParallelCluster 版本中的`slurm.conf`參數。
+ 如果您在任何`CustomSlurmSettings`參數中指定自訂Slurm組態， 會 AWS ParallelCluster 執行驗證檢查，並防止設定或更新與 AWS ParallelCluster 邏輯衝突的Slurm組態參數。已知與 衝突的Slurm組態參數 AWS ParallelCluster 會在拒絕清單中識別。如果新增其他Slurm功能，拒絕清單可能會在未來 AWS ParallelCluster 版本中變更。如需詳細資訊，請參閱[拒絕列出的Slurm組態參數 `CustomSlurmSettings`](#slurm-configuration-denylists-v3)。
+ AWS ParallelCluster 只會檢查參數是否在拒絕清單中。 AWS ParallelCluster 不會驗證您的自訂Slurm組態參數語法或語意。您有責任驗證您的自訂Slurm組態參數。無效的自訂Slurm組態參數可能會導致Slurm協助程式失敗，進而導致叢集建立和更新失敗。
+ 如果您在 中指定自訂Slurm組態`CustomSlurmSettingsIncludeFile`， AWS ParallelCluster 不會執行任何驗證。
+ 您可以更新 `CustomSlurmSettings`和 ，`CustomSlurmSettingsIncludeFile`而無需停止和啟動運算機群。在此情況下， `slurmctld` 會 AWS ParallelCluster 重新啟動協助程式並執行 `scontrol reconfigure`命令。

  在整個叢集中註冊變更之前，某些Slurm組態參數可能需要不同的操作。例如，它們可能需要重新啟動叢集中的所有協助程式。您有責任驗證 AWS ParallelCluster 操作是否足以在更新期間傳播您的自訂Slurm組態參數設定。如果您發現 AWS ParallelCluster 操作不足，您有責任提供傳播更新設定所需的其他動作，如 [Slurm 文件](https://slurm.schedmd.com/documentation.html)中所建議。

## 拒絕列出的Slurm組態參數 `CustomSlurmSettings`
<a name="slurm-configuration-denylists-v3"></a>

下表列出拒絕使用的 參數 AWS ParallelCluster 版本，從 3.6.0 版開始。 `CustomSlurmSettings`不支援 3.6.0 版之前的 AWS ParallelCluster 版本。


**叢集層級的拒絕列出參數：**  

| Slurm 參數 |  AWS ParallelCluster 版本中列入拒絕清單 | 
| --- | --- | 
|  CommunicationParameters  |  3.6.0  | 
|  Epilog  |  3.6.0  | 
|  GresTypes  |  3.6.0  | 
|  LaunchParameters  |  3.6.0  | 
|  Prolog  |  3.6.0  | 
|  ReconfigFlags  |  3.6.0  | 
|  ResumeFailProgram  |  3.6.0  | 
|  ResumeProgram  |  3.6.0  | 
|  ResumeTimeout  |  3.6.0  | 
|  SlurmctldHost  |  3.6.0  | 
|  SlurmctldLogFile  |  3.6.0  | 
|  SlurmctldParameters  |  3.6.0  | 
|  SlurmdLogfile  |  3.6.0  | 
|  SlurmUser  |  3.6.0  | 
|  SuspendExcNodes  |  3.6.0  | 
|  SuspendProgram  |  3.6.0  | 
|  SuspendTime  |  3.6.0  | 
|  TaskPlugin  |  3.6.0  | 
|  TreeWidth  |  3.6.0  | 


**在叢集組態中設定[原生Slurm會計整合](slurm-accounting-v3.md)時，叢集層級的拒絕列出參數：**  

| Slurm 參數 |  AWS ParallelCluster 版本中列入拒絕清單 | 
| --- | --- | 
|  AccountingStorageType  |  3.6.0  | 
|  AccountingStorageHost  |  3.6.0  | 
|  AccountingStoragePort  |  3.6.0  | 
|  AccountingStorageUser  |  3.6.0  | 
|  JobAcctGatherType  |  3.6.0  | 


**佇列管理的佇列在佇列 （分割區） 層級拒絕列出的參數 AWS ParallelCluster：**  

| Slurm 參數 |  AWS ParallelCluster 版本中列入拒絕清單 | 
| --- | --- | 
|  節點  |  3.6.0  | 
|  PartitionName  |  3.6.0  | 
|  ResumeTimeout  |  3.6.0  | 
|  State  |  3.6.0  | 
|  SuspendTime  |  3.6.0  | 


**運算資源的運算資源 （節點） 層級拒絕列出的參數，管理者為 AWS ParallelCluster：**  

| Slurm 參數 | 拒絕列出 AWS ParallelCluster 版本 和更新版本 | 
| --- | --- | 
|  CPUs  |  3.6.0  | 
|  功能  |  3.6.0  | 
|  Gres  |  3.6.0  | 
|  NodeAddr  |  3.6.0  | 
|  NodeHostname  |  3.6.0  | 
|  NodeName  |  3.6.0  | 
|  Weight  |  3.7.0  | 