

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 使用 競價型執行個體
<a name="spot-v3"></a>

AWS ParallelCluster 如果您已`SPOT`在叢集組態檔案中將 [`SlurmQueues`](Scheduling-v3.md#Scheduling-v3-SlurmQueues) / [`CapacityType`](Scheduling-v3.md#yaml-Scheduling-SlurmQueues-CapacityType)或 [`AwsBatchQueues`](Scheduling-v3.md#Scheduling-v3-AwsBatchQueues) / [`CapacityType`](Scheduling-v3.md#yaml-Scheduling-AwsBatchQueues-CapacityType) 設定為 ，則 會使用 Spot 執行個體。Spot 執行個體比隨需執行個體更具成本效益，但可能會中斷。這可能有助於利用 *Spot 執行個體中斷通知*，在 Amazon EC2 必須停止或終止 Spot 執行個體之前提供兩分鐘的警告。如需詳細資訊，請參閱《*Amazon EC2 使用者指南》中的* [Spot 執行個體中斷](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/spot-interruptions.html)。若要了解如何[`AwsBatchQueues`](Scheduling-v3.md#Scheduling-v3-AwsBatchQueues)使用 Spot 執行個體，請參閱*AWS Batch 《 使用者指南*》中的[運算資源](https://docs.aws.amazon.com/batch/latest/userguide/compute_environment_parameters.html#compute_environment_compute_resources)。

 AWS ParallelCluster 設定的排程器會指派任務來計算具有 Spot 執行個體之佇列中的資源，方式與指派任務來計算具有隨需執行個體之佇列中的資源相同。

使用 Spot 執行個體時，您的帳戶中必須存在 AWSServiceRoleForEC2Spot 服務連結角色。若要使用 在帳戶中建立此角色 AWS CLI，請執行下列命令：

```
$ aws iam create-service-linked-role --aws-service-name spot.amazonaws.com
```

如需詳細資訊，請參閱《*Amazon EC2 使用者指南*》中的 [Spot 執行個體請求的服務連結角色](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/spot-requests.html#service-linked-roles-spot-instance-requests)。

下列各節說明使用 時，Spot 執行個體可以中斷的三種情況[`SlurmQueues`](Scheduling-v3.md#Scheduling-v3-SlurmQueues)。

# 案例 1：沒有執行中任務的 Spot 執行個體遭到中斷
<a name="no-jobs-v3"></a>

發生此中斷時，如果排程器佇列有待定任務需要額外執行個體，或作用中執行個體的數量低於 [`SlurmQueues`](Scheduling-v3.md#Scheduling-v3-SlurmQueues) / [`ComputeResources`](Scheduling-v3.md#Scheduling-v3-SlurmQueues-ComputeResources) / ， 會 AWS ParallelCluster 嘗試取代執行個體[`MinCount`](Scheduling-v3.md#yaml-Scheduling-SlurmQueues-ComputeResources-MinCount)。如果 AWS ParallelCluster 無法佈建新的執行個體，則會定期重複對新執行個體的請求。

# 案例 2：執行單一節點任務的 Spot 執行個體遭到中斷
<a name="single-node-v3"></a>

任務失敗，狀態碼為 `NODE_FAIL`，且任務會重新排入佇列 （除非在提交任務時`--no-requeue`指定）。如果節點是靜態節點，則會予以取代。如果節點是動態節點，則會終止節點並重設。如需 的詳細資訊`sbatch`，包括 `--no-requeue` 參數，請參閱 *Slurm 文件*[https://slurm.schedmd.com/sbatch.html](https://slurm.schedmd.com/sbatch.html)中的 。

# 案例 3：執行多節點任務的 Spot 執行個體遭到中斷
<a name="multi-node-v3"></a>

任務失敗，狀態碼為 `NODE_FAIL`，且任務會重新排入佇列 （除非在提交任務時`--no-requeue`指定）。如果節點是靜態節點，則會予以取代。如果節點是動態節點，則會終止節點並重設。執行已終止任務的其他節點可能會配置給其他待定任務，或在設定的 [`SlurmSettings`](Scheduling-v3.md#Scheduling-v3-SlurmSettings) / [`ScaledownIdletime`](Scheduling-v3.md#yaml-Scheduling-SlurmSettings-ScaledownIdletime) 時間過後縮減規模。

如需 Spot 執行個體的詳細資訊，請參閱《*Amazon EC2 使用者指南*》中的 [Spot 執行個體](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/using-spot-instances.html)。