

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 什麼是 AWS 平行運算服務？
<a name="what-is-service"></a>

AWS 平行運算服務 (AWS PCS) 是一種受管服務，可讓您更輕鬆地執行和擴展高效能運算 (HPC) 工作負載，並在 AWS 上使用 Slurm 建置科學和工程模型。使用 AWS PCS 建置整合業界最佳運算、儲存、聯網和視覺化的 AWS 運算叢集。執行模擬或建置科學和工程模型。使用內建的管理和可觀測性功能，簡化叢集操作。透過讓使用者能夠在熟悉的環境中執行應用程式和任務，讓您的使用者能夠專注於研究和創新。

**Topics**
+ [AWS PCS 中的概念](key-concepts.md)

# AWS PCS 中的概念
<a name="key-concepts"></a>

 AWS PCS 中的叢集有 1 個或多個佇列，與至少 1 個運算節點群組相關聯。任務會提交至佇列，並在運算節點群組定義的 EC2 執行個體上執行。您可以使用這些基礎來實作複雜的 HPC 架構。

**叢集**  
 叢集是管理資源和執行工作負載的資源。叢集是一種 AWS PCS 資源，可定義運算、聯網、儲存、身分和任務排程器組態的組合。您可以透過指定要使用的任務排程器 （目前為 Slurm)、您想要的排程器組態、您想要管理叢集的服務控制器，以及您想要在哪些 VPC 中啟動叢集資源，來建立叢集。排程器接受並排程任務，也會啟動處理這些任務的運算節點 (EC2 執行個體）。

**運算節點群組**  
 運算節點群組是 AWS PCS 用來執行任務或提供叢集互動式存取的運算節點集合。當您定義運算節點群組時，您可以指定常見的特徵，例如 Amazon EC2 執行個體類型、執行個體數量下限和上限、目標 VPC 子網路、Amazon Machine Image (AMI)、購買選項和自訂啟動組態。 AWS PCS 使用這些設定來有效率地啟動、管理和終止運算節點群組中的運算節點。

**佇列**  
 當您想要在特定叢集上執行任務時，您可以將其提交至特定佇列 （有時也稱為*分割區*)。任務會保留在佇列中，直到 AWS PCS 排程在運算節點群組上執行。您可以將一或多個運算節點群組與每個佇列建立關聯。需要使用 佇列，以使用任務排程器提供的各種排程政策，在基礎運算節點群組資源上排程和執行任務。使用者不會將任務直接提交至運算節點或運算節點群組。

**系統管理員**  
 系統管理員會部署、維護和操作叢集。他們可以透過 AWS 管理主控台、 AWS PCS API 和 AWS SDK 存取 AWS PCS。他們可以透過 SSH 或 存取特定叢集 AWS Systems Manager，在其中執行管理任務、執行任務、管理資料，以及執行其他以 shell 為基礎的活動。如需詳細資訊，請參閱 *[AWS Systems Manager 文件](https://docs.aws.amazon.com/systems-manager/)*。

**最終使用者**  
 最終使用者沒有部署或操作叢集的day-to-day責任。他們使用終端機界面 （例如 SSH) 來存取叢集資源、執行任務、管理資料，以及執行其他以 shell 為基礎的活動。