

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 最佳實務
<a name="best-practices"></a>

## 最佳實務：主要執行個體類型選取
<a name="best-practices-master-instance-type"></a>

雖然主節點不會執行任何任務，但其函數及其大小對於叢集的整體效能至關重要。

選擇要用於主節點的執行個體類型時，您要評估下列項目：
+ **叢集大小：**主節點會協調叢集的擴展邏輯，並負責將新節點連接至排程器。如果您需要擴展和縮減大量節點的叢集，則您想要為主節點提供一些額外的運算容量。
+ **共用檔案系統：**使用共用檔案系統在運算節點和主節點之間共用成品時，請考慮主節點是公開 NFS 伺服器的節點。因此，您想要選擇具有足夠網路頻寬和足夠專用 Amazon EBS 頻寬的執行個體類型來處理工作流程。

## 最佳實務：網路效能
<a name="best-practices-network-performance"></a>

有三種提示涵蓋了改善網路通訊的各種可能性。
+ **置放群組：**叢集置放群組是單一可用區域內執行個體的邏輯群組。如需置放群組的詳細資訊，請參閱《*Amazon EC2 使用者指南*》中的[置放群組](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/placement-groups.html)。您可以設定叢集搭配 使用您自己的置放群組，`placement_group = your-placement-group-name`或讓 AWS ParallelCluster 使用 `"compute"`策略建立置放群組`placement_group = DYNAMIC`。如需詳細資訊，請參閱[`placement_group`](queue-section.md#queue-placement-group)適用於多個佇列模式的 和適用於單一佇列模式[`placement_group`](cluster-definition.md#placement-group)的 。
+ **增強型聯網：**考慮選擇支援增強型聯網的執行個體類型。如需詳細資訊，請參閱《*Amazon EC2 使用者指南*》中的 [Linux 上的增強型聯網](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/enhanced-networking.html)。
+ **Elastic Fabric Adapter：**若要支援高度可擴展的執行個體間通訊，請考慮為您的網路選擇 EFA 網路介面。EFA 的自訂作業系統 (OS) 旁路硬體透過 AWS 雲端的隨需彈性和彈性來增強執行個體間通訊。若要將單一Slurm叢集佇列設定為使用 EFA，請設定 `enable_efa = true`。如需搭配 使用 EFA 的詳細資訊 AWS ParallelCluster，請參閱 [Elastic Fabric Adapter](efa.md)和 [`enable_efa`](queue-section.md#queue-enable-efa)。如需 EFA 的詳細資訊，請參閱《*Amazon EC2 Linux 執行個體使用者指南*》中的 [Elastic Fabric Adapter](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/efa.html)。
+ **執行個體頻寬：**頻寬會隨執行個體大小而擴展，請考慮選擇更符合您需求的執行個體類型，請參閱《[Amazon EC2 使用者指南》中的 Amazon EBS 最佳化執行個體](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ebs-optimized.html)*Amazon EC2 * [EBS 磁碟區類型](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ebs-volume-types.html)。

## 最佳實務：預算提醒
<a name="best-practices-budget-alerts"></a>

若要管理 AWS ParallelCluster 資源成本，建議您使用 AWS Budgets 動作來建立所選 AWS 資源的預算和定義的預算閾值提醒。如需詳細資訊，請參閱*AWS Budgets 《 使用者指南*》中的[設定預算動作](https://docs.aws.amazon.com/cost-management/latest/userguide/budgets-controls.html)。您也可以使用 Amazon CloudWatch 建立帳單警示。如需詳細資訊，請參閱[建立帳單警示以監控您的預估 AWS 費用](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/monitor_estimated_charges_with_cloudwatch.html)。

## 最佳實務：將叢集移至新的 AWS ParallelCluster 次要或修補程式版本
<a name="best-practices-cluster-upgrades"></a>

目前每個 AWS ParallelCluster 次要版本都與其 `pcluster` CLI 一起獨立。若要將叢集移至新的次要或修補程式版本，您必須使用新版本的 CLI 重新建立叢集。

若要最佳化將叢集移至新次要版本的程序，或基於其他原因儲存共用儲存資料的程序，建議您使用下列最佳實務。
+ 將個人資料儲存在外部磁碟區中，例如 Amazon EFS 和 FSx for Lustre。透過這樣做，您可以輕鬆地將資料從一個叢集移至另一個叢集。
+ 使用 AWS CLI 或 建立下列類型的共用儲存系統 AWS 管理主控台：
  + [`[ebs]` 區段](ebs-section.md)
  + [`[efs]` 區段](efs-section.md)
  + [`[fsx]` 區段](fsx-section.md)

  將它們新增至新的叢集組態做為現有的檔案系統。如此一來，它們會在您刪除叢集時保留，並且可以連接到新的叢集。共用儲存系統通常會產生費用，無論它們是否與叢集連接或分離。

  我們建議您使用 Amazon EFS 或 Amazon FSx for Lustre 檔案系統，因為它們可以同時連接到多個叢集，而且您可以在刪除舊叢集之前將其連接到新叢集。如需詳細資訊，請參閱《[Amazon EFS 使用者指南》中的掛載 Amazon EFS 檔案系統](https://docs.aws.amazon.com/efs/latest/ug/mounting-fs.html)，以及《Amazon [FSx for Lustre 使用者指南》中的存取 FSx for Lustre 檔案系統](https://docs.aws.amazon.com/fsx/latest/LustreGuide/accessing-fs.html)。 * EFS * * FSx *
+ 使用[自訂引導操作](pre_post_install.md)來自訂您的執行個體，而非自訂 AMI。這會最佳化建立程序，因為不需要為每個新版本建立新的自訂 AMI。
+ 建議的序列。

  1. 更新叢集組態以使用現有的檔案系統定義。

  1. 驗證`pcluster`版本並視需要更新。

  1. 建立和測試新叢集。
     + 確保您的資料可在新叢集中使用。
     + 確保您的應用程式可在新叢集中運作。

  1. 如果您是經過完整測試且可運作的新叢集，而且您確定不會使用舊叢集，請將其刪除。