

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Praktik terbaik
<a name="best-practices-v3"></a>

Bagian berikut memberikan praktik terbaik untuk digunakan AWS ParallelCluster, yang mencakup kinerja jaringan dan peringatan anggaran. Jika Anda mengalami masalah meskipun Anda mengikuti praktik terbaik ini, lihat [AWS ParallelCluster pemecahan masalah](troubleshooting-v3.md) solusi yang mungkin.

## Praktik terbaik: pemilihan tipe instance node kepala
<a name="best-practices-head-node-instance-type"></a>

Meskipun node kepala tidak menjalankan pekerjaan, fungsi dan ukurannya sangat penting untuk kinerja cluster secara keseluruhan. Saat Anda memilih jenis instance yang akan digunakan untuk node kepala Anda, pertimbangkan karakteristik berikut:

**Ukuran cluster:** Head node mengatur logika penskalaan cluster dan bertanggung jawab untuk melampirkan node baru ke scheduler. Untuk meningkatkan dan menurunkan cluster yang memiliki jumlah node besar, berikan node kepala beberapa kapasitas komputasi tambahan.

**Sistem file bersama:** Saat Anda menggunakan sistem file bersama, pilih jenis instans dengan bandwidth jaringan yang cukup, dan bandwidth Amazon EBS yang cukup, untuk menangani alur kerja Anda. Pastikan node kepala dapat mengekspos direktori server NFS yang cukup untuk cluster dan menangani artefak yang perlu dibagi antara node komputasi dan node kepala. 

## Praktik terbaik: kinerja jaringan
<a name="best-practices-network-performance-v3"></a>

Kinerja jaringan sangat penting untuk aplikasi komputasi kinerja tinggi (HPC). Tanpa kinerja jaringan yang andal, aplikasi ini tidak dapat berfungsi seperti yang diharapkan. Untuk mengoptimalkan kinerja jaringan, pertimbangkan praktik terbaik berikut.
+ **Grup penempatan:** Jika Anda menggunakanSlurm, pertimbangkan untuk mengonfigurasi setiap Slurm antrian untuk menggunakan grup penempatan klaster. *Grup penempatan* klaster adalah pengelompokan logis instance dalam satu Availability Zone. Untuk informasi selengkapnya, lihat [grup penempatan](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/placement-groups.html) di *Panduan EC2 Pengguna Amazon*. Anda dapat menentukan a [`PlacementGroup`](Scheduling-v3.md#yaml-Scheduling-SlurmQueues-Networking-PlacementGroup)di [`Networking`](Scheduling-v3.md#Scheduling-v3-SlurmQueues-Networking)bagian antrian, setiap sumber daya komputasi ditetapkan ke grup penempatan antrian. Saat menentukan [`PlacementGroup`](Scheduling-v3.md#yaml-Scheduling-SlurmQueues-ComputeResources-Networking-PlacementGroup)di [`Networking`](Scheduling-v3.md#yaml-Scheduling-SlurmQueues-ComputeResources-Networking)bagian sumber daya komputasi, sumber daya komputasi tertentu ditetapkan ke grup penempatan tersebut. Spesifikasi grup penempatan sumber daya komputasi mengesampingkan spesifikasi antrian untuk sumber daya komputasi. Untuk informasi lebih lanjut, lihat [`SlurmQueues`](Scheduling-v3.md#Scheduling-v3-SlurmQueues)/[`Networking`](Scheduling-v3.md#Scheduling-v3-SlurmQueues-Networking)/[`PlacementGroup`](Scheduling-v3.md#yaml-Scheduling-SlurmQueues-Networking-PlacementGroup)dan [`SlurmQueues`](Scheduling-v3.md#Scheduling-v3-SlurmQueues)/[`ComputeResources`](Scheduling-v3.md#Scheduling-v3-SlurmQueues-ComputeResources)/[`Networking`](Scheduling-v3.md#yaml-Scheduling-SlurmQueues-ComputeResources-Networking)/[`PlacementGroup`](Scheduling-v3.md#yaml-Scheduling-SlurmQueues-ComputeResources-Networking-PlacementGroup).

  ```
  Networking:
    PlacementGroup:
      Enabled: true
      Id: your-placement-group-name
  ```

  Atau, AWS ParallelCluster buat grup penempatan untuk Anda.

  ```
  Networking:
    PlacementGroup:
      Enabled: true
  ```

  Dimulai dengan AWS ParallelCluster versi 3.3.0, pembuatan dan manajemen grup penempatan dimodifikasi. Saat Anda menentukan grup penempatan yang akan diaktifkan, tanpa `name` atau, dalam antrian`Id`, setiap sumber daya komputasi ditetapkan grup penempatan terkelolanya sendiri, bukan satu grup terkelola untuk seluruh antrian. Ini membantu mengurangi kesalahan kapasitas yang tidak mencukupi. Jika Anda perlu memiliki satu grup penempatan untuk seluruh antrian, Anda dapat menggunakan grup penempatan bernama.

  [`SlurmQueues`](Scheduling-v3.md#Scheduling-v3-SlurmQueues)/[`Networking`](Scheduling-v3.md#Scheduling-v3-SlurmQueues-Networking)/[`PlacementGroup`](Scheduling-v3.md#yaml-Scheduling-SlurmQueues-Networking-PlacementGroup)/[`Name`](Scheduling-v3.md#yaml-Scheduling-SlurmQueues-Networking-PlacementGroup-Name)ditambahkan sebagai alternatif pilihan untuk [`SlurmQueues`](Scheduling-v3.md#Scheduling-v3-SlurmQueues)/[`Networking`](Scheduling-v3.md#Scheduling-v3-SlurmQueues-Networking)/[`PlacementGroup`](Scheduling-v3.md#yaml-Scheduling-SlurmQueues-Networking-PlacementGroup)/[`Id`](Scheduling-v3.md#yaml-Scheduling-SlurmQueues-Networking-PlacementGroup-Id).

  Untuk informasi selengkapnya, lihat [`Networking`](Scheduling-v3.md#Scheduling-v3-SlurmQueues-Networking).
+ **Jaringan yang disempurnakan:** Pertimbangkan untuk memilih jenis instance yang mendukung peningkatan jaringan. Rekomendasi ini berlaku untuk semua [instance generasi saat ini](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/instance-types.html#current-gen-instances). Untuk informasi selengkapnya, lihat [jaringan yang disempurnakan di Linux](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/enhanced-networking.html) di *Panduan EC2 Pengguna Amazon*.
+ **Adaptor Kain Elastis:** Untuk mendukung komunikasi instans ke instance tingkat tinggi yang dapat diskalakan, pertimbangkan untuk memilih antarmuka jaringan EFA untuk jaringan Anda. Perangkat keras bypass sistem operasi (OS) yang dibuat khusus EFA meningkatkan komunikasi instance ke instance dengan elastisitas dan fleksibilitas sesuai permintaan. AWS Cloud Anda dapat mengonfigurasi setiap Slurm antrian [`ComputeResource`](Scheduling-v3.md#Scheduling-v3-SlurmQueues-ComputeResources)untuk digunakan [`Efa`](Scheduling-v3.md#yaml-Scheduling-SlurmQueues-ComputeResources-Efa). Untuk informasi lebih lanjut tentang menggunakan EFA dengan AWS ParallelCluster, lihat[Elastic Fabric Adapter](efa-v3.md).

  ```
  ComputeResources:
    - Name: your-compute-resource-name
      Efa:
        Enabled: true
  ```

  Untuk informasi selengkapnya tentang EFA, lihat [Adaptor Kain Elastis](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/efa.html) di *Panduan EC2 Pengguna Amazon untuk Instans Linux*.
+ **Bandwidth instance:** Skala bandwidth dengan ukuran instans. *Untuk informasi tentang berbagai jenis instans, lihat [Instans yang dioptimalkan Amazon EBS dan](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ebs-optimized.html) jenis [volume Amazon EBS di Panduan Pengguna](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ebs-volume-types.html) Amazon. EC2 *

## Praktik terbaik: peringatan anggaran
<a name="best-practices-budget-alerts-v3"></a>

Untuk mengelola biaya sumber daya di AWS ParallelCluster, kami sarankan Anda menggunakan AWS Budgets tindakan untuk membuat anggaran. Anda juga dapat membuat peringatan ambang anggaran yang ditentukan untuk AWS sumber daya yang dipilih. Untuk informasi selengkapnya, lihat [Mengonfigurasi tindakan anggaran](https://docs.aws.amazon.com/cost-management/latest/userguide/budgets-controls.html) di *Panduan AWS Budgets Pengguna*. Demikian pula, Anda juga dapat menggunakan Amazon CloudWatch untuk membuat alarm penagihan. Untuk informasi selengkapnya, lihat [Membuat alarm penagihan untuk memantau perkiraan AWS biaya](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/monitor_estimated_charges_with_cloudwatch.html).

## Praktik terbaik: memindahkan cluster ke versi AWS ParallelCluster minor atau patch baru
<a name="best-practices-cluster-upgrades-v3"></a>

Saat ini setiap versi AWS ParallelCluster minor mandiri bersama dengan CLI-nya`pcluster`. Untuk memindahkan cluster ke versi minor atau patch baru, Anda harus membuat ulang cluster menggunakan CLI versi baru.

Untuk mengoptimalkan proses pemindahan cluster ke versi minor atau patch baru, kami sarankan Anda melakukan hal berikut:
+ Simpan data pribadi dalam volume eksternal yang dibuat di luar cluster, seperti Amazon EFS dan FSx untuk Lustre. Dengan melakukan ini, Anda dapat dengan mudah memindahkan data dari satu cluster ke cluster lain di masa depan.
+ Buat sistem penyimpanan bersama menggunakan jenis berikut. Anda dapat membuat sistem ini menggunakan AWS CLI atau Konsol Manajemen AWS.
  + [`SharedStorage`](SharedStorage-v3.md) / [`EbsSettings`](SharedStorage-v3.md#SharedStorage-v3-EbsSettings) / [`VolumeId`](SharedStorage-v3.md#yaml-SharedStorage-EbsSettings-VolumeId)
  + [`SharedStorage`](SharedStorage-v3.md) / [`EfsSettings`](SharedStorage-v3.md#SharedStorage-v3-EfsSettings) / [`FileSystemId`](SharedStorage-v3.md#yaml-SharedStorage-EfsSettings-FileSystemId)
  + [`SharedStorage`](SharedStorage-v3.md) / [`FsxLustreSettings`](SharedStorage-v3.md#SharedStorage-v3-FsxLustreSettings) / [`FileSystemId`](SharedStorage-v3.md#yaml-SharedStorage-FsxLustreSettings-FileSystemId)

  Tentukan sistem file atau volume dalam konfigurasi cluster sebagai sistem file atau volume yang ada. Dengan cara ini, mereka dipertahankan saat Anda menghapus cluster dan dapat dilampirkan ke cluster baru.

  Kami menyarankan Anda menggunakan Amazon EFS atau FSx untuk sistem file Lustre. Kedua sistem ini dapat dilampirkan ke beberapa cluster pada saat yang bersamaan. Selain itu, Anda dapat melampirkan salah satu dari sistem ini ke cluster baru sebelum Anda menghapus cluster yang ada.
+ Gunakan [tindakan bootstrap kustom](custom-bootstrap-actions-v3.md) untuk menyesuaikan instance Anda daripada menggunakan AMI kustom. Jika sebaliknya, Anda menggunakan AMI kustom, maka Anda perlu menghapus dan membuat ulang AMI itu untuk setiap rilis versi baru.
+ Kami menyarankan Anda menerapkan rekomendasi sebelumnya dalam urutan berikut:

  1. Perbarui konfigurasi cluster yang ada untuk menggunakan definisi sistem file yang ada.

  1. Verifikasi `pcluster` versi dan perbarui jika diperlukan.

  1. Buat dan uji cluster baru. Saat Anda menguji cluster baru, periksa hal berikut:
     + Pastikan data Anda tersedia di cluster baru.
     + Pastikan aplikasi Anda bekerja di cluster baru.

  1. Setelah cluster baru Anda sepenuhnya diuji dan operasional dan Anda tidak lagi membutuhkan cluster yang ada, hapus.