

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Mencoba membuat cluster
<a name="troubleshooting-fc-v3-create-cluster"></a>

Saat menggunakan AWS ParallelCluster versi 3.5.0 dan yang lebih baru untuk membuat cluster, dan pembuatan cluster gagal dengan `--rollback-on-failure` set to`false`, gunakan perintah [`pcluster describe-cluster`](pcluster.describe-cluster-v3.md) CLI untuk mendapatkan informasi status dan kegagalan. Dalam hal ini, `pcluster describe-cluster` output `clusterStatus` yang diharapkan adalah`CREATE_FAILED`. Periksa `failures` bagian dalam output untuk menemukan `failureCode` dan`failureReason`. Kemudian, di bagian berikut, temukan pencocokan `failureCode` untuk bantuan pemecahan masalah tambahan. Untuk informasi selengkapnya, lihat [`pcluster describe-cluster`](pcluster.describe-cluster-v3.md).

Di bagian berikut, kami sarankan Anda memeriksa log pada node kepala, seperti `/var/log/chef-client.log` file `/var/log/cfn-init.log` dan. Untuk informasi selengkapnya tentang AWS ParallelCluster log dan cara melihatnya, lihat [Log kunci untuk debugging](troubleshooting-v3-scaling-issues.md#troubleshooting-v3-key-logs) dan[Mengambil dan melestarikan log](troubleshooting-v3-get-logs.md).

Jika Anda tidak memiliki`failureCode`, navigasikan ke CloudFormation konsol untuk melihat tumpukan cluster. Periksa `Status Reason` untuk `HeadNodeWaitCondition` atau kegagalan pada sumber daya lain untuk menemukan rincian kegagalan tambahan. Untuk informasi selengkapnya, lihat [Lihat CloudFormation acara di `CREATE_FAILED`](troubleshooting-v3-cluster-deployment.md#troubleshooting-v3-cluster-deployment-events). Periksa `/var/log/chef-client.log` file `/var/log/cfn-init.log` dan pada node kepala. Jika pembuatan cluster gagal karena kegagalan pembuatan node kepala dan log cluster tidak tersedia di grup log cluster, Anda harus mempertahankan cluster pada kegagalan, menentukan `--rollback-on-failure` = `True` dan mengambil log dari dalam node kepala itu sendiri.

## `failureCode`adalah `OnNodeConfiguredExecutionFailure`
<a name="create-cluster-on-node-configured-executed-failure-v3"></a>
+ **Mengapa gagal?**

  Anda menyediakan skrip kustom di `OnNodeConfigured` bagian simpul kepala dalam konfigurasi untuk membuat cluster. Namun, skrip khusus gagal dijalankan.
+ **Bagaimana cara mengatasinya?**

  Periksa `/var/log/cfn-init.log` file untuk mempelajari lebih lanjut tentang kegagalan dan cara memperbaiki masalah dalam skrip kustom Anda. Menjelang akhir log ini, Anda mungkin melihat menjalankan informasi yang terkait dengan `OnNodeConfigured` skrip setelah `Running command runpostinstall` pesan.

## `failureCode`adalah `OnNodeConfiguredDownloadFailure`
<a name="create-cluster-on-node-configured-download-failure-v3"></a>
+ **Mengapa gagal?**

  Anda menyediakan skrip kustom di `OnNodeConfigured` bagian simpul kepala dalam konfigurasi untuk membuat cluster. Namun, skrip khusus gagal diunduh.
+ **Bagaimana cara mengatasinya?**

  Pastikan URL valid dan akses dikonfigurasi dengan benar. Untuk informasi lebih lanjut tentang konfigurasi skrip bootstrap kustom, lihat[Tindakan bootstrap kustom](custom-bootstrap-actions-v3.md).

  Periksa `/var/log/cfn-init.log` filenya. Menjelang akhir log ini, Anda mungkin melihat menjalankan informasi yang terkait dengan pemrosesan `OnNodeConfigured` skrip, termasuk mengunduh, setelah `Running command runpostinstall` pesan.

## `failureCode`adalah `OnNodeConfiguredFailure`
<a name="create-cluster-on-node-configured-failure-v3"></a>
+ **Mengapa gagal?**

  Anda menyediakan skrip kustom di `OnNodeConfigured` bagian simpul kepala dalam konfigurasi untuk membuat cluster. Namun, penggunaan skrip khusus gagal dalam penerapan cluster. Penyebab langsung tidak dapat ditentukan dan penyelidikan tambahan diperlukan.
+ **Bagaimana cara mengatasinya?**

  Periksa `/var/log/cfn-init.log` filenya. Menjelang akhir log ini, Anda mungkin melihat menjalankan informasi yang terkait dengan pemrosesan `OnNodeConfigured` skrip setelah `Running command runpostinstall` pesan.

## `failureCode`adalah `OnNodeStartExecutionFailure`
<a name="create-cluster-on-node-start-execution-failure-v3"></a>
+ **Mengapa gagal?**

  Anda menyediakan skrip kustom di `OnNodeStart` bagian simpul kepala dalam konfigurasi untuk membuat cluster. Namun, skrip khusus gagal dijalankan.
+ **Bagaimana cara mengatasinya?**

  Periksa `/var/log/cfn-init.log` file untuk mempelajari lebih lanjut tentang kegagalan dan cara memperbaiki masalah dalam skrip kustom Anda. Menjelang akhir log ini, Anda mungkin melihat menjalankan informasi yang terkait dengan `OnNodeStart` skrip setelah `Running command runpreinstall` pesan.

## `failureCode`adalah `OnNodeStartDownloadFailure`
<a name="create-cluster-on-node-start-download-failure-v3"></a>
+ **Mengapa gagal?**

  Anda menyediakan skrip kustom di `OnNodeStart` bagian simpul kepala dalam konfigurasi untuk membuat cluster. Namun, skrip khusus gagal diunduh.
+ **Bagaimana cara mengatasinya?**

  Pastikan URL valid dan akses dikonfigurasi dengan benar. Untuk informasi lebih lanjut tentang konfigurasi skrip bootstrap kustom, lihat[Tindakan bootstrap kustom](custom-bootstrap-actions-v3.md).

  Periksa `/var/log/cfn-init.log` filenya. Menjelang akhir log ini, Anda mungkin melihat menjalankan informasi yang terkait dengan pemrosesan `OnNodeStart` skrip, termasuk mengunduh, setelah `Running command runpreinstall` pesan.

## `failureCode`adalah `OnNodeStartFailure`
<a name="create-cluster-on-node-start-failure-v3"></a>
+ **Mengapa gagal?**

  Anda menyediakan skrip kustom di `OnNodeStart` bagian node kepala dalam konfigurasi untuk membuat cluster. Namun, penggunaan skrip khusus gagal dalam penerapan cluster. Penyebab langsung tidak dapat ditentukan dan penyelidikan tambahan diperlukan.
+ **Bagaimana cara mengatasinya?**

  Periksa `/var/log/cfn-init.log` filenya. Menjelang akhir log ini, Anda mungkin melihat menjalankan informasi yang terkait dengan pemrosesan `OnNodeStart` skrip setelah `Running command runpreinstall` pesan.

## `failureCode`adalah `EbsMountFailure`
<a name="create-cluster-ebs-mount-failure-v3"></a>
+ **Mengapa gagal?**

  Volume EBS yang ditentukan dalam konfigurasi cluster gagal dipasang.
+ **Bagaimana cara mengatasinya?**

  Periksa `/var/log/chef-client.log` file untuk rincian kegagalan.

## `failureCode`adalah `EfsMountFailure`
<a name="create-cluster-efs-mount-failure-v3"></a>
+ **Mengapa gagal?**

  Volume Amazon EFS yang ditentukan dalam konfigurasi cluster gagal dipasang.
+ **Bagaimana cara mengatasinya?**

  Jika Anda mendefinisikan sistem file Amazon EFS yang ada, pastikan lalu lintas diizinkan antara cluster dan sistem file. Untuk informasi lebih lanjut, lihat [`SharedStorage`](SharedStorage-v3.md)/[`EfsSettings`](SharedStorage-v3.md#SharedStorage-v3-EfsSettings)/[`FileSystemId`](SharedStorage-v3.md#yaml-SharedStorage-EfsSettings-FileSystemId).

  Periksa `/var/log/chef-client.log` file untuk rincian kegagalan.

## `failureCode`adalah `FsxMountFailure`
<a name="create-cluster-fsx-mount-failure-v3"></a>
+ **Mengapa gagal?**

  Sistem FSx file Amazon yang ditentukan dalam konfigurasi cluster gagal dipasang.
+ **Bagaimana cara mengatasinya?**

  Jika Anda mendefinisikan sistem FSx file Amazon yang ada, pastikan lalu lintas diizinkan antara cluster dan sistem file. Untuk informasi lebih lanjut, lihat [`SharedStorage`](SharedStorage-v3.md)/[`FsxLustreSettings`](SharedStorage-v3.md#SharedStorage-v3-FsxLustreSettings)/[`FileSystemId`](SharedStorage-v3.md#yaml-SharedStorage-FsxLustreSettings-FileSystemId).

  Periksa `/var/log/chef-client.log` file untuk rincian kegagalan.

## `failureCode`adalah `RaidMountFailure`
<a name="create-cluster-raid-mount-failure-v3"></a>
+ **Mengapa gagal?**

  Volume RAID yang ditentukan dalam konfigurasi cluster gagal dipasang.
+ **Bagaimana cara mengatasinya?**

  Periksa `/var/log/chef-client.log` file untuk rincian kegagalan.

## `failureCode`adalah `AmiVersionMismatch`
<a name="create-cluster-ami-version-mismatch-v3"></a>
+ **Mengapa gagal?**

   AWS ParallelCluster Versi yang digunakan untuk membuat AMI kustom berbeda dari AWS ParallelCluster versi yang digunakan untuk mengkonfigurasi cluster. Di CloudFormation konsol, lihat detail CloudFormation tumpukan cluster dan periksa `Status Reason` `HeadNodeWaitCondition` untuk mendapatkan detail tambahan tentang AWS ParallelCluster versi dan AMI. Untuk informasi selengkapnya, lihat [Lihat CloudFormation acara di `CREATE_FAILED`](troubleshooting-v3-cluster-deployment.md#troubleshooting-v3-cluster-deployment-events).
+ **Bagaimana cara mengatasinya?**

  Pastikan AWS ParallelCluster versi yang digunakan untuk membuat AMI kustom adalah AWS ParallelCluster versi yang sama yang digunakan untuk mengkonfigurasi cluster. Anda dapat mengubah versi AMI kustom atau versi `pcluster` CLI untuk membuatnya sama.

## `failureCode`adalah `InvalidAmi`
<a name="create-cluster-invalid-ami-v3"></a>
+ **Mengapa gagal?**

  AMI kustom tidak valid karena tidak dibuat menggunakan. AWS ParallelCluster
+ **Bagaimana cara mengatasinya?**

  Gunakan `pcluster build-image` perintah untuk membuat AMI dengan menjadikan AMI Anda sebagai gambar induk. Untuk informasi selengkapnya, lihat [`pcluster build-image`](pcluster.build-image-v3.md).

## `failureCode`adalah `HeadNodeBootstrapFailure` dengan `failureReason` Gagal mengatur simpul kepala.
<a name="create-cluster-head-node-bootstrap-setup-failure-v3"></a>
+ **Mengapa gagal?**

  Penyebab langsung tidak dapat ditentukan dan penyelidikan tambahan diperlukan. Misalnya, bisa jadi cluster dalam status dilindungi, dan ini bisa disebabkan oleh kegagalan untuk menyediakan armada komputasi statis.
+ **Bagaimana cara mengatasinya?**

  Periksa `/var/log/chef-client.log.` file untuk rincian kegagalan.
**catatan**  
Jika Anda melihat `RuntimeError` pengecualian`Cluster state has been set to PROTECTED mode due to failures detected in static node provisioning`, klaster dalam status dilindungi. Untuk informasi selengkapnya, lihat [Cara men-debug mode yang dilindungi](slurm-protected-mode-v3.md#slurm-protected-mode-debug-v3).

## `failureCode``HeadNodeBootstrapFailure`dengan waktu pembuatan `failureReason` Cluster habis.
<a name="create-cluster-head-node-bootstrap-timeout-failure-v3"></a>
+ **Mengapa gagal?**

  Secara default, ada batas waktu 30 menit untuk menyelesaikan pembuatan cluster. Jika pembuatan klaster belum selesai dalam jangka waktu ini, pembuatan klaster gagal dengan kesalahan batas waktu. Pembuatan cluster dapat batas waktu karena berbagai alasan. Misalnya, kegagalan batas waktu dapat disebabkan oleh kegagalan pembuatan node kepala, masalah jaringan, skrip khusus yang terlalu lama untuk dijalankan di node kepala, kesalahan dalam skrip khusus yang berjalan di node komputasi, atau waktu tunggu yang lama untuk penyediaan node komputasi. Penyebab langsung tidak dapat ditentukan dan penyelidikan tambahan diperlukan.
+ **Bagaimana cara mengatasinya?**

  Periksa `/var/log/chef-client.log` file `/var/log/cfn-init.log` dan untuk rincian kegagalan. Untuk informasi lebih lanjut tentang AWS ParallelCluster log dan cara mendapatkannya, lihat [Log kunci untuk debugging](troubleshooting-v3-scaling-issues.md#troubleshooting-v3-key-logs) dan[Mengambil dan melestarikan log](troubleshooting-v3-get-logs.md).

  Anda mungkin menemukan yang berikut di log ini.
  + **Melihat di `Waiting for static fleet capacity provisioning` dekat akhir `chef-client.log`**

    Ini menunjukkan bahwa waktu pembuatan cluster habis saat menunggu node statis dinyalakan. Untuk informasi selengkapnya, lihat [Melihat kesalahan dalam inisialisasi node komputasi](troubleshooting-fc-v3-compute-node-initialization-v3.md).
  + **Melihat `OnNodeConfigured` atau skrip node `OnNodeStart` kepala belum selesai di akhir `cfn-init.log`**

    Ini menunjukkan bahwa skrip `OnNodeConfigured` atau `OnNodeStart` kustom membutuhkan waktu lama untuk dijalankan dan menyebabkan kesalahan batas waktu. Periksa skrip kustom Anda untuk masalah yang mungkin menyebabkannya berjalan untuk waktu yang lama. Jika skrip kustom Anda memerlukan waktu yang lama untuk dijalankan, pertimbangkan untuk mengubah batas batas waktu dengan menambahkan `DevSettings` bagian ke file konfigurasi cluster Anda, seperti yang ditunjukkan pada contoh berikut:

    ```
    DevSettings:
      Timeouts:
        HeadNodeBootstrapTimeout: 1800 # default setting: 1800 seconds
    ```
  + **Tidak dapat menemukan log, atau node kepala tidak berhasil dibuat**

    Ada kemungkinan bahwa node kepala tidak berhasil dibuat dan log tidak dapat ditemukan. Dalam hal ini, Anda bisa mendapatkan detail kegagalan tambahan dengan memeriksa peristiwa CloudFormation tumpukan dan log konsol node kepala. Anda dapat mengambil log konsol node kepala melalui konsol Amazon EC2 atau dengan menjalankan perintah Amazon EC2 CLI berikut:

    ```
    aws ec2 get-console-output --instance-id HEAD_NODE_INSTANCE_ID --output text
    ```

## `failureCode``HeadNodeBootstrapFailure`dengan `failureReason` Gagal mem-bootstrap simpul kepala.
<a name="create-cluster-head-node-bootstrap-failure-v3"></a>
+ **Mengapa gagal?**

  Penyebab langsung tidak dapat ditentukan dan penyelidikan tambahan diperlukan.
+ **Bagaimana cara mengatasinya?**

  Periksa `/var/log/chef-client.log` file `/var/log/cfn-init.log` dan.

## `failureCode`adalah `ResourceCreationFailure`
<a name="create-cluster-resource-creation-failure-v3"></a>
+ **Mengapa gagal?**

  Penciptaan beberapa sumber daya gagal selama proses pembuatan cluster. Kegagalan dapat terjadi karena berbagai alasan. Misalnya, kegagalan pembuatan sumber daya dapat disebabkan oleh masalah kapasitas atau kebijakan IAM yang salah konfigurasi.
+ **Bagaimana cara mengatasinya?**

  Di CloudFormation konsol, lihat tumpukan cluster untuk memeriksa detail kegagalan pembuatan sumber daya tambahan.

## `failureCode`adalah `ClusterCreationFailure`
<a name="cluster-creation-failure-v3"></a>
+ **Mengapa gagal?**

  Penyebab langsung tidak dapat ditentukan dan penyelidikan tambahan diperlukan.
+ **Bagaimana cara mengatasinya?**

  Di CloudFormation konsol, lihat tumpukan cluster dan periksa `Status Reason` `HeadNodeWaitCondition` untuk menemukan rincian kegagalan tambahan.

  Periksa `/var/log/chef-client.log` file `/var/log/cfn-init.log` dan.

## Melihat `WaitCondition timed out...` di CloudFormation tumpukan
<a name="create-cluster-wait-condition-timeout-v3"></a>

Untuk informasi selengkapnya, lihat [`failureCode``HeadNodeBootstrapFailure`dengan waktu pembuatan `failureReason` Cluster habis.](#create-cluster-head-node-bootstrap-timeout-failure-v3).

## Melihat `Resource creation cancelled` di CloudFormation tumpukan
<a name="create-cluster-resource-create-error-v3"></a>

Untuk informasi selengkapnya, lihat [`failureCode`adalah `ResourceCreationFailure`](#create-cluster-resource-creation-failure-v3).

## Melihat `Failed to run cfn-init...` atau kesalahan lain di CloudFormation tumpukan
<a name="create-cluster-cfn-init-fail-error-v3"></a>

Periksa `/var/log/cfn-init.log` dan `/var/log/chef-client.log` untuk rincian kegagalan tambahan.

## Melihat `chef-client.log` berakhir dengan `INFO: Waiting for static fleet capacity provisioning`
<a name="create-cluster-wait-on-fleet-capacity-v3"></a>

Ini terkait dengan batas waktu pembuatan cluster saat menunggu node statis dinyalakan. Untuk informasi selengkapnya, lihat [Melihat kesalahan dalam inisialisasi node komputasi](troubleshooting-fc-v3-compute-node-initialization-v3.md).

## Melihat `Failed to run preinstall or postinstall in cfn-init.log`
<a name="create-cluster-pre-post-install-v3"></a>

Anda memiliki `OnNodeStart` skrip `OnNodeConfigured` atau di `HeadNode` bagian konfigurasi cluster. Script tidak berfungsi dengan benar. Periksa `/var/log/cfn-init.log` file untuk detail kesalahan skrip kustom.

## Melihat `This AMI was created with xxx, but is trying to be used with xxx...` di CloudFormation tumpukan
<a name="create-cluster-ami-mismatch-error-v3"></a>

Untuk informasi selengkapnya, lihat [`failureCode`adalah `AmiVersionMismatch`](#create-cluster-ami-version-mismatch-v3).

## Melihat `This AMI was not baked by AWS ParallelCluster...` di CloudFormation tumpukan
<a name="create-cluster-ami-incomplete-error-v3"></a>

Untuk informasi selengkapnya, lihat [`failureCode`adalah `InvalidAmi`](#create-cluster-invalid-ami-v3).

## Melihat `pcluster create-cluster` perintah gagal dijalankan secara lokal
<a name="create-cluster-pcluster-cli-error-v3"></a>

Periksa `~/.parallelcluster/pcluster-cli.log` di sistem file lokal Anda untuk rincian kegagalan.

## Dukungan Tambahan
<a name="create-cluster-additional-support-v3"></a>

Ikuti panduan pemecahan masalah di. [Memecahkan masalah penerapan klaster](troubleshooting-v3-cluster-deployment.md)

Periksa untuk melihat apakah skenario Anda tercakup dalam [Masalah GitHub yang Diketahui](https://github.com/aws/aws-parallelcluster/wiki) di AWS ParallelCluster on GitHub.