

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Memecahkan masalah dalam cluster dengan integrasi AWS Batch
<a name="troubleshooting-v3-batch"></a>

Bagian ini memberikan kemungkinan tips pemecahan masalah untuk cluster dengan integrasi AWS Batch penjadwal, khususnya dengan masalah node kepala, masalah komputasi, kegagalan pekerjaan, dan kesalahan batas waktu.

**Topics**
+ [Masalah simpul kepala](#troubleshooting-v3-batch-head-node)
+ [Masalah komputasi](#troubleshooting-v3-batch-compute-nodes)
+ [Kegagalan Job](#troubleshooting-v3-batch-job-fail)
+ [Connect timeout pada kesalahan URL endpoint](#troubleshooting-v3-batch-connect-timeout)

## Masalah simpul kepala
<a name="troubleshooting-v3-batch-head-node"></a>

Anda dapat memecahkan masalah penyiapan node kepala dengan cara yang sama seperti Slurm cluster (kecuali untuk log Slurm tertentu). Untuk informasi lebih lanjut tentang masalah ini, lihat[Node kepala](troubleshooting-v3-scaling-issues.md#troubleshooting-v3-node-init.head-node).

## Masalah komputasi
<a name="troubleshooting-v3-batch-compute-nodes"></a>

AWS Batch mengelola aspek penskalaan dan komputasi layanan Anda. Jika Anda mengalami masalah terkait komputasi, lihat dokumentasi AWS Batch [pemecahan masalah](https://docs.aws.amazon.com/batch/latest/userguide/troubleshooting.html) untuk mendapatkan bantuan.

## Kegagalan Job
<a name="troubleshooting-v3-batch-job-fail"></a>

Jika pekerjaan gagal, Anda dapat menjalankan [`awsbout`](awsbatchcli.awsbout-v3.md) perintah untuk mengambil output pekerjaan. Anda juga dapat menjalankan [`awsbstat`](awsbatchcli.awsbstat-v3.md) perintah untuk mendapatkan tautan ke log pekerjaan yang disimpan oleh Amazon CloudWatch.

## Connect timeout pada kesalahan URL endpoint
<a name="troubleshooting-v3-batch-connect-timeout"></a>

Jika pekerjaan paralel multi-node gagal dengan kesalahan:: `Connect timeout on endpoint URL`
+ Di log `awsbout` keluaran, periksa apakah pekerjaannya paralel multi-node dari output: `Detected 3/3 compute nodes. Waiting for all compute nodes to start.`
+ Verifikasi apakah subnet node komputasi bersifat publik.

Pekerjaan paralel multi-node tidak mendukung penggunaan subnet publik saat menggunakan AWS Batch in. AWS ParallelCluster Gunakan subnet pribadi untuk node komputasi dan pekerjaan Anda. Untuk informasi selengkapnya, lihat [Menghitung pertimbangan lingkungan](https://docs.aws.amazon.com/batch/latest/userguide/multi-node-parallel-jobs.html#mnp-ce) di *AWS Batch Panduan Pengguna*. Untuk mengonfigurasi subnet pribadi untuk node komputasi Anda, lihat. [AWS ParallelCluster dengan AWS Batch penjadwal](network-configuration-v3-batch.md)