

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Praktik terbaik untuk penyetelan kinerja AWS Glue untuk pekerjaan Apache Spark
<a name="introduction"></a>

*Roman Myers, Takashi Onikura, dan Noritaka Sekiyama, Amazon Web Services ()AWS*

*Desember 2023* ([riwayat dokumen](doc-history.md))

AWS Glue menyediakan opsi berbeda untuk kinerja tuning. Panduan ini mendefinisikan topik utama untuk penyetelan Apache AWS Glue Spark. Ini kemudian memberikan strategi dasar bagi Anda untuk mengikuti ketika menyetel ini AWS Glue untuk pekerjaan Apache Spark. Gunakan panduan ini untuk mempelajari cara mengidentifikasi masalah kinerja dengan menafsirkan metrik yang tersedia di. AWS Glue Kemudian gabungkan strategi untuk mengatasi masalah ini, memaksimalkan kinerja dan meminimalkan biaya.

Panduan ini mencakup praktik penyetelan berikut:
+ [Kapasitas klaster skala](scale-cluster-capacity.md)
+ [Gunakan AWS Glue versi terbaru](latest-version.md)
+ [Kurangi jumlah pemindaian data](reduce-data-scan.md)
+ [Paralelisasi tugas](parallelize-tasks.md)
+ [Minimalkan overhead perencanaan](minimize-planning-overhead.md)
+ [Optimalkan shuffle](optimize-shuffles.md)
+ [Optimalkan fungsi yang ditentukan pengguna](optimize-user-defined-functions.md)