

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# Apache Spark 作业性能调整 AWS Glue 的最佳实践
<a name="introduction"></a>

*Roman Myers、Takashi Onikura 和 Noritaka Sekiyama，Amazon Web Services（AWS）*

*2023 年 12 月*（[文档历史记录](doc-history.md)）

AWS Glue 为调整性能提供了不同的选项。本指南定义了调整 Apache Spark AWS Glue 的关键主题。然后，它提供了一个基准策略，供您在调整 Apache Spark 作业时遵循这些 AWS Glue 策略。使用本指南学习如何通过解读 AWS Glue中提供的指标来识别性能问题。然后，结合相应策略来解决这些问题，最大限度地提升性能并降低成本。

本指南涵盖以下调优实践：
+ [扩展集群容量](scale-cluster-capacity.md)
+ [使用最新 AWS Glue 版本](latest-version.md)
+ [减少数据扫描量](reduce-data-scan.md)
+ [并行处理任务](parallelize-tasks.md)
+ [最大限度减少规划开销](minimize-planning-overhead.md)
+ [优化随机排序](optimize-shuffles.md)
+ [优化用户定义的函数](optimize-user-defined-functions.md)