

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# AWS Glue Apache Spark 작업의 성능 튜닝 모범 사례
<a name="introduction"></a>

*Roman Myers, Takashi Onikura, Noritaka Sekiyama, Amazon Web Services(AWS)*

*2023년 12월*([문서 기록](doc-history.md))

AWS Glue 는 성능 튜닝을 위한 다양한 옵션을 제공합니다. 이 가이드에서는 Apache Spark의 튜닝 AWS Glue 에 대한 주요 주제를 정의합니다. 그런 다음 Apache Spark 작업에 AWS Glue 대해 이를 튜닝할 때 따라야 할 기준 전략을 제공합니다. 이 가이드를 사용하여 AWS Glue에서 사용할 수 있는 지표를 해석함으로써 성능 문제를 식별하는 방법을 알아봅니다. 그런 다음 이러한 문제를 해결하기 위한 전략을 통합하여 성능을 극대화하고 비용을 최소화합니다.

이 가이드에서는 다음과 같은 조정 사례를 다룹니다.
+ [클러스터 용량 규모 조정](scale-cluster-capacity.md)
+ [최신 AWS Glue 버전 사용](latest-version.md)
+ [데이터 스캔 양 감소](reduce-data-scan.md)
+ [태스크 병렬화](parallelize-tasks.md)
+ [계획 오버헤드 최소화](minimize-planning-overhead.md)
+ [셔플 최적화](optimize-shuffles.md)
+ [사용자 정의 함수 최적화](optimize-user-defined-functions.md)