

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Mejores prácticas para ajustar el rendimiento de AWS Glue los trabajos de Apache Spark
<a name="introduction"></a>

*Roman Myers, Takashi Onikura y Noritaka Sekiyama, Amazon Web Services (AWS)*

*Diciembre de 2023* ([historial de documentos](doc-history.md))

AWS Glue ofrece diferentes opciones para ajustar el rendimiento. Esta guía define los temas clave para el ajuste AWS Glue de Apache Spark. Luego, proporciona una estrategia básica que puede seguir al ajustarlos AWS Glue para los trabajos de Apache Spark. Utilice esta guía para aprender a identificar los problemas de rendimiento mediante la interpretación de las métricas disponibles en AWS Glue. Luego, incorpore estrategias para abordar estos problemas, maximizando el rendimiento y minimizando los costos.

En esta guía se cubren las siguientes prácticas de ajuste:
+ [Escalado de la capacidad del clúster](scale-cluster-capacity.md)
+ [Utilice la última AWS Glue versión](latest-version.md)
+ [Reducción de la cantidad de análisis de datos](reduce-data-scan.md)
+ [Paralelización de las tareas](parallelize-tasks.md)
+ [Minimización de la sobrecarga de planificación](minimize-planning-overhead.md)
+ [Optimización de las mezclas](optimize-shuffles.md)
+ [Optimización de las funciones definidas por el usuario](optimize-user-defined-functions.md)