Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
AWS runtime per Apache Spark (emr-spark-8.0.0) su EKS
Questa pagina descrive la funzionalità nuova e aggiornata di Amazon EMR specifica per l'implementazione di Amazon EMR su EKS. Per dettagli su Amazon EMR in esecuzione su Amazon EC2 e sulla versione Amazon EMR Spark 8.0.0 in generale, AWS consulta il runtime per Apache Spark (emr-spark-8.0.0) nella Amazon EMR Release Guide.
AWS runtime per Apache Spark (emr-spark-8.0.0) su EKS
Le seguenti versioni di emr-spark-8.0.0 sono disponibili per il runtime per Apache Spark su EKS. AWS
spark/emr-spark-8.0.0-latest
spark/emr-spark-8.0.0-20260421
notebook-spark/emr-spark-8.0.0-latest
notebook-spark/emr-spark-8.0.0-20260421
notebook-python/emr-spark-8.0.0-latest
notebook-python/emr-spark-8.0.0-20260421
livy/emr-spark-8.0.0-latest
livy/emr-spark-8.0.0-20260421
Note di rilascio
Note di rilascio per il AWS runtime di Apache Spark (emr-spark-8.0.0) su EKS:
-
Applicazioni supportate ‐ AWS SDK for Java 2.41.32, Apache Spark 4.0.2-amzn-0, Apache Hudi 1.1.0-amzn-0, Apache Iceberg 1.10.1-amzn-0, Delta Lake 4.0.0-amzn-1-spark
-
Componenti supportati ‐,,,,,.
emr-ddbemr-goodieshadoop-clienthudihudi-sparkicebergspark-kubernetes -
Classificazioni di configurazione supportate
Da utilizzare con StartJobRune CreateManagedEndpointAPI:
Classificazioni Descrizioni core-siteModifica i valori nel file Hadoop
core-site.xml.spark-metricsModifica i valori nel file Spark
metrics.properties.spark-defaultsModifica i valori nel file Spark
spark-defaults.conf.spark-envModifica i valori nell'ambiente Spark.
spark-hive-siteModifica i valori nel file Spark
hive-site.xml.spark-log4j2Modifica i valori nel file Spark
log4j2.properties.emr-job-submitterConfigurazione per il pod del mittente di processi.
Da utilizzare specificamente con le CreateManagedEndpointAPI:
Classificazioni Descrizioni jeg-configModifica i valori nel file
jupyter_enterprise_gateway_config.pyJupyter Enterprise Gateway.jupyter-kernel-overridesModifica il valore per l'immagine del kernel nel file Jupyter Kernel Spec.
Le classificazioni di configurazione consentono di personalizzare le applicazioni. Spesso corrispondono a un file XML di configurazione per l'applicazione, ad esempio
spark-hive-site.xml. Per ulteriori informazioni, consulta la sezione Configurazione delle applicazioni.
Modifiche e funzionalità
Le seguenti funzionalità sono incluse nella versione emr-spark-8.0.0 di AWS runtime per Apache Spark su EKS:
-
Apache Spark 4.0.2 GA — Prima versione pronta per la produzione di Spark 4.x su Amazon EMR su EKS, con modalità ANSI SQL, sintassi SQL PIPE, tipo di dati VARIANT, scripting SQL e miglioramenti dello streaming.
-
Python 3.11 predefinito — Python 3.11 è l'impostazione predefinita per i carichi di lavoro Spark. PySpark Sono disponibili anche Python 3.12 e 3.13.