

# Uso de formatos de tabla que no sean Hive en Athena para Spark
<a name="notebooks-spark-table-formats"></a>

**nota**  
Esta página hace referencia al uso de las bibliotecas de Python en la versión de lanzamiento del motor de Pyspark, versión 3. Consulte [Amazon EMR 7.12](https://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-7120-release.html) para conocer las versiones de formato de tabla abierta compatibles.

Cuando trabaja con sesiones y cuadernos en Athena para Spark, puede usar las tablas de Linux Foundation Delta Lake, Apache Hudi y Apache Iceberg, además de las tablas de Apache Hive.

## Consideraciones y limitaciones
<a name="notebooks-spark-table-formats-considerations-and-limitations"></a>

Cuando utilice formatos de tabla que no sean de Apache Hive con Athena para Spark, tenga en cuenta los siguientes puntos:
+ Además de Apache Hive, solo se admite un formato de tabla por cuaderno. Si desea usar varios formatos de tabla en Athena para Spark, cree un cuaderno independiente para cada formato de tabla. Para obtener información sobre la creación de cuadernos en Athena para Spark, consulte [Paso 7: crear su propio cuaderno](notebooks-spark-getting-started.md#notebooks-spark-getting-started-creating-your-own-notebook).
+ Los formatos de tabla de Delta Lake, Hudi e Iceberg se probaron en Athena para Spark utilizando AWS Glue como almacén de metadatos. Es posible que pueda usar otros almacenes de metadatos, pero actualmente no se admite ese uso.
+ Para usar los formatos de tabla adicionales, anule la propiedad `spark_catalog`predeterminada, tal y como se indica en la consola de Athena y en esta documentación. Estos catálogos que no son de Hive pueden leer tablas de Hive, además de sus propios formatos de tabla.

## Versiones de tablas
<a name="notebooks-spark-table-formats-versions"></a>

En la siguiente tabla, se muestran las versiones de tablas que no son de Hive y que se admiten en Amazon Athena para Apache Spark.


****  

| Formato de tabla | Versión compatible | 
| --- | --- | 
| Apache Iceberg | 1.2.1 | 
| Apache Hudi | 0.13 | 
| Linux Foundation Delta Lake | 2.0.2 | 

En Athena para Spark, estos archivos `.jar` con formato de tabla y sus dependencias se cargan en la ruta de clases de los controladores y ejecutores de Spark.

Para consultar una *AWSpublicación en el blog de Big Data* que indica cómo trabajar con los formatos de tabla Iceberg, Hudi y Delta Lake mediante Spark SQL en blocs de notas de Amazon Athena, consulte [Utilizar Amazon Athena con Spark SQL para los formatos de tabla transaccionales de código abierto](https://aws.amazon.com/blogs/big-data/use-amazon-athena-with-spark-sql-for-your-open-source-transactional-table-formats/).

**Topics**
+ [Consideraciones y limitaciones](#notebooks-spark-table-formats-considerations-and-limitations)
+ [Versiones de tablas](#notebooks-spark-table-formats-versions)
+ [Iceberg](notebooks-spark-table-formats-apache-iceberg.md)
+ [Hudi](notebooks-spark-table-formats-apache-hudi.md)
+ [Delta Lake](notebooks-spark-table-formats-linux-foundation-delta-lake.md)