View a markdown version of this page

Acceso a los datos de tablas - Amazon Simple Storage Service

Acceso a los datos de tablas

Existen diversas formas de acceder a las tablas de buckets de tablas de Amazon S3. Puede integrar las tablas con los servicios de análisis de AWS mediante AWS Glue Data Catalog o acceder a las tablas directamente con el punto de conexión de Iceberg REST de tablas de Amazon S3 o el catálogo de tablas de Amazon S3 para Apache Iceberg. El método de acceso que utilice dependerá de la configuración del catálogo, del modelo de gobernanza y de las necesidades de control de accesos. A continuación se ofrece una descripción general de estos métodos de acceso.

AWS Glue Data Catalog Integración de

Este es el método de acceso recomendado para trabajar con tablas en buckets de tablas de S3. Esta integración proporciona una vista unificada del patrimonio de datos en varios servicios de análisis de AWS a través de AWS Glue Data Catalog. Tras la integración, puede consultar tablas con servicios como Athena y Amazon Redshift. El acceso a las tablas se administra mediante permisos de IAM. Para acceder a las tablas mediante esta integración, la identidad de IAM que utilice necesita acceso a los recursos y las acciones de tablas de S3, los objetos de AWS Glue Data Catalog y el motor de consultas que utilice. Para obtener más información, consulte Administración de acceso para Tablas de S3.

Acceso directo

Utilice este método si necesita trabajar con implementaciones de catálogos de AWS Partner Network (APN) o implementaciones de catálogos personalizados, o si simplemente necesita realizar operaciones básicas de lectura/escritura en tablas dentro de un único bucket de tablas. El acceso a las tablas se administra mediante permisos de IAM. Para acceder a las tablas, la identidad de IAM que utilice necesita acceso a los recursos de la tabla y a las acciones de las tablas de S3. Para obtener más información, consulte Administración de acceso para Tablas de S3.

Acceso a las tablas mediante la integración de AWS Glue Data Catalog

Puede integrar buckets de tablas de S3 con AWS Glue Data Catalog para acceder a las tablas de servicios de análisis de AWS, como Amazon Athena, Amazon Redshift y Quick. La integración rellena AWS Glue Data Catalog con los recursos de tabla y federa el acceso a esos recursos. Para obtener más información sobre la integración, consulte Integración de tablas de Amazon S3 con servicios de análisis de AWS.

Los siguientes servicios de análisis de AWS pueden acceder a las tablas a través de esta integración:

Acceso a las tablas mediante el punto de conexión Iceberg REST de AWS Glue

Una vez que los buckets de tablas de S3 estén integrados con AWS Glue Data Catalog, también podrá usar el punto de conexión AWS Glue Iceberg REST para conectarse a tablas de S3 desde motores de consulta de terceros que sean compatibles con Iceberg. Para obtener más información, consulte Acceso a las tablas de Amazon S3 mediante el punto de conexión Iceberg REST de AWS Glue.

Le recomendamos que utilice el punto de conexión Iceberg REST de AWS Glue cuando desee acceder a las tablas desde Spark, PyIceberg u otros clientes compatibles con Iceberg.

Los siguientes clientes pueden acceder a las tablas directamente a través del punto de conexión Iceberg REST de AWS Glue:

  • Cualquier cliente de Iceberg, incluidos Spark, PyIceberg y otros.

Acceso directo a las tablas

Puede acceder a las tablas directamente desde motores de consulta de código abierto mediante métodos que conectan las operaciones de administración de Tablas de S3 con sus aplicaciones de análisis de Apache Iceberg. Existen dos métodos de acceso directo: el punto de conexión Iceberg REST de Tablas de Amazon S3 o el catálogo de Tablas de Amazon S3 para Apache Iceberg. Se recomienda usar el punto de conexión REST.

Recomendamos el acceso directo si se accede a las tablas en implementaciones de catálogo autoadministrados, o si solo se necesita realizar operaciones básicas de lectura y escritura en las tablas de un único bucket de tablas. Para otros escenarios de acceso, recomendamos la integración de AWS Glue Data Catalog.

El acceso directo a las tablas se administra mediante políticas de IAM basadas en identidades o políticas basadas en recursos asociadas a tablas y buckets de tablas.

Acceso a las tablas a través del punto de conexión Iceberg REST de Tablas de Amazon S3

Puede utilizar el punto de conexión Iceberg REST de Tablas de Amazon S3 para acceder a sus tablas directamente desde cualquier cliente compatible con Iceberg REST a través de puntos de conexión HTTP. Para obtener más información, consulte Acceso a tablas mediante el punto de conexión Iceberg REST de Tablas de Amazon S3.

Los siguientes servicios de análisis de AWS y motores de consulta pueden acceder a las tablas directamente mediante el punto de conexión Iceberg REST de Tablas de Amazon S3:

Motores de consulta compatibles

Acceso directo a las tablas mediante el catálogo de Tablas de Amazon S3 para Apache Iceberg

También puede acceder a las tablas directamente desde motores de consulta como Apache Spark mediante el catálogo de clientes de Tablas de S3. Para obtener más información, consulte Acceso a tablas de Amazon S3 con el catálogo de Tablas de Amazon S3 para Apache Iceberg. No obstante, S3 recomienda utilizar el punto de conexión Iceberg REST de Tablas de Amazon S3 para el acceso directo, ya que admite más aplicaciones sin necesidad de código específico del lenguaje o del motor.

Los siguientes motores de consulta pueden acceder a las tablas directamente mediante el catálogo de clientes: