Habilitación de la integración de Tablas de S3 con el Catálogo de datos
Puede habilitar la integración de Tablas de Amazon S3 con el Catálogo de datos de AWS Glue mediante la consola de administración de Amazon S3 o AWS CLI. Cuando se habilita la integración mediante la consola, AWS crea un catálogo federado llamado s3tablescatalog que descubre automáticamente y monta todos los buckets de tablas de S3 en la cuenta y región de AWS.
Habilitación de la integración de Tablas de S3 mediante la consola de administración de Amazon S3
-
Abra la consola de Amazon S3 en https://console.aws.amazon.com/s3
. -
En el panel de navegación izquierdo, elija Buckets de tablas.
-
Elija Crear bucket de tablas.
-
Introduzca un Nombre de bucket de tablas y asegúrese de que se ha seleccionado la casilla de verificación Habilitar integración.
-
Elija Crear bucket de tablas.
Amazon S3 integra automáticamente los buckets de tablas en esa región. La primera vez que se integran buckets de tablas en cualquier región, Amazon S3 crea s3tablescatalog en el Catálogo de datos de esa región.
Después de que se crea el catálogo, todos los buckets de tablas de S3 en la cuenta y región se montan automáticamente como catálogos secundarios. Para ver las bases de datos (espacios de nombres) y las tablas, vaya al catálogo en el Catálogo de Datos.
Habilitación de Tablas de S3 mediante AWS CLI
Utilice el comando glue create-catalog para crear el catálogo s3tablescatalog.
aws glue create-catalog \ --name "s3tablescatalog" \ --catalog-input '{ "Description": "Federated catalog for S3 Tables", "FederatedCatalog": { "Identifier": "arn:aws:s3tables:region:account-id:bucket/*", "ConnectionName": "aws:s3tables" }, "CreateDatabaseDefaultPermissions": [{ "Principal": { "DataLakePrincipalIdentifier": "IAM_ALLOWED_PRINCIPALS" }, "Permissions": ["ALL"] }], "CreateTableDefaultPermissions": [{ "Principal": { "DataLakePrincipalIdentifier": "IAM_ALLOWED_PRINCIPALS" }, "Permissions": ["ALL"] }] }'
Sustituya region por la región de AWS y account-id por el ID de la cuenta de AWS.
Verificación de la integración
Después de crear el catálogo, para verificar que los buckets de tablas de S3 estén montados, enumere los catálogos secundarios:
aws glue get-catalogs \ --parent-catalog-id s3tablescatalog