Habilitar a integração das Tabelas do S3 com o catálogo de dados
É possível habilitar a integração das Tabelas do Amazon S3 com o Catálogo de Dados do AWS Glue usando o console de gerenciamento ou a AWS CLI do Amazon S3. Quando você habilita a integração usando o console, a AWS cria um catálogo federado chamado s3tablescatalog que descobre e monta automaticamente todos os buckets de tabela do S3 em sua conta e região da AWS.
Habilitar a integração das Tabelas do Amazon S3 com o console de gerenciamento do Amazon S3
-
Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/
. -
No painel de navegação à esquerda, escolha Buckets de tabela.
-
Escolha Criar bucket de tabela.
-
Insira um Nome do bucket de tabela e marque a caixa de seleção Habilitar integração.
-
Escolha Criar bucket de tabela.
O Amazon S3 integrará automaticamente os buckets de tabela nessa região. Na primeira vez que você integra buckets de tabela em qualquer região, o Amazon S3 cria s3tablescatalog no catálogo de dados na região.
Depois que o catálogo é criado, todos os buckets de tabela do S3 em sua conta e região são montados automaticamente como catálogos secundários. É possível visualizar os bancos de dados (namespaces) e as tabelas navegando até o catálogo no Catálogo de Dados.
Habilitar a integração das Tabelas do S3 com a AWS CLI
Use o comando glue create-catalog para criar o catálogo s3tablescatalog.
aws glue create-catalog \ --name "s3tablescatalog" \ --catalog-input '{ "Description": "Federated catalog for S3 Tables", "FederatedCatalog": { "Identifier": "arn:aws:s3tables:region:account-id:bucket/*", "ConnectionName": "aws:s3tables" }, "CreateDatabaseDefaultPermissions": [{ "Principal": { "DataLakePrincipalIdentifier": "IAM_ALLOWED_PRINCIPALS" }, "Permissions": ["ALL"] }], "CreateTableDefaultPermissions": [{ "Principal": { "DataLakePrincipalIdentifier": "IAM_ALLOWED_PRINCIPALS" }, "Permissions": ["ALL"] }] }'
Substitua region por sua região da AWS e account-id pelo ID da sua conta da AWS.
Verificar a integração
Depois de criar o catálogo, você pode verificar se os buckets de tabela do S3 estão montados listando os catálogos secundários:
aws glue get-catalogs \ --parent-catalog-id s3tablescatalog