Habilitar a integração das Tabelas do S3 com o catálogo de dados - AWS Glue

Habilitar a integração das Tabelas do S3 com o catálogo de dados

É possível habilitar a integração das Tabelas do Amazon S3 com o Catálogo de Dados do AWS Glue usando o console de gerenciamento ou a AWS CLI do Amazon S3. Quando você habilita a integração usando o console, a AWS cria um catálogo federado chamado s3tablescatalog que descobre e monta automaticamente todos os buckets de tabela do S3 em sua conta e região da AWS.

Habilitar a integração das Tabelas do Amazon S3 com o console de gerenciamento do Amazon S3

  1. Abra o console do Amazon S3, em https://console.aws.amazon.com/s3/.

  2. No painel de navegação à esquerda, escolha Buckets de tabela.

  3. Escolha Criar bucket de tabela.

  4. Insira um Nome do bucket de tabela e marque a caixa de seleção Habilitar integração.

  5. Escolha Criar bucket de tabela.

O Amazon S3 integrará automaticamente os buckets de tabela nessa região. Na primeira vez que você integra buckets de tabela em qualquer região, o Amazon S3 cria s3tablescatalog no catálogo de dados na região.

Depois que o catálogo é criado, todos os buckets de tabela do S3 em sua conta e região são montados automaticamente como catálogos secundários. É possível visualizar os bancos de dados (namespaces) e as tabelas navegando até o catálogo no Catálogo de Dados.

Habilitar a integração das Tabelas do S3 com a AWS CLI

Use o comando glue create-catalog para criar o catálogo s3tablescatalog.

aws glue create-catalog \ --name "s3tablescatalog" \ --catalog-input '{ "Description": "Federated catalog for S3 Tables", "FederatedCatalog": { "Identifier": "arn:aws:s3tables:region:account-id:bucket/*", "ConnectionName": "aws:s3tables" }, "CreateDatabaseDefaultPermissions": [{ "Principal": { "DataLakePrincipalIdentifier": "IAM_ALLOWED_PRINCIPALS" }, "Permissions": ["ALL"] }], "CreateTableDefaultPermissions": [{ "Principal": { "DataLakePrincipalIdentifier": "IAM_ALLOWED_PRINCIPALS" }, "Permissions": ["ALL"] }] }'

Substitua region por sua região da AWS e account-id pelo ID da sua conta da AWS.

Verificar a integração

Depois de criar o catálogo, você pode verificar se os buckets de tabela do S3 estão montados listando os catálogos secundários:

aws glue get-catalogs \ --parent-catalog-id s3tablescatalog