Adicionar bancos de dados e tabelas ao catálogo das Tabelas do S3 - AWS Glue

Adicionar bancos de dados e tabelas ao catálogo das Tabelas do S3

Certifique-se de ter as permissões necessárias para listar e criar catálogos, bancos de dados e tabelas no catálogo de dados na sua região. Certifique-se de que a integração das Tabelas do S3 esteja habilitada em sua conta e região da AWS.

Adicionar um banco de dados ao catálogo de Tabelas do S3

Adicionar um banco de dados (Console)

  1. Abra o console do AWS Glue em https://console.aws.amazon.com/glue/home.

  2. No painel de navegação à esquerda, selecione Bancos de dados.

  3. Selecione Adicionar banco de dados.

  4. Escolha Glue Database no Catálogo federado de Tabelas do S3.

  5. Insira um nome exclusivo para o banco de dados.

  6. Selecione o catálogo de destino que mapeia em um bucket de tabelas nas Tabelas do S3.

  7. Escolha Create Database (Criar banco de dados).

Adicionar um banco de dados (AWS CLI)

aws glue create-database \ --region region \ --catalog-id "account-id:s3tablescatalog/my-catalog" \ --database-input '{"Name": "my-database"}'

Adicionar uma tabela ao catálogo de Tabelas do S3

Adicionar uma tag (console)

  1. Abra o console do AWS Glue em https://console.aws.amazon.com/glue/home.

  2. No painel de navegação à esquerda, selecione Tables (Tabelas).

  3. Selecione o catálogo de Tabelas do S3 no menu suspenso do catálogo.

  4. Escolha Adicionar tabela.

  5. Insira um nome exclusivo para a tabela.

  6. Confirme se o catálogo correto de Tabelas do S3 está selecionado na lista suspensa do catálogo.

  7. Selecione o banco de dados na lista suspensa do banco de dados.

  8. Insira o esquema da tabela inserindo um JSON ou adicionando cada coluna individualmente.

  9. Escolha Criar tabela.

Adicionar uma tabela (AWS CLI)

aws glue create-table \ --region region \ --catalog-id "account-id:s3tablescatalog/my-catalog" \ --database-name "my-database" \ --table-input '{ "Name": "my-table", "Parameters": { "classification": "", "format": "ICEBERG" }, "StorageDescriptor": { "Columns": [ {"Name": "id", "Type": "int", "Parameters": {}}, {"Name": "val", "Type": "string", "Parameters": {}} ] } }'