啟用 S3 Tables 與 Data Catalog 整合 - AWS Glue

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

啟用 S3 Tables 與 Data Catalog 整合

您可以使用 Amazon S3 管理主控台或 啟用與 AWS Glue Data Catalog 的 S3 Tables 整合 AWS CLI。 Amazon S3 當您使用主控台啟用整合時, 會 AWS 建立名為 的聯合目錄s3tablescatalog,自動探索和掛載 AWS 帳戶和區域中的所有 S3 資料表儲存貯體。

使用 Amazon S3 管理主控台啟用 S3 Tables 整合 Amazon S3

  1. 開啟位於 https://console.aws.amazon.com/s3/ 的 Amazon S3 主控台。

  2. 在左側導覽窗格中,選擇資料表儲存貯體

  3. 選擇 建立資料表儲存貯體

  4. 輸入資料表儲存貯體名稱,並確認已選取啟用整合核取方塊。

  5. 選擇 建立資料表儲存貯體

Amazon S3 會自動整合您在該區域中的資料表儲存貯體。您第一次在任何區域中整合資料表儲存貯體時,Amazon S3 s3tablescatalog會在該區域中的資料目錄中建立 。

建立目錄後,帳戶和區域中的所有 S3 資料表儲存貯體都會自動掛載為子目錄。您可以透過導覽至 Data Catalog 中的目錄來檢視資料庫 (命名空間) 和資料表。

使用 啟用 S3 Tables 整合 AWS CLI

使用 glue create-catalog命令來建立s3tablescatalog目錄。

aws glue create-catalog \ --name "s3tablescatalog" \ --catalog-input '{ "Description": "Federated catalog for S3 Tables", "FederatedCatalog": { "Identifier": "arn:aws:s3tables:region:account-id:bucket/*", "ConnectionName": "aws:s3tables" }, "CreateDatabaseDefaultPermissions": [{ "Principal": { "DataLakePrincipalIdentifier": "IAM_ALLOWED_PRINCIPALS" }, "Permissions": ["ALL"] }], "CreateTableDefaultPermissions": [{ "Principal": { "DataLakePrincipalIdentifier": "IAM_ALLOWED_PRINCIPALS" }, "Permissions": ["ALL"] }] }'

區域取代為 AWS 區域,將帳戶 ID 取代為 AWS 帳戶 ID。

驗證整合

建立目錄後,您可以透過列出子目錄來驗證 S3 資料表儲存貯體是否已掛載:

aws glue get-catalogs \ --parent-catalog-id s3tablescatalog