View a markdown version of this page

Data Catalog와 S3 Tables 통합 활성화 - AWS Glue

Data Catalog와 S3 Tables 통합 활성화

Amazon S3 관리 콘솔이나 AWS CLI를 사용하여 AWS Glue Data Catalog와 S3 Tables 통합을 활성화할 수 있습니다. 콘솔을 사용하여 통합을 활성화하면 AWS는 AWS 계정 및 리전의 모든 S3 테이블 버킷을 자동으로 검색하고 탑재하는 s3tablescatalog라는 페더레이션 카탈로그를 생성합니다.

Amazon S3 관리 콘솔을 사용하여 S3 Tables 통합 활성화

  1. https://console.aws.amazon.com/s3/에서 S3 콘솔을 엽니다.

  2. 왼쪽 탐색 창에서 테이블 버킷을 선택합니다.

  3. 테이블 버킷 생성을 선택합니다.

  4. 테이블 버킷 이름을 입력하고 통합 활성화 확인란이 선택되어 있는지 확인합니다.

  5. 테이블 버킷 생성을 선택합니다.

Amazon S3는 해당 리전에서 테이블 버킷을 자동으로 통합합니다. 어떤 리전에서든 테이블 버킷을 처음 통합할 때 Amazon S3는 해당 리전의 Data Catalog에 s3tablescatalog를 생성합니다.

카탈로그가 생성된 후 계정과 리전의 모든 S3 테이블 버킷이 하위 카탈로그로 자동 탑재됩니다. Data Catalog에서 카탈로그로 이동하여 데이터베이스(네임스페이스)와 테이블을 볼 수 있습니다.

AWS CLI를 사용하여 S3 Tables 통합 활성화

s3tablescatalog 명령을 사용하여 glue create-catalog 카탈로그를 생성합니다.

aws glue create-catalog \ --name "s3tablescatalog" \ --catalog-input '{ "Description": "Federated catalog for S3 Tables", "FederatedCatalog": { "Identifier": "arn:aws:s3tables:region:account-id:bucket/*", "ConnectionName": "aws:s3tables" }, "CreateDatabaseDefaultPermissions": [{ "Principal": { "DataLakePrincipalIdentifier": "IAM_ALLOWED_PRINCIPALS" }, "Permissions": ["ALL"] }], "CreateTableDefaultPermissions": [{ "Principal": { "DataLakePrincipalIdentifier": "IAM_ALLOWED_PRINCIPALS" }, "Permissions": ["ALL"] }] }'

region을 AWS 리전으로 바꾸고 account-id를 AWS 계정 ID로 바꿉니다.

통합 확인

카탈로그를 생성한 후 하위 카탈로그를 나열하여 S3 테이블 버킷이 탑재되었는지 확인할 수 있습니다.

aws glue get-catalogs \ --parent-catalog-id s3tablescatalog