

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 로 데이터 가져오기 AWS Glue Data Catalog
<a name="bring-your-data-overview"></a>

 AWS Glue Data Catalog (데이터 카탈로그)에서 페더레이션 카탈로그를 생성하고 Amazon S3 데이터 레이크와 Amazon Redshift 데이터 웨어하우스 간에 데이터를 통합할 수 있습니다. 또한 PostgreSQL Amazon DynamoDB, Google BigQuery, MySQL 등의 타사 데이터 소스와 같은 운영 데이터베이스의 데이터를 통합할 수 있습니다. 데이터 카탈로그는 서로 다른 시스템에서 데이터를 더 쉽게 관리하고 검색할 수 있도록 중앙 집중식 메타데이터 리포지토리를 제공합니다.

Data Catalog는 페더레이션 커넥터를 통해 30개 이상의 외부 데이터 소스와 통합됩니다. 이 통합을 사용하면 먼저 데이터를 수집하기 위해 데이터 파이프라인을 빌드하지 않고도 이러한 외부 소스에서 데이터를 쿼리할 수 있습니다 AWS .

외부 데이터를 카탈로그화한 후를 사용하여 데이터 카탈로그에서 데이터 액세스 권한을 AWS Lake Formation 중앙에서 관리할 수 있습니다. 데이터 레이크 관리자는 태그 기반 액세스 제어(LF 태그) 및 명명된 리소스 메서드를 사용하여 동일한 계정 또는 여러 계정 내의 다른 IAM 보안 주체(사용자 또는 역할)에게 세분화된 액세스 권한을 부여할 수 있습니다.

LF 태그를 사용하면 데이터 관리자는 도메인 및 민감도 수준과 같은 속성을 기반으로 리소스를 논리적으로 구성하여 권한 관리를 간소화하는 동시에 Athena, Amazon EMR AWS Glue 또는 Redshift Spectrum을 포함한 분석 및 기계 학습 서비스 전반에서 일관된 액세스 제어를 보장할 수 있습니다.

Data Catalog는 외부 데이터세트 및 외부 메타스토어의 데이터와 권한을 관리하기 위한 다음과 같은 방법을 제공합니다.
+ **Amazon S3 테이블 버킷을 데이터 카탈로그와 통합** - Amazon S3 테이블을 데이터 카탈로그 객체로 게시 및 카탈로그화하고 Lake Formation 콘솔에서 또는 AWS Glue API 작업을 사용하여 카탈로그를 Lake Formation 데이터 위치로 등록할 수 있습니다.
+ **Amazon Redshift 데이터 웨어하우스의 데이터를 로 가져오기 AWS Glue Data Catalog** - 기존 [Amazon Redshift](https://docs.aws.amazon.com/redshift/index.html) 네임스페이스 또는 클러스터를 데이터 카탈로그에 등록하고 데이터 카탈로그에서 다중 수준 페더레이션 카탈로그를 생성합니다.

  Amazon EMR Serverless 및 Amazon Athena와 같이 Apache Iceberg REST 카탈로그 OpenAPI 사양과 호환되는 모든 쿼리 엔진을 사용하여 데이터에 액세스할 수 있습니다.
+ **원격 Iceberg REST 카탈로그를 데이터 카탈로그에 페더**레이션 - AWS 분석 엔진을 사용하여 원격 Iceberg REST 카탈로그를 데이터 카탈로그에 페더레이션하고 Amazon S3에 저장된 원격 Iceberg 테이블에 안전하게 액세스합니다.
+ **외부 데이터 소스에서 데이터 카탈로그로 페더레이션** - AWS Glue 연결을 사용하여 데이터 카탈로그를 외부 데이터 소스에 연결하고 페더레이션 카탈로그를 생성하여 Lake Formation을 사용하여 데이터 세트에 대한 액세스 권한을 중앙에서 관리합니다. Data Catalog에 메타데이터를 마이그레이션할 필요가 없습니다.
+ **Data Catalog에서 Amazon Redshift 테이블을 관리하기 위한 카탈로그 생성** - 현재 Amazon Redshift 생산자 클러스터 또는 Amazon Redshift 데이터 공유를 사용할 수 없지만, Data Catalog를 사용하여 Amazon Redshift 테이블을 생성하고 관리하고 싶을 수 있습니다. `glue:CreateCatalog` API 작업 또는 AWS Lake Formation 콘솔을 통해 카탈로그 유형을 `Managed`로, `Catalog source`를 **Redshift**로 설정하여 AWS Glue 관리형 카탈로그를 생성하면서 시작할 수 있습니다.
+ **Data Catalog를 사용하여 Amazon Redshift 데이터 공유 게시** - Data Catalog에 [Amazon Redshift](https://docs.aws.amazon.com/redshift/index.html) 데이터 공유를 게시하고, Lake Formation을 사용하여 데이터 공유의 데이터 액세스를 중앙에서 관리하고 사용자 액세스를 제한합니다.

  Amazon Redshift Spectrum을 사용하여 데이터를 쿼리할 수 있습니다.
+  **Data Catalog를 외부 Hive 메타스토어에 연결** - Data Catalog를 외부 메타스토어에 연결하여 Lake Formation을 통해 Amazon S3의 데이터세트에 대한 액세스 권한을 관리합니다. Data Catalog에 메타데이터를 마이그레이션할 필요가 없습니다.
+ **Lake Formation을 AWS Data Exchange와 통합** - Lake Formation은를 통해 데이터에 대한 라이선스 액세스를 지원합니다 AWS Data Exchange. Lake Formation 데이터 라이선싱을 원하는 경우 *AWS Data Exchange 사용 설명서*의 [AWS Data Exchange란?](https://docs.aws.amazon.com/data-exchange/latest/userguide/what-is.html)을 참조하세요.

**Topics**
+ [원격 Iceberg 카탈로그에 대한 카탈로그 페더레이션](catalog-federation.md)
+ [Amazon Redshift 데이터를 로 가져오기 AWS Glue Data Catalog](managing-namespaces-datacatalog.md)
+ [에서 외부 데이터 소스로 페더레이션 AWS Glue Data Catalog](federated-catalog-data-connection.md)
+ [AWS Glue Data Catalog 및와 Amazon S3 Tables 통합 AWS Lake Formation](create-s3-tables-catalog.md)
+ [S3 Tables 통합에 대한 액세스 제어 변경](manage-s3tables-catalog-integration.md)
+ [에서 Amazon Redshift 관리형 카탈로그 생성 AWS Glue Data Catalog](create-rms-catalog.md)
+ [Amazon Redshift 데이터 공유에서 데이터에 대한 권한 관리](data-sharing-redshift.md)
+ [외부 메타스토어를 사용하는 데이터세트에 대한 권한 관리](data-sharing-hms.md)