

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# EMR Serverless에서 Apache Iceberg 사용
<a name="using-iceberg"></a>

이 섹션에서는 EMR Serverless 애플리케이션에서 Apache Iceberg를 사용하는 방법을 설명합니다. Apache Iceberg는 데이터 레이크에서 대규모 데이터세트를 사용하는 데 유용한 테이블 형식입니다.

**EMR Serverless 애플리케이션에서 Apache Iceberg를 사용하는 방법**

1. 해당 Spark 작업 실행에서 필요한 Spark 속성을 설정합니다.

   ```
   spark.jars=/usr/share/aws/iceberg/lib/iceberg-spark3-runtime.jar
   ```

1. Glue 데이터 카탈로그를 AWS 메타스토어로 지정하거나 외부 메타스토어를 구성합니다. 메타스토어 설정에 대한 자세한 내용은 [EMR Serverless에 대한 메타스토어 구성](metastore-config.md) 섹션을 참조하세요.

   Iceberg에 대해 사용할 메타스토어 속성을 구성합니다. 예를 들어 AWS Glue 데이터 카탈로그를 사용하려면 애플리케이션 구성에서 다음 속성을 설정합니다.

   ```
   spark.sql.catalog.dev.warehouse=s3://amzn-s3-demo-bucket/EXAMPLE-PREFIX/
   spark.sql.extensions=org.apache.iceberg.spark.extensions.IcebergSparkSessionExtensions
   spark.sql.catalog.dev=org.apache.iceberg.spark.SparkCatalog
   spark.sql.catalog.dev.catalog-impl=org.apache.iceberg.aws.glue.GlueCatalog
   spark.hadoop.hive.metastore.client.factory.class=com.amazonaws.glue.catalog.metastore.AWSGlueDataCatalogHiveClientFactory
   ```

   Glue 데이터 카탈로그를 AWS 메타스토어로 사용하는 경우 Iceberg 작업에 대해 다음 구성 속성을 지정합니다.

   ```
   --conf spark.jars=/usr/share/aws/iceberg/lib/iceberg-spark3-runtime.jar,
   --conf spark.sql.extensions=org.apache.iceberg.spark.extensions.IcebergSparkSessionExtensions,
   --conf spark.sql.catalog.dev=org.apache.iceberg.spark.SparkCatalog, 
   --conf spark.sql.catalog.dev.catalog-impl=org.apache.iceberg.aws.glue.GlueCatalog, 
   --conf spark.sql.catalog.dev.warehouse=s3://amzn-s3-demo-bucket/EXAMPLE-PREFIX/
   --conf spark.hadoop.hive.metastore.client.factory.class=com.amazonaws.glue.catalog.metastore.AWSGlueDataCatalogHiveClientFactory
   ```

Amazon EMR의 Apache Iceberg 릴리스 버전에 대한 자세한 내용은 [Iceberg 릴리스 기록](https://docs.aws.amazon.com/emr/latest/ReleaseGuide/Iceberg-release-history.html)을 참조하세요.