

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# EMR Serverless での Apache Iceberg の使用
<a name="using-iceberg"></a>

このセクションでは、EMR Serverless アプリケーションで Apache Iceberg を使用する方法について説明します。Apache Iceberg は、データレイクで大規模なデータセットを扱うのに役立つテーブル形式です。

**EMR Serverless アプリケーションで Apache Iceberg を使用するには**

1. 対応する Spark ジョブ実行で必要な Spark プロパティを設定します。

   ```
   spark.jars=/usr/share/aws/iceberg/lib/iceberg-spark3-runtime.jar
   ```

1. Glue データカタログ AWS をメタストアとして指定するか、外部メタストアを設定します。メタストアの設定の詳細については、「[EMR Serverless のメタストア設定](metastore-config.md)」を参照してください。

   Iceberg に使用するメタストアプロパティを設定します。たとえば、 AWS Glue データカタログを使用する場合は、アプリケーション設定で次のプロパティを設定します。

   ```
   spark.sql.catalog.dev.warehouse=s3://amzn-s3-demo-bucket/EXAMPLE-PREFIX/
   spark.sql.extensions=org.apache.iceberg.spark.extensions.IcebergSparkSessionExtensions
   spark.sql.catalog.dev=org.apache.iceberg.spark.SparkCatalog
   spark.sql.catalog.dev.catalog-impl=org.apache.iceberg.aws.glue.GlueCatalog
   spark.hadoop.hive.metastore.client.factory.class=com.amazonaws.glue.catalog.metastore.AWSGlueDataCatalogHiveClientFactory
   ```

    AWS Glue データカタログをメタストアとして使用する場合は、Iceberg ジョブに次の設定プロパティを指定します。

   ```
   --conf spark.jars=/usr/share/aws/iceberg/lib/iceberg-spark3-runtime.jar,
   --conf spark.sql.extensions=org.apache.iceberg.spark.extensions.IcebergSparkSessionExtensions,
   --conf spark.sql.catalog.dev=org.apache.iceberg.spark.SparkCatalog, 
   --conf spark.sql.catalog.dev.catalog-impl=org.apache.iceberg.aws.glue.GlueCatalog, 
   --conf spark.sql.catalog.dev.warehouse=s3://amzn-s3-demo-bucket/EXAMPLE-PREFIX/
   --conf spark.hadoop.hive.metastore.client.factory.class=com.amazonaws.glue.catalog.metastore.AWSGlueDataCatalogHiveClientFactory
   ```

Amazon EMR の Apache Iceberg リリースの詳細については、「[Iceberg release history](https://docs.aws.amazon.com/emr/latest/ReleaseGuide/Iceberg-release-history.html)」を参照してください。