

# Amazon SageMaker Lakehouse との DynamoDB ゼロ ETL 統合
<a name="amazon-sagemaker-lakehouse-for-DynamoDB"></a>

Amazon SageMaker Lakehouse との DynamoDB ゼロ ETL 統合により、DynamoDB のデータを Amazon SageMaker Lakehouse に自動的にレプリケートすることで、カスタムデータ移動パイプラインを構築する必要がなくなります。このノーコード統合により、お客様は DynamoDB のテーブル容量を消費することなく、Amazon SageMaker Lakehouse を使用して DynamoDB データ上で分析ワークロードを実行できます。統合により、テーブルからデータが自動的にエクスポートされ、通常は 15～30 分以内にターゲットを最新の状態に保ちます。

**Topics**
+ [Amazon SageMaker Lakehouse との DynamoDB ゼロ ETL 統合](amazon-sagemaker-lakehouse-for-DynamoDB-zero-etl.md)

# Amazon SageMaker Lakehouse との DynamoDB ゼロ ETL 統合
<a name="amazon-sagemaker-lakehouse-for-DynamoDB-zero-etl"></a>

DynamoDB テーブルと Amazon SageMaker Lakehouse の統合を設定するには、AWS Glue がソースからデータにアクセスしてターゲットに書き込むために使用する IAM ロールの設定や、中間地点またはターゲットの場所にあるデータを暗号化するための KMS キーの使用などの前提条件が必要です。

**Topics**
+ [DynamoDB の Amazon SageMaker Lakehouse とのゼロ ETL 統合を作成する前の前提条件](#amazon-sagemaker-lakehouse-for-DynamoDB-zero-etl-prereqs)
+ [DynamoDB の Amazon SageMaker Lakehouse とのゼロ ETL 統合の作成](amazon-sagemaker-lakehouse-for-DynamoDB-zero-etl-getting-started.md)
+ [統合に関する CloudWatch メトリクスの表示](#amazon-sagemaker-lakehouse-for-DynamoDB-zero-etl-cloudwatch-metrics)

## DynamoDB の Amazon SageMaker Lakehouse とのゼロ ETL 統合を作成する前の前提条件
<a name="amazon-sagemaker-lakehouse-for-DynamoDB-zero-etl-prereqs"></a>

DynamoDB ソースとのゼロ ETL 統合を設定するには、AWS Glue が DynamoDB テーブルのデータにアクセスしてエクスポートできるようにするリソースベースのアクセス (RBAC) ポリシーを設定する必要があります。ポリシーには、特定の AWS アカウントおよびリージョンへのアクセスを制限する条件付きで、`ExportTableToPointInTime`、`DescribeTable`、`DescribeExport` などの特定のアクセス許可を含める必要があります。詳細については、「[Amazon DynamoDB ソースの設定](https://docs.aws.amazon.com/glue/latest/dg/zero-etl-sources.html#zero-etl-config-source-dynamodb)」を参照してください。

テーブルに対してポイントインタイムリカバリ (PITR) を有効にする必要があり、AWS CLI コマンドを使用してポリシーを適用できます。ポリシーをさらに絞り込むには、完全な統合 ARN を指定して、より制限的なアクセス制御を行います。詳細については、「[ゼロ ETL 統合を設定するための前提条件](https://docs.aws.amazon.com/glue/latest/dg/zero-etl-prerequisites.html)」を参照してください。

# DynamoDB の Amazon SageMaker Lakehouse とのゼロ ETL 統合の作成
<a name="amazon-sagemaker-lakehouse-for-DynamoDB-zero-etl-getting-started"></a>

統合の前提条件を満たしたら、以下のガイダンスに従ってゼロ ETL 統合を作成、変更、または削除できます。

## 統合の作成
<a name="amazon-sagemaker-lakehouse-for-DynamoDB-zero-etl-getting-started-creating"></a>

**統合を作成するには**

1. AWS マネジメントコンソールにサインインし、[https://console.aws.amazon.com/dynamodbv2](https://console.aws.amazon.com/dynamodbv2) で Amazon DynamoDB コンソールを開きます。

1. ナビゲーションペインで、**[統合]** を選択します。

1. **[Amazon SageMaker Lakehouse とのゼロ ETL 統合を作成]** を選択し、**[次へ]** を選択します。

1. 統合を作成するには、「[統合の作成](https://docs.aws.amazon.com/glue/latest/dg/zero-etl-common-integration-tasks.html#zero-etl-creating)」を参照してください。

1. 統合を変更するには、「[統合の変更](https://docs.aws.amazon.com/glue/latest/dg/zero-etl-common-integration-tasks.html#zero-etl-modifying)」を参照してください。

1. 統合を削除するには、「[統合の削除](https://docs.aws.amazon.com/glue/latest/dg/zero-etl-common-integration-tasks.html#zero-etl-deleting)」を参照してください。

1. クロスアカウント統合を設定するには、「[クロスアカウント統合の設定](https://docs.aws.amazon.com/glue/latest/dg/zero-etl-prerequisites.html#zero-etl-setup-cross-account-integration)」を参照してください。

## ターゲット Amazon S3 Tables での圧縮の有効化
<a name="amazon-sagemaker-lakehouse-for-DynamoDB-zero-etl-enabling-compaction"></a>

圧縮を有効にすると、Amazon Athena のクエリパフォーマンスを向上させることができます。

まず、必要な IAM ロールの設定など、圧縮リソースの前提条件の設定を完了します。IAM ロールの詳細な設定手順については、Lake Formation のドキュメントを参照してください。「[圧縮のためのテーブルの最適化](https://docs.aws.amazon.com/lake-formation/latest/dg/data-compaction.html)」を参照してください。

統合中に作成された AWS Glue テーブルで圧縮を有効にするには、Lake Formation の圧縮有効化プロセスに従います。これにより、テーブルのパフォーマンスとクエリ効率を最適化できます。

## 統合に関する CloudWatch メトリクスの表示
<a name="amazon-sagemaker-lakehouse-for-DynamoDB-zero-etl-cloudwatch-metrics"></a>

統合が完了すると、AWS Glue ジョブごとにアカウントで生成された以下の CloudWatch メトリクスと EventBridge 通知が表示されます。詳細については、「[統合のモニタリング](https://docs.aws.amazon.com/glue/latest/dg/zero-etl-monitoring.html)」を参照してください。