

# DynamoDB 与 Amazon SageMaker 智能湖仓的零 ETL 集成
<a name="amazon-sagemaker-lakehouse-for-DynamoDB"></a>

DynamoDB 与 Amazon SageMaker 智能湖仓的零 ETL 集成，可通过自动将 DynamoDB 数据复制到 Amazon SageMaker 智能湖仓，来消除构建自定义数据移动管道的需要。这种无代码集成有助于客户使用 Amazon SageMaker 智能湖仓对其 DynamoDB 数据运行分析工作负载，而无需消耗任何 DynamoDB 表容量。这一集成会自动从表中导出数据，并使目标保持最新状态，通常在 15 到 30 分钟内。

**Topics**
+ [DynamoDB 与 Amazon SageMaker 智能湖仓的零 ETL 集成](amazon-sagemaker-lakehouse-for-DynamoDB-zero-etl.md)

# DynamoDB 与 Amazon SageMaker 智能湖仓的零 ETL 集成
<a name="amazon-sagemaker-lakehouse-for-DynamoDB-zero-etl"></a>

设置 DynamoDB 表和 Amazon SageMaker 智能湖仓之间的集成需要一些先决条件，例如配置 AWS Glue 用于从源访问数据并写入目标的 IAM 角色，以及使用 KMS 密钥来加密中间位置或目标位置的数据。

**Topics**
+ [创建 DynamoDB 与 Amazon SageMaker 智能湖仓的零 ETL 集成之前的先决条件](#amazon-sagemaker-lakehouse-for-DynamoDB-zero-etl-prereqs)
+ [创建 DynamoDB 与 Amazon SageMaker 智能湖仓的零 ETL 集成](amazon-sagemaker-lakehouse-for-DynamoDB-zero-etl-getting-started.md)
+ [查看集成的 CloudWatch 指标](#amazon-sagemaker-lakehouse-for-DynamoDB-zero-etl-cloudwatch-metrics)

## 创建 DynamoDB 与 Amazon SageMaker 智能湖仓的零 ETL 集成之前的先决条件
<a name="amazon-sagemaker-lakehouse-for-DynamoDB-zero-etl-prereqs"></a>

要配置与 DynamoDB 源的零 ETL 集成，您需要设置支持 AWS Glue 访问和导出 DynamoDB 表中数据的基于资源的访问（RBAC）策略。该策略应包括特定的权限（例如 `ExportTableToPointInTime`、`DescribeTable` 和 `DescribeExport`）以及限制访问特定 AWS 账户和区域的条件。有关更多信息，请参阅[配置 Amazon DynamoDB 源](https://docs.aws.amazon.com/glue/latest/dg/zero-etl-sources.html#zero-etl-config-source-dynamodb)。

必须为表启用时间点故障恢复（PITR），并且您可以使用 AWS CLI 命令来应用策略。通过指定完全集成 ARN 以实现更严格的访问控制，可以进一步完善该策略。有关更多信息，请参阅[设置零 ETL 集成的先决条件](https://docs.aws.amazon.com/glue/latest/dg/zero-etl-prerequisites.html)。

# 创建 DynamoDB 与 Amazon SageMaker 智能湖仓的零 ETL 集成
<a name="amazon-sagemaker-lakehouse-for-DynamoDB-zero-etl-getting-started"></a>

完成集成先决条件后，可以按照以下指导来创建、修改或删除零 ETL 集成：

## 创建集成
<a name="amazon-sagemaker-lakehouse-for-DynamoDB-zero-etl-getting-started-creating"></a>

**要创建集成**

1. 登录 AWS 管理控制台，在 [https://console.aws.amazon.com/dynamodbv2](https://console.aws.amazon.com/dynamodbv2) 打开 Amazon DynamoDB 控制台。

1. 在导航窗格中，选择**集成**。

1. 选择**创建与 Amazon SageMaker 智能湖仓的零 ETL 集成**，然后选择**下一步**。

1. 要创建集成，请参阅[创建集成](https://docs.aws.amazon.com/glue/latest/dg/zero-etl-common-integration-tasks.html#zero-etl-creating)。

1. 要修改集成，请参阅[修改集成](https://docs.aws.amazon.com/glue/latest/dg/zero-etl-common-integration-tasks.html#zero-etl-modifying)。

1. 要删除集成，请参阅[删除集成](https://docs.aws.amazon.com/glue/latest/dg/zero-etl-common-integration-tasks.html#zero-etl-deleting)。

1. 要设置跨账户集成，请参阅[设置跨账户集成](https://docs.aws.amazon.com/glue/latest/dg/zero-etl-prerequisites.html#zero-etl-setup-cross-account-integration)。

## 对目标 Amazon S3 表启用压缩
<a name="amazon-sagemaker-lakehouse-for-DynamoDB-zero-etl-enabling-compaction"></a>

可以启用压缩功能来提高 Amazon Athena 中的查询性能。

首先，完成压缩资源的先决条件设置，包括配置必要的 IAM 角色。有关详细的 IAM 角色配置步骤，请参阅 Lake Formation 文档。请参阅[优化表以进行压缩](https://docs.aws.amazon.com/lake-formation/latest/dg/data-compaction.html)。

要对在集成期间创建的 AWS Glue 表启用压缩，请按照 Lake Formation 压缩启用流程进行操作。这将有助于优化表的性能和查询效率。

## 查看集成的 CloudWatch 指标
<a name="amazon-sagemaker-lakehouse-for-DynamoDB-zero-etl-cloudwatch-metrics"></a>

集成完成后，您就可以看到您的账户中为每个 AWS Glue 任务生成的这些 CloudWatch 指标和 EventBridge 通知：有关更多信息，请参阅[监控集成](https://docs.aws.amazon.com/glue/latest/dg/zero-etl-monitoring.html)。