

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# AWS Lake Formation 搭配 Amazon EMR 使用
<a name="emr-integ-lf"></a>

 Amazon EMR 是一種靈活的 AWS 受管叢集平台，您可以在支援的大數據架構上執行任何自訂程式碼，例如 Hadoop Map-Reduce、Spark、Hive、Presto 等。組織也會使用 Amazon EMR 跨高度分散式叢集執行批次和串流資料處理應用程式。在 Amazon EMR 上使用 Apache Spark，您可以在其許可由 Lake Formation 管理的資料庫和資料表上執行資料轉換和自訂程式碼。

部署 Amazon EMR 有三個選項：
+ EC2 上的 EMR
+  EMR Serverless 
+  Amazon EMR on EKS 

 如需詳細資訊，請參閱[將 Amazon EMR 與 Lake Formation 整合](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-lake-formation.html)或[將 EMR Serverless 與 搭配使用 AWS Lake Formation ，以取得精細存取控制](https://docs.aws.amazon.com/emr/latest/EMR-Serverless-UserGuide/emr-serverless-lf-enable.html) 

## 支援交易資料表格式
<a name="tables-emr"></a>

 當您使用 Spark SQL 讀取和寫入資料時，Amazon EMR 6.15.0 版和更新版本包括對 [Apache Hudi ](https://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-hudi.html)、[Apache Iceberg](https://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-iceberg.html) 和 [Delta Lake](https://github.com/aws-samples/amazon-emr-with-delta-lake) 資料表格式的 Lake Formation 資料表、資料列、資料欄和儲存格層級存取控制許可的支援。

如需限制，請參閱[使用 Lake Formation 的 Amazon EMR 考量](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-lf-limitations.html)事項。


**支援的資料表格式**  

| 資料表格式 | 描述和允許的操作 | Amazon EMR 中支援的 Lake Formation 許可 | 
| --- | --- | --- | 
| Apache Hudi | 用於簡化增量資料處理和資料管道開發的開放資料表格式。<br />如需支援的操作清單，請參閱 [Apache Hudi 和 Lake Formation](https://docs.aws.amazon.com/emr/latest/ManagementGuide/hudi-with-lake-formation.html)。 | Amazon EMR 使用 Apache Hudi 來支援資料表、資料列、資料欄和儲存格層級存取控制。 | 
| Apache Iceberg | 以資料表形式管理大型檔案集合的開放資料表格式。<br />如需支援的操作清單，請參閱 [Apache Iceberg 和 Lake Formation](https://docs.aws.amazon.com/emr/latest/ManagementGuide/iceberg-with-lake-formation.html)。 | Amazon EMR 使用 Apache Iceberg 來支援資料表、資料列、資料欄和儲存格層級存取控制。 | 
| Linux Foundation Delta Lake | Delta Lake 是一項開放原始碼專案，可協助實作常見於 Amazon S3 或 Hadoop 分散式檔案系統 (HDFS) 的現代資料湖架構。<br />如需支援的操作清單，請參閱 [Delta Lake 和 Lake Formation](https://docs.aws.amazon.com/emr/latest/ManagementGuide/delta-with-lake-formation.html)。 | Amazon EMR 支援使用 Delta Lake 資料表進行資料表、資料列、資料欄和儲存格層級存取控制。 | 

## 其他資源
<a name="add-resources-EMR"></a>

**使用者指南、部落格文章和研討會**
+ [ 使用執行期角色與 Amazon EMR 整合](https://catalog.us-east-1.prod.workshops.aws/workshops/78572df7-d2ee-4f78-b698-7cafdb55135d/en-US/emr-runtimerole-integration)
+  [使用 Amazon EMR on EKS 快速開始使用 Apache Hudi、Apache Iceberg 和 Delta Lake](https://aws.amazon.com/blogs/big-data/get-a-quick-start-with-apache-hudi-apache-iceberg-and-delta-lake-with-amazon-emr-on-eks/)
+  [搭配 EMR Serverless 使用 Delta Lake OSS](https://docs.aws.amazon.com/emr/latest/EMR-Serverless-UserGuide/using-delta-lake.html) 