

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 使用其他 AWS 服務
<a name="working-with-services"></a>

 AWS 諸如 Amazon Athena AWS Glue、Amazon Redshift Spectrum 和 Amazon EMR 等 服務，可用來 AWS Lake Formation 安全地存取向 Lake Formation 註冊的 Amazon S3 位置中的資料。使用 Lake Formation，您可以在 中定義和管理資料表的精細存取控制 (FGAC) 許可 AWS Glue Data Catalog。 AWS 這些服務都是 Lake Formation 的可信任發起人，Lake Formation 可透過臨時登入資料存取存放在 Amazon S3 中的資料。如需詳細資訊，請參閱[Lake Formation 應用程式整合的運作方式](how-vending-works.md)。

為了使用這些功能，Lake Formation 會要求您先註冊 Amazon S3 位置，並將適當的許可指派給 IAM 主體，以存取資料表、資料庫和 Amazon S3 位置。如需詳細資訊，請參閱 [管理 Lake Formation 許可](managing-permissions.md)。

下表列出 Amazon Athena AWS Glue、Amazon EMR 和 Amazon Redshift Spectrum 支援的 Lake Formation 許可類型，以存取 AWS Glue 標準資料表和交易資料表 ([Apache Iceberg](https://iceberg.apache.org/)、[Apache Hudi](https://hudi.incubator.apache.org/) 和 [Linux 基礎 Delta Lake](https://delta.io/)) 中的資料Amazon S3以及 Data Catalog 中的資料表中繼資料。


**AWS AWS Glue 標準資料表和檢視的 服務和支援的許可類型**  

| AWS 服務 | 資料表層級許可 | 資料欄層級許可 | 資料列和儲存格層級許可 | 
| --- | --- | --- | --- | 
| [Athena SQL](https://docs.aws.amazon.com/lake-formation/latest/dg/athena-lf.html) |  讀取/寫入存取  | 讀取存取 | 讀取存取 | 
| Athena Spark |  不支援  | 不支援 |  不支援  | 
|  佈建叢集上的 [Redshift Spectrum](https://docs.aws.amazon.com/lake-formation/latest/dg/RSPC-lf.html) 或 Amazon Redshift 無伺服器  | 讀取/寫入存取 | 讀取存取 | 讀取存取 | 
|  [Amazon EMR (EC2) 上的 Apache Spark](https://docs.aws.amazon.com/lake-formation/latest/dg/emr-integ-lf.html)  | 讀取/寫入存取 | 讀取存取 | 讀取存取 | 
| [Amazon EMR (EC2) 上的 Apache Hive](https://docs.aws.amazon.com/lake-formation/latest/dg/emr-integ-lf.html) | 讀取/寫入存取 | 讀取存取 | 不支援 | 
| [EMR Serverless 上的 Apache Spark](https://docs.aws.amazon.com/lake-formation/latest/dg/emr-integ-lf.html) | 讀取/寫入存取 | 讀取存取 | 讀取存取 | 
| EMR Serverless 上的 Apache Hive | 不支援 | 不支援 | 不支援 | 
| Amazon EMR on EKS | 不支援 | 不支援 | 不支援 | 
| [AWS Glue ETL](https://docs.aws.amazon.com/lake-formation/latest/dg/glue-features-lf.html) | 讀取/寫入存取 | AWS Glue 5.0 或更新版本支援讀取存取。 | AWS Glue 5.0 或更新版本支援讀取存取。 | 

**考量和限制**
+ Athena Spark 不支援查詢具有 Lake Formation 許可的資料目錄資料表。
+ Athena SAML 型使用者可以透過啟用 SAML 2.0 型聯合來讀取使用 Lake Formation 許可保護的資料來源。SAML 使用者可以將資料插入 Parquet 資料表。
+ EMR Serverless 上的 Apache Spark 不支援查詢 Data Catalog 檢視。
+ EMR Serverless 上的 Apache Hive 不支援查詢具有 Lake Formation 許可的資料表。
+ AWS Glue 5.0 或更高版本支援對資料目錄中由 S3 支援的 Iceberg 和 Hive 資料表進行精細存取控制。此功能可讓您設定 Apache Spark 任務中讀取查詢 AWS Glue 的資料表、資料列、資料欄和儲存格層級存取控制。

  如需詳細資訊，請參閱 [AWS Glue 版本](https://docs.aws.amazon.com/glue/latest/dg/release-notes.html)。


**AWS 交易資料表格式的 服務和支援的許可類型**  

| AWS 服務 | Iceberg | Hudi | Delta Lake （原生） | Delta Lake （符號連結資料表） | 
| --- | --- | --- | --- | --- | 
|  [Athena SQL](https://docs.aws.amazon.com/lake-formation/latest/dg/athena-lf.html)  |  支援讀取具有資料表、資料欄、資料列和儲存格層級許可的資料表。寫入操作需要完整存取資料表。  |  支援對具有資料表、資料欄、資料列和儲存格層級許可的資料表進行讀取和建立操作。不支援寫入操作。  |  Athena （引擎版本 3) 支援讀取具有資料表、資料欄、資料列和儲存格層級許可的原生 Delta Lake 資料表。不支援寫入操作。  |  Athena （引擎版本 3) 支援讀取具有資料表、資料欄、資料列和儲存格層級許可的符號連結 Delta Lake 資料表。不支援寫入操作。  | 
|  佈建叢集上的 [Redshift Spectrum](https://docs.aws.amazon.com/lake-formation/latest/dg/RSPC-lf.html)   |  支援讀取具有資料表、資料欄、資料列和儲存格層級許可的資料表。不支援寫入操作。  |  支援讀取具有資料表、資料欄、資料列和儲存格層級許可的資料表。不支援寫入操作。  | 不支援 | 支援透過具有資料表、資料欄、資料列和儲存格層級許可的符號連結資訊清單讀取 Delta Lake 資料表。不支援寫入操作。 | 
| [Amazon EMR (EC2) 上的 Apache Spark](https://docs.aws.amazon.com/lake-formation/latest/dg/emr-integ-lf.html) | 支援讀取具有資料表、資料欄、資料列和儲存格層級許可的資料表。寫入操作需要完整存取資料表。 | 支援讀取具有資料表、資料欄、資料列和儲存格層級許可的資料表。寫入操作需要完整存取資料表。 |  支援讀取具有資料表、資料欄、資料列和儲存格層級許可的資料表。不支援寫入操作。  | 支援讀取具有資料表、資料欄、資料列和儲存格層級許可的資料表。寫入操作需要完整存取資料表。 | 
| [AWS Glue ETL](https://docs.aws.amazon.com/lake-formation/latest/dg/glue-features-lf.html) | AWS Glue 5.0 或更新版本支援讀取具有資料表、資料欄、資料列和儲存格層級許可的資料表。 | 支援對具有資料表層級許可的資料表進行讀取/寫入。 | 支援對具有資料表層級許可的資料表進行讀取/寫入。 | 支援對具有資料表層級許可的資料表進行讀取/寫入。 | 

**Topics**
+ [AWS Lake Formation 搭配 Amazon Athena 使用](athena-lf.md)
+ [AWS Lake Formation 搭配 Amazon Redshift Spectrum 使用](RSPC-lf.md)
+ [AWS Lake Formation 搭配 使用 AWS Glue](glue-features-lf.md)
+ [AWS Lake Formation 搭配 Amazon EMR 使用](emr-integ-lf.md)
+ [AWS Lake Formation 搭配 Quick 使用](qs-integ-lf.md)
+ [AWS Lake Formation 搭配 AWS CloudTrail Lake 使用](cloudtrail-lake-integ-lf.md)

# AWS Lake Formation 搭配 Amazon Athena 使用
<a name="athena-lf"></a>

 [Amazon Athena](https://docs.aws.amazon.com/athena/index.html) 是一種無伺服器查詢服務，可協助您分析存放在 Amazon S3 中的結構化、半結構化和非結構化資料。您可以使用 Athena SQL 從 CSV、JSON、Parquet 和 Avro 資料格式查詢資料。Athena SQL 也支援 [Apache Hive](https://hive.apache.org/)、[Apache Hudi](https://hudi.apache.org/) 和 [Apache Iceberg](https://iceberg.apache.org/) 等資料表格式。Athena 與 整合 AWS Glue Data Catalog ，將資料集的中繼資料存放在 Amazon S3 中。Athena 可以使用 Lake Formation 來定義和維護這些資料集的存取控制政策。

 以下是您可以搭配 Athena 使用 Lake Formation 的一些常見使用案例。
+ 使用 Lake Formation 許可從 Athena 存取 Data Catalog 資源 （資料庫和資料表）。您可以使用具名資源方法或 LF 標籤來定義資料庫和資料表的許可。如需詳細資訊，請參閱：
  + [使用具名資源方法授與資料庫許可](granting-database-permissions.md)
  + [Lake Formation 標籤型存取控制](tag-based-access-control.md)
**注意**  
Lake Formation 許可僅適用於使用 Athena SQL 查詢來自 Amazon S3 的來源資料和 Data Catalog 中的中繼資料。  
Athena Spark 不支援查詢具有 Lake Formation 許可的資料目錄資料表。Lake Formation 許可支援資料庫和資料表的讀取和寫入操作。
**注意**  
當您使用 LF 標籤來管理 Data Catalog 資源的許可時，無法套用資料篩選條件。
+ 透過授予資料欄、資料列和儲存格層級的許可，使用 [Lake Formation 中的資料篩選條件](data-filtering.md#data-filters-about)來保護 Amazon S3 資料湖中的資料表，以控制查詢結果。請參閱《Amazon Athena 使用者指南》中的[分割區投影限制](https://docs.aws.amazon.com/athena/latest/ug/lf-athena-limitations.html#lf-athena-limitations-data-filters)。
+ 執行聯合查詢時，對 SAML 型 Athena 使用者可用的資料強制執行精細存取控制。

  Athena JDBC 和 ODBC 驅動程式支援使用 SAML 型身分提供者 (IdP) 設定對資料來源的聯合存取。使用快速整合 Lake Formation 與您現有的 IAM 角色或 SAML 使用者或群組，將 Athena 查詢結果視覺化。
**注意**  
只有當您使用 JDBC 或 ODBC 驅動程式向 Athena 提交查詢時，SAML 使用者和群組的 Lake Formation 許可才會套用。

  如需詳細資訊，請參閱[使用 Lake Formation 和 Athena JDBC 和 ODBC 驅動程式來聯合存取 Athena](https://docs.aws.amazon.com/athena/latest/ug/security-athena-lake-formation-jdbc.html)。
**注意**  
目前，下列區域不支援授權存取 Lake Formation 中的 SAML 身分：  
中東 (巴林) – me-south-1
亞太區域 (香港) – ap-east-1
非洲 (開普敦) – af-south-1
中國 (寧夏) – cn-northwest-1
亞太區域 (大阪) - ap-northeast-3
+ 使用 [Lake Formation 中的跨帳戶資料共用](cross-account-permissions.md) 查詢另一個帳戶中的資料表。

**注意**  
如需使用 Lake Formation 許可至 時限制的詳細資訊`Views`，請參閱[考量和限制](https://docs.aws.amazon.com/athena/latest/ug/security-athena-lake-formation.html)。

## 支援交易資料表格式
<a name="tables-ate"></a>

套用 Lake Formation 許可可讓您保護 Amazon S3 型資料湖中的交易資料。下表列出 Athena 和 Lake Formation 許可中支援的交易資料表格式。Lake Formation 會在 Athena 使用者執行其查詢時強制執行這些許可。


| 資料表格式 | 描述和允許的操作 | Athena 中支援的 Lake Formation 許可 | 
| --- | --- | --- | 
|  Apache Hudi  |  用於簡化增量資料處理和資料管道開發的格式。 Athena 支援在 Amazon S3 資料集上使用 Apache Hudi 資料表格式建立和讀取操作，適用於**寫入時複製 (CoW)** 和**讀取時合併 (MoR)** Hudi 資料表類型。Athena 不支援 Hudi 資料表上的寫入操作。 使用 [Athena 查詢 Hudi 資料集](https://docs.aws.amazon.com/athena/latest/ug/querying-hudi.html)。  | 使用 [Lake Formation 中的資料篩選和儲存格層級安全性](data-filtering.md) 使用資料表、資料欄、資料列和儲存格層級許可來保護 Hudi 資料表。 | 
|  Apache Iceberg  | 一種開放的資料表格式，可管理大型檔案集合做為資料表，並支援現代分析資料湖操作，例如記錄層級插入、更新、刪除和時間歷程查詢。 如需 Athena 支援 Iceberg 資料表的詳細資訊，請參閱[使用 Iceberg 資料表](https://docs.aws.amazon.com/athena/latest/ug/querying-iceberg.html)。  |  支援資料表、資料欄、資料列和儲存格層級許可。目前，Lake Formation 不支援管理 Open Table Formats 中 `VACUUM`、 `MERGE``UPDATE`和 等寫入操作`OPTIMIZE`的許可。  | 
|  Linux Foundation Delta Lake  | Delta Lake 是一項開放原始碼專案，可協助實作常見於 Amazon S3 或 Hadoop 分散式檔案系統 (HDFS) 的現代資料湖架構。 Athena 支援 AWS Glue Data Catalog 從 Delta Lake 資料表使用以符號連結為基礎的資訊清單資料表定義在 上建立的 Delta lake 資料表。 如需詳細資訊，請參閱[使用爬蟲程式爬 AWS Glue 取 Delta Lake 資料表](https://aws.amazon.com/blogs/big-data/crawl-delta-lake-tables-using-aws-glue-crawlers/)。  Athena （引擎版本 3) 支援讀取原生 Delta Lake 資料表。  如需詳細資訊，請參閱[使用 AWS Glue 爬蟲程式介紹原生 Delta Lake 資料表支援](https://aws.amazon.com/blogs/big-data/introducing-native-delta-lake-table-support-with-aws-glue-crawlers/)。  | symlink 資料表和原生 Delta Lake 資料表支援資料表、資料欄、資料列和儲存格層級許可。 | 

## 其他資源
<a name="add-resources-ate"></a>

**部落格文章、影片和研討會**
+ [ 使用 Amazon Athena 查詢 Amazon S3 資料湖中的 Apache Hudi 資料集 Amazon Athena](https://aws.amazon.com/blogs/big-data/part-1-query-an-apache-hudi-dataset-in-an-amazon-s3-data-lake-with-amazon-athena-part-1-read-optimized-queries/)
+  [使用 Amazon Athena、Amazon EMR 和 建置 Apache Iceberg 資料湖 AWS Glue](https://aws.amazon.com/blogs/big-data/build-an-apache-iceberg-data-lake-using-amazon-athena-amazon-emr-and-aws-glue/) 
+ [使用 Athena 和 Apache Iceberg 在 Amazon S3 上插入、更新、刪除 ](https://www.youtube.com/watch?v=u1v666EXCJw)
+ 查詢資料湖的 [LF-Tag 型存取控制](https://catalog.us-east-1.prod.workshops.aws/workshops/78572df7-d2ee-4f78-b698-7cafdb55135d/en-US/lakeformation-basics/querying-datalake/tag-based-access-control) Lake Formation 研討會。

# AWS Lake Formation 搭配 Amazon Redshift Spectrum 使用
<a name="RSPC-lf"></a>

[Amazon Redshift Spectrum](https://docs.aws.amazon.com/redshift/latest/dg/c-using-spectrum.html) 可讓您查詢和擷取 Amazon S3 資料湖中的資料，而無需將資料載入 Amazon Redshift 叢集節點。

Redshift Spectrum 支援兩種方式來註冊已啟用 Lake Formation 的外部 AWS Glue 資料目錄。
+ 使用具有 Data Catalog 許可的叢集連接 IAM 角色

  若要建立 IAM 角色，請遵循下列程序中概述的步驟。

   [控制對 的存取 AWS Glue Data Catalog](https://docs.aws.amazon.com/redshift/latest/dg/c-spectrum-iam-policies.html#c-spectrum-glue-acess)
+  使用設定為管理外部 AWS Glue Data Catalog 資源存取的聯合 IAM 身分

  Redshift Spectrum 支援使用聯合 IAM 身分查詢 Lake Formation 資料表。IAM 身分可以是 IAM 使用者或 IAM 角色。如需 Redshift Spectrum 中 IAM 聯合身分的詳細資訊，請參閱[使用聯合身分管理對本機資源和 Redshift Spectrum 外部資料表的 Amazon Redshift 存取](https://docs.aws.amazon.com/redshift/latest/mgmt/authorization-fas-spectrum.html)。

 透過 Lake Formation 與 Redshift Spectrum 整合，您可以在向 Lake Formation 註冊資料後定義資料表上的資料列、資料欄和儲存格層級存取控制許可。

如需詳細資訊，請參閱[搭配 使用 Redshift Spectrum AWS Lake Formation](https://docs.aws.amazon.com/redshift/latest/dg/spectrum-lake-formation.html)。

Redshift Spectrum 支援 Lake Formation 受管外部結構描述資料表上的讀取或`SELECT`查詢。

如需詳細資訊，請參閱[建立 Redshift Spectrum 的外部結構描述](https://docs.aws.amazon.com/redshift/latest/dg/c-spectrum-external-schemas.html)。

## 支援交易資料表類型
<a name="tables-RSPC"></a>

此資料表列出 Redshift Spectrum 中支援的交易資料表格式和適用的 Lake Formation 許可。


**支援的資料表格式**  

| 資料表格式 | 描述和允許的操作 | Redshift Spectrum 中支援的 Lake Formation 許可 | 
| --- | --- | --- | 
|  Apache Hudi  |  用於簡化增量資料處理和資料管道開發的格式。 Redshift Spectrum 支援在 Amazon S3 上使用 Apache Hudi 寫入[https://hudi.apache.org/docs/next/table_types#copy-on-write-table](https://hudi.apache.org/docs/next/table_types#copy-on-write-table)操作。 如需詳細資訊，請參閱[為 Apache Hudi 中管理的資料建立外部資料表](https://docs.aws.amazon.com/redshift/latest/dg/c-spectrum-external-tables.html#c-spectrum-column-mapping-hudi)。  | 使用 [Lake Formation 中的資料篩選和儲存格層級安全性](data-filtering.md) 保護使用資料表、資料欄、資料列和儲存格層級許可的 Hudi 資料表。 | 
|  Apache Iceberg  |  一種開放的資料表格式，可管理大型檔案集合做為資料表，並支援現代分析資料湖操作，例如記錄層級插入、更新、刪除和時間歷程查詢。 如需詳細資訊，請參閱[搭配 Amazon Redshift 使用 Apache Iceberg 資料表](https://docs.aws.amazon.com/redshift/latest/dg/querying-iceberg.html)。  |  Redshift Spectrum 支援 Apache Iceberg 資料表進行查詢。  | 
| Linux Foundation Delta Lake | Delta Lake 是一項開放原始碼專案，可協助實作常見於 Amazon S3 或 Hadoop 分散式檔案系統 (HDFS) 的現代資料湖架構。Redshift Spectrum 支援查詢 Delta Lake 資料表。如需詳細資訊，請參閱[為 Delta Lake 中管理的資料建立外部資料表](https://docs.aws.amazon.com/redshift/latest/dg/c-spectrum-external-tables.html#c-spectrum-column-mapping-delta)。 | 支援資料表、資料欄、資料列和儲存格層級許可。 | 

## 其他資源
<a name="add-resources-spc"></a>

**部落格文章和研討會**
+ [ 使用 集中管理資料湖， AWS Lake Formation 同時使用 Amazon Redshift Spectrum 啟用現代資料架構](https://aws.amazon.com/blogs/big-data/centralize-governance-for-your-data-lake-using-aws-lake-formation-while-enabling-a-modern-data-architecture-with-amazon-redshift-spectrum/)
+  [使用 Redshift Spectrum 查詢 Amazon S3 資料湖中的 Apache HUDI 寫入時複製 (CoW) 資料表](https://catalog.us-east-1.prod.workshops.aws/workshops/9f29cdba-66c0-445e-8cbb-28a092cb5ba7/en-US/lab21)

# AWS Lake Formation 搭配 使用 AWS Glue
<a name="glue-features-lf"></a>

資料工程師和 DevOps 專業人員使用 AWS Glue 搭配擷取、轉換和載入 (ETL) 搭配 Apache Spark，在 Amazon S3 中的資料集上執行轉換，並將轉換的資料載入資料湖和資料倉儲，以進行分析、機器學習和應用程式開發。對於在 Amazon S3 中存取相同資料集的不同團隊，必須根據其角色授予和限制許可。

AWS Lake Formation 以 為基礎 AWS Glue，服務會以下列方式互動：
+ Lake Formation 和AWS Glue共用相同的資料目錄。
+ 下列 Lake Formation 主控台功能會叫用AWS Glue主控台：
  + 任務 – 如需詳細資訊，請參閱《 *AWS Glue 開發人員指南*》中的[新增任務](https://docs.aws.amazon.com/glue/latest/dg/add-job.html)。
  + 爬蟲程式 – 如需詳細資訊，請參閱《 *AWS Glue 開發人員指南*》中的[使用爬蟲程式編目資料表](https://docs.aws.amazon.com/glue/latest/dg/add-crawler.html)。
+ 使用 Lake Formation 藍圖時產生的工作流程是AWS Glue工作流程。您可以在 Lake Formation 主控台和AWS Glue主控台中檢視和管理這些工作流程。
+ Lake Formation 提供機器學習轉換，並建置在 AWS Glue API 操作上。您可以在 AWS Glue主控台上建立和管理機器學習轉換。如需詳細資訊，請參閱《 *AWS Glue 開發人員指南*》中的[Machine Learning轉換](https://docs.aws.amazon.com/glue/latest/dg/machine-learning.html)。

 可以使用 Lake Formation 精細存取控制來管理現有的 Data Catalog 資源和 Amazon S3 資料位置。

**注意**  
AWS Glue 5.0 或更高版本支援對由 S3 支援的 Iceberg 和 Hive 資料表進行精細存取控制。此功能可讓您設定 Apache Spark 任務中讀取查詢 AWS Glue 的資料表、資料列、資料欄和儲存格層級存取控制。

## 支援交易資料表類型
<a name="tables.glue"></a>

套用 Lake Formation 許可可讓您保護 Amazon S3 型資料湖中的交易資料。下表列出 AWS Glue 和 Lake Formation 許可中支援的交易資料表格式。Lake Formation 會強制執行這些 AWS Glue 操作許可。


**支援的資料表格式**  

| 資料表格式 | 描述和允許的操作 | 中支援的 Lake Formation 許可 AWS Glue | 
| --- | --- | --- | 
|  Apache Hudi  |  用於簡化增量資料處理和資料管道開發的開放資料表格式。 如需範例，請參閱[在 中使用 Hudi 架構 AWS Glue](https://docs.aws.amazon.com/glue/latest/dg/aws-glue-programming-etl-format-hudi.html)。  |  資料表層級許可可用於 Hudi 資料表。 如需詳細資訊，請參閱[限制](https://docs.aws.amazon.com/glue/latest/dg/security-lf-enable.html)。  | 
|  Apache Iceberg  |  以資料表形式管理大型檔案集合的開放資料表格式。 如需範例，請參閱[在 中使用 Iceberg 架構 AWS Glue](https://docs.aws.amazon.com/glue/latest/dg/aws-glue-programming-etl-format-iceberg.html)。  |  AWS Glue 5.0 版和更新版本可讓您為 Iceberg 資料表 AWS Glue 的 Apache Spark 任務中的讀取查詢設定資料表、資料列、資料欄和儲存格層級存取控制。 如需詳細資訊，請參閱[限制](https://docs.aws.amazon.com/glue/latest/dg/security-lf-enable.html)。  | 
|  Linux Foundation Delta Lake  |  Delta Lake 是一項開放原始碼專案，可協助實作常見於 Amazon S3 或 Hadoop 分散式檔案系統 (HDFS) 的現代資料湖架構。 如需範例，請參閱[在 中使用 Delta Lake 架構 AWS Glue](https://docs.aws.amazon.com/glue/latest/dg/aws-glue-programming-etl-format-delta-lake.html)。  |  資料表層級許可可用於 Delta Lake 資料表。 如需詳細資訊，請參閱[限制](https://docs.aws.amazon.com/glue/latest/dg/security-lf-enable-considerations.html)。  | 

## 其他資源
<a name="add-resources-glue"></a>

**部落格文章和儲存庫**
+ [ 使用 AWS Glue 連接器透過 ACID 交易讀取和寫入 Apache Iceberg 資料表，並執行時間歷程](https://aws.amazon.com/blogs/big-data/use-the-aws-glue-connector-to-read-and-write-apache-iceberg-tables-with-acid-transactions-and-perform-time-travel/)
+  [使用 AWS Glue 自訂連接器寫入 Apache Hudi 資料表](https://aws.amazon.com/blogs/big-data/writing-to-apache-hudi-tables-using-aws-glue-connector/)
+  AWS [Cloudformation 範本和 pyspark 程式碼範例](https://github.com/aws-samples/aws-glue-streaming-etl-with-apache-hudi)的儲存庫，用於使用 AWS Glue、Apache Hudi 和 Amazon S3 分析串流資料。

# AWS Lake Formation 搭配 Amazon EMR 使用
<a name="emr-integ-lf"></a>

 Amazon EMR 是一種靈活的 AWS 受管叢集平台，您可以在支援的大數據架構上執行任何自訂程式碼，例如 Hadoop Map-Reduce、Spark、Hive、Presto 等。組織也會使用 Amazon EMR 跨高度分散式叢集執行批次和串流資料處理應用程式。在 Amazon EMR 上使用 Apache Spark，您可以在其許可由 Lake Formation 管理的資料庫和資料表上執行資料轉換和自訂程式碼。

部署 Amazon EMR 有三個選項：
+ EC2 上的 EMR
+  EMR Serverless 
+  Amazon EMR on EKS 

 如需詳細資訊，請參閱[將 Amazon EMR 與 Lake Formation 整合](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-lake-formation.html)或[將 EMR Serverless 與 搭配使用 AWS Lake Formation ，以取得精細存取控制](https://docs.aws.amazon.com/emr/latest/EMR-Serverless-UserGuide/emr-serverless-lf-enable.html) 

## 支援交易資料表格式
<a name="tables-emr"></a>

 當您使用 Spark SQL 讀取和寫入資料時，Amazon EMR 6.15.0 版和更新版本包括對 [Apache Hudi ](https://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-hudi.html)、[Apache Iceberg](https://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-iceberg.html) 和 [Delta Lake](https://github.com/aws-samples/amazon-emr-with-delta-lake) 資料表格式的 Lake Formation 資料表、資料列、資料欄和儲存格層級存取控制許可的支援。

如需限制，請參閱[使用 Lake Formation 的 Amazon EMR 考量](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-lf-limitations.html)事項。


**支援的資料表格式**  

| 資料表格式 | 描述和允許的操作 | Amazon EMR 中支援的 Lake Formation 許可 | 
| --- | --- | --- | 
|  Apache Hudi  |  用於簡化增量資料處理和資料管道開發的開放資料表格式。 如需支援的操作清單，請參閱 [Apache Hudi 和 Lake Formation](https://docs.aws.amazon.com/emr/latest/ManagementGuide/hudi-with-lake-formation.html)。  |  Amazon EMR 使用 Apache Hudi 來支援資料表、資料列、資料欄和儲存格層級存取控制。  | 
|  Apache Iceberg  |  以資料表形式管理大型檔案集合的開放資料表格式。 如需支援的操作清單，請參閱 [Apache Iceberg 和 Lake Formation](https://docs.aws.amazon.com/emr/latest/ManagementGuide/iceberg-with-lake-formation.html)。  |  Amazon EMR 使用 Apache Iceberg 來支援資料表、資料列、資料欄和儲存格層級存取控制。  | 
|  Linux Foundation Delta Lake  |  Delta Lake 是一項開放原始碼專案，可協助實作常見於 Amazon S3 或 Hadoop 分散式檔案系統 (HDFS) 的現代資料湖架構。 如需支援的操作清單，請參閱 [Delta Lake 和 Lake Formation](https://docs.aws.amazon.com/emr/latest/ManagementGuide/delta-with-lake-formation.html)。  |  Amazon EMR 支援使用 Delta Lake 資料表進行資料表、資料列、資料欄和儲存格層級存取控制。  | 

## 其他資源
<a name="add-resources-EMR"></a>

**使用者指南、部落格文章和研討會**
+ [ 使用執行期角色與 Amazon EMR 整合](https://catalog.us-east-1.prod.workshops.aws/workshops/78572df7-d2ee-4f78-b698-7cafdb55135d/en-US/emr-runtimerole-integration)
+  [使用 Amazon EMR on EKS 快速開始使用 Apache Hudi、Apache Iceberg 和 Delta Lake](https://aws.amazon.com/blogs/big-data/get-a-quick-start-with-apache-hudi-apache-iceberg-and-delta-lake-with-amazon-emr-on-eks/)
+  [搭配 EMR Serverless 使用 Delta Lake OSS](https://docs.aws.amazon.com/emr/latest/EMR-Serverless-UserGuide/using-delta-lake.html) 

# AWS Lake Formation 搭配 Quick 使用
<a name="qs-integ-lf"></a>

 快速支援探索使用 Athena 在 Amazon S3 中由 Lake Formation 許可管理的資料集。

Quick 的標準版和企業版使用者都與 Lake Formation 整合，但略有不同。
+ 企業版 – 將精細存取控制 (FGAC) 許可授予個別 Quick 使用者和群組，以存取資料庫和資料表。
+ 標準版本 – 授予 IAM 角色存取資料庫和資料表的許可。

**注意**  
根據預設，Quick 會使用名為 的角色`aws-quicksight-service-role-v0`。您也可以定義具有必要許可的自訂角色，讓 Quick 能夠存取 Athena。

如需詳細資訊，請參閱[透過 授權連線 AWS Lake Formation](https://docs.aws.amazon.com/quicksight/latest/user/lake-formation.html) 

## 其他資源
<a name="add-resources-qs"></a>

**部落格文章**
+ [ 在 中啟用快速作者的精細許可 AWS Lake Formation](https://aws.amazon.com/blogs/big-data/enable-fine-grained-permissions-for-amazon-quicksight-authors-in-aws-lake-formation/)
+  [使用 AWS Lake Formation 和 Quick 安全地分析您的資料](https://aws.amazon.com/blogs/big-data/securely-analyze-your-data-with-aws-lake-formation-and-amazon-quicksight/)

# AWS Lake Formation 搭配 AWS CloudTrail Lake 使用
<a name="cloudtrail-lake-integ-lf"></a>

AWS CloudTrail Lake 支援使用 來探索事件資料存放區 Amazon Athena ，其中包含精細的許可 AWS Lake Formation。

**注意**  
CloudTrail Lake 只能透過 查詢 Amazon Athena。

若要向 Lake Formation 註冊 CloudTrail Lake 事件資料存放區，請參閱[聯合事件資料存放區](https://docs.aws.amazon.com/awscloudtrail/latest/userguide/query-federation.html)。