

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# AWS Lake Formation 搭配 Amazon Athena 使用
<a name="athena-lf"></a>

 [Amazon Athena](https://docs.aws.amazon.com/athena/index.html) 是一種無伺服器查詢服務，可協助您分析存放在 Amazon S3 中的結構化、半結構化和非結構化資料。您可以使用 Athena SQL 從 CSV、JSON、Parquet 和 Avro 資料格式查詢資料。Athena SQL 也支援 [Apache Hive](https://hive.apache.org/)、[Apache Hudi](https://hudi.apache.org/) 和 [Apache Iceberg](https://iceberg.apache.org/) 等資料表格式。Athena 與 整合 AWS Glue Data Catalog ，將資料集的中繼資料存放在 Amazon S3 中。Athena 可以使用 Lake Formation 來定義和維護這些資料集的存取控制政策。

 以下是您可以搭配 Athena 使用 Lake Formation 的一些常見使用案例。
+ 使用 Lake Formation 許可從 Athena 存取 Data Catalog 資源 （資料庫和資料表）。您可以使用具名資源方法或 LF 標籤來定義資料庫和資料表的許可。如需詳細資訊，請參閱：
  + [使用具名資源方法授與資料庫許可](granting-database-permissions.md)
  + [Lake Formation 標籤型存取控制](tag-based-access-control.md)
**注意**  
Lake Formation 許可僅適用於使用 Athena SQL 查詢來自 Amazon S3 的來源資料和 Data Catalog 中的中繼資料。  
Athena Spark 不支援查詢具有 Lake Formation 許可的資料目錄資料表。Lake Formation 許可支援資料庫和資料表的讀取和寫入操作。
**注意**  
當您使用 LF 標籤來管理 Data Catalog 資源的許可時，無法套用資料篩選條件。
+ 透過授予資料欄、資料列和儲存格層級的許可，使用 [Lake Formation 中的資料篩選條件](data-filtering.md#data-filters-about)來保護 Amazon S3 資料湖中的資料表，以控制查詢結果。請參閱《Amazon Athena 使用者指南》中的[分割區投影限制](https://docs.aws.amazon.com/athena/latest/ug/lf-athena-limitations.html#lf-athena-limitations-data-filters)。
+ 執行聯合查詢時，對 SAML 型 Athena 使用者可用的資料強制執行精細存取控制。

  Athena JDBC 和 ODBC 驅動程式支援使用 SAML 型身分提供者 (IdP) 設定對資料來源的聯合存取。使用快速整合 Lake Formation 與您現有的 IAM 角色或 SAML 使用者或群組，將 Athena 查詢結果視覺化。
**注意**  
只有當您使用 JDBC 或 ODBC 驅動程式向 Athena 提交查詢時，SAML 使用者和群組的 Lake Formation 許可才會套用。

  如需詳細資訊，請參閱[使用 Lake Formation 和 Athena JDBC 和 ODBC 驅動程式來聯合存取 Athena](https://docs.aws.amazon.com/athena/latest/ug/security-athena-lake-formation-jdbc.html)。
**注意**  
目前，下列區域不支援授權存取 Lake Formation 中的 SAML 身分：  
中東 (巴林) – me-south-1
亞太區域 (香港) – ap-east-1
非洲 (開普敦) – af-south-1
中國 (寧夏) – cn-northwest-1
亞太區域 (大阪) - ap-northeast-3
+ 使用 [Lake Formation 中的跨帳戶資料共用](cross-account-permissions.md) 查詢另一個帳戶中的資料表。

**注意**  
如需使用 Lake Formation 許可至 時限制的詳細資訊`Views`，請參閱[考量和限制](https://docs.aws.amazon.com/athena/latest/ug/security-athena-lake-formation.html)。

## 支援交易資料表格式
<a name="tables-ate"></a>

套用 Lake Formation 許可可讓您保護 Amazon S3 型資料湖中的交易資料。下表列出 Athena 和 Lake Formation 許可中支援的交易資料表格式。Lake Formation 會在 Athena 使用者執行其查詢時強制執行這些許可。


| 資料表格式 | 描述和允許的操作 | Athena 中支援的 Lake Formation 許可 | 
| --- | --- | --- | 
| Apache Hudi | 用於簡化增量資料處理和資料管道開發的格式。<br />Athena 支援在 Amazon S3 資料集上使用 Apache Hudi 資料表格式建立和讀取操作，適用於**寫入時複製 (CoW)** 和**讀取時合併 (MoR)** Hudi 資料表類型。Athena 不支援 Hudi 資料表上的寫入操作。<br />使用 [Athena 查詢 Hudi 資料集](https://docs.aws.amazon.com/athena/latest/ug/querying-hudi.html)。 | 使用 [Lake Formation 中的資料篩選和儲存格層級安全性](data-filtering.md) 使用資料表、資料欄、資料列和儲存格層級許可來保護 Hudi 資料表。 | 
| Apache Iceberg | 一種開放的資料表格式，可管理大型檔案集合做為資料表，並支援現代分析資料湖操作，例如記錄層級插入、更新、刪除和時間歷程查詢。<br />如需 Athena 支援 Iceberg 資料表的詳細資訊，請參閱[使用 Iceberg 資料表](https://docs.aws.amazon.com/athena/latest/ug/querying-iceberg.html)。 | 支援資料表、資料欄、資料列和儲存格層級許可。目前，Lake Formation 不支援管理 Open Table Formats 中 `VACUUM`、 `MERGE``UPDATE`和 等寫入操作`OPTIMIZE`的許可。 | 
| Linux Foundation Delta Lake | Delta Lake 是一項開放原始碼專案，可協助實作常見於 Amazon S3 或 Hadoop 分散式檔案系統 (HDFS) 的現代資料湖架構。<br />Athena 支援 AWS Glue Data Catalog 從 Delta Lake 資料表使用以符號連結為基礎的資訊清單資料表定義在 上建立的 Delta lake 資料表。<br />如需詳細資訊，請參閱[使用爬蟲程式爬 AWS Glue 取 Delta Lake 資料表](https://aws.amazon.com/blogs/big-data/crawl-delta-lake-tables-using-aws-glue-crawlers/)。<br /> Athena （引擎版本 3) 支援讀取原生 Delta Lake 資料表。<br /> 如需詳細資訊，請參閱[使用 AWS Glue 爬蟲程式介紹原生 Delta Lake 資料表支援](https://aws.amazon.com/blogs/big-data/introducing-native-delta-lake-table-support-with-aws-glue-crawlers/)。 | symlink 資料表和原生 Delta Lake 資料表支援資料表、資料欄、資料列和儲存格層級許可。 | 

## 其他資源
<a name="add-resources-ate"></a>

**部落格文章、影片和研討會**
+ [ 使用 Amazon Athena 查詢 Amazon S3 資料湖中的 Apache Hudi 資料集 Amazon Athena](https://aws.amazon.com/blogs/big-data/part-1-query-an-apache-hudi-dataset-in-an-amazon-s3-data-lake-with-amazon-athena-part-1-read-optimized-queries/)
+  [使用 Amazon Athena、Amazon EMR 和 建置 Apache Iceberg 資料湖 AWS Glue](https://aws.amazon.com/blogs/big-data/build-an-apache-iceberg-data-lake-using-amazon-athena-amazon-emr-and-aws-glue/) 
+ [使用 Athena 和 Apache Iceberg 在 Amazon S3 上插入、更新、刪除 ](https://www.youtube.com/watch?v=u1v666EXCJw)
+ 查詢資料湖的 [LF-Tag 型存取控制](https://catalog.us-east-1.prod.workshops.aws/workshops/78572df7-d2ee-4f78-b698-7cafdb55135d/en-US/lakeformation-basics/querying-datalake/tag-based-access-control) Lake Formation 研討會。