

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 處理資料匯出
<a name="dataexports-processing"></a>

在以下各節中，您將找到有關處理資料匯出的資訊。

## 設定 Amazon Athena
<a name="dataexports-athena"></a>

**使用 Glue 爬蟲程式建置 Athena AWS 的資料表和分割區**

1. 使用下列資料匯出交付選項建立 CUR 2.0 或碳排放的匯出：
   + 壓縮類型和檔案格式：Parquet - Parquet
   + 檔案版本控制：覆寫現有的資料匯出檔案

1. 在 Athena 中，使用筆記本編輯器搭配 Trino SQL，然後選擇**建立**以建立具有「AWS Glue 爬蟲程式」的資料表。使用 Glue 爬蟲程式工作流程，指向要在 s3：//<bucket-name>/<prefix>/<export-name>/data 資料夾上執行的 Glue 爬蟲程式，以自動載入指定匯出至 Athena 的所有已交付分割區。

1. Glue 爬蟲程式完成後，您可以使用 Athena 在 Glue 爬蟲程式建立的資料表上寫入查詢。

## 設定 Amazon Redshift
<a name="dataexports-redshift"></a>

Amazon Redshift 是一種雲端資料倉儲，可在佈建容量或無伺服器模型中存取。Amazon Redshift 提供快速查詢效能，以處理來自資料匯出的資料。

如需設定 Redshift 的資訊，請參閱*《[Amazon Redshift 入門指南》](https://docs.aws.amazon.com/redshift/latest/gsg/new-user-serverless.html)*。

## 處理 CUR 2.0 的建議 SQL 查詢
<a name="dataexports-recommended-sql-queries"></a>

將 CUR 2.0 匯出資料載入 Amazon Athena 或 Amazon Redshift 等資料分析工具後，您可以處理它，以取得成本和用量洞察。 AWS Well-Architected 實驗室提供 CUR 查詢程式庫，可用來處理 CUR。如需詳細資訊，請參閱 [AWS CUR 查詢程式庫](https://wellarchitectedlabs.com/cost-optimization/cur_queries/)。

請注意以下兩個有關 SQL 查詢的資訊：
+ Well-Architected Labs SQL 查詢無法在資料匯出查詢欄位中運作，因為資料匯出不支援彙總和這些查詢中使用的一些其他 SQL 語法。
+ Well-Architected Labs SQL 查詢只有在您尚未從預設名稱重新命名資料欄時才有效。根據查詢，您可能需要使用點運算子將某些產品資料欄查詢為個別的資料欄。如需詳細資訊，請參閱[資料查詢 - SQL 查詢和資料表組態](https://docs.aws.amazon.com/cur/latest/userguide/dataexports-data-query.html)。

## 處理碳排放資料匯出的建議 SQL 查詢
<a name="carbon-emissions-sql-queries"></a>

若要取得每個 payer\_account\_id 的總碳排放量：

```
SELECT payer_account_id, SUM(total_mbm_emissions_value) AS total_emissions
FROM "ccft-data-exports"."ccft-data-exports-data" -- change to your table name
GROUP BY payer_account_id
ORDER BY total_emissions DESC;
```

若要取得每個 payer\_account\_id 和每個 product\_code 的總碳排放量：

```
SELECT payer_account_id, product_code, SUM(total_mbm_emissions_value) AS total_emissions
FROM "ccft-data-exports"."ccft-data-exports-data"-- change to your table name
GROUP BY payer_account_id, product_code
ORDER BY total_emissions DESC;
```

若要取得每個 payer\_account\_id 和每個 region\_code 的總碳排放量：

```
SELECT payer_account_id, region_code, SUM(total_mbm_emissions_value) AS total_emissions
FROM "ccft-data-exports"."ccft-data-exports-data" -- change to your table name
GROUP BY payer_account_id, region_code
ORDER BY total_emissions DESC;
```