

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 在 OpenSearch Dashboards 中設定和查詢 S3 資料來源
<a name="direct-query-s3-configure"></a>

現在您已建立資料來源，您可以設定安全設定、定義 Amazon S3 資料表或設定加速資料索引。本節會在您查詢資料之前，逐步解說您在 OpenSearch Dashboards 中使用資料來源的各種使用案例。

若要設定下列區段，您必須先導覽至 OpenSearch Dashboards 中的資料來源。在左側導覽的**管理**下，選擇**資料來源**。在**管理資料來源**下，選取您在主控台中建立的資料來源名稱。

## 使用 Query Workbench 建立 Spark 資料表
<a name="direct-query-s3-configure-tables"></a>

從 OpenSearch Service 到 Amazon S3 的直接查詢會使用 中的 Spark 資料表 AWS Glue Data Catalog。您可以從 Query Workbench 內建立資料表，而不必離開 OpenSearch Dashboards。

若要管理資料來源中現有的資料庫和資料表，或建立您要使用直接查詢的新資料表，請從左側導覽中選擇**查詢工作台**，然後從資料來源下拉式清單中選擇 Amazon S3 資料來源。

若要為以 Parquet 格式存放在 S3 中的 VPC 流程日誌設定資料表，請執行下列查詢：

```
CREATE TABLE 
datasourcename.gluedatabasename.vpclogstable (version INT, account_id STRING, interface_id STRING, 
srcaddr STRING, dstaddr STRING, srcport INT, dstport INT, protocol INT, packets BIGINT, 
bytes BIGINT, start BIGINT, end BIGINT, action STRING, log_status STRING, 
`aws-account-id` STRING, `aws-service` STRING, `aws-region` STRING, year STRING, 
month STRING, day STRING, hour STRING) 

USING parquet PARTITIONED BY (aws-account-id, aws-service, aws-region, year, month, 
day, hour) 

LOCATION "s3://accountnum-vpcflow/AWSLogs"
```

建立資料表之後，請執行下列查詢，以確保其與直接查詢相容：

```
MSCK REPAIR TABLE  datasourcename.databasename.vpclogstable
```

## 熱門 AWS 日誌類型的設定整合
<a name="direct-query-s3-setup-integration"></a>

您可以將存放在 Amazon S3 中的 AWS 日誌類型與 OpenSearch Service 整合。使用 OpenSearch Dashboards 安裝建立 AWS Glue Data Catalog 資料表、已儲存查詢和儀表板的整合。這些整合使用索引檢視來保持儀表板更新。

如需安裝整合的指示，請參閱 OpenSearch 文件中的[安裝整合資產](https://opensearch.org/docs/latest/integrations/#installing-an-integration-asset)。

當您選取整合時，請確定其具有 `S3 Glue`標籤。

當您設定整合時，請為連線類型指定 **S3 ** 連線。然後，選取整合的資料來源、資料的 Amazon S3 位置、管理加速索引的檢查點，以及使用案例所需的資產。

**注意**  
確定檢查點的 S3 儲存貯體具有檢查點位置的寫入許可。如果沒有這些許可，整合的加速將會失敗。

## 設定存取控制
<a name="direct-query-s3-configure-ac"></a>

在資料來源的詳細資訊頁面上，尋找**存取控制**區段，然後選擇**編輯**。如果網域已啟用精細存取控制，請選擇**受限制**，然後選取您要提供新資料來源存取權的角色。**只有當您只希望管理員能夠存取資料來源**時，也可以選擇管理員。

**重要**  
索引用於對資料來源的任何查詢。具有特定資料來源請求索引的讀取存取權的使用者可以針對該資料來源讀取*所有*查詢。具有結果索引讀取存取權的使用者可以針對該資料來源讀取*所有*查詢的結果。

## 在 OpenSearch Discover 中查詢 S3 資料
<a name="direct-querying-s3-query"></a>

設定資料表並設定所需的選用查詢加速之後，您就可以開始分析資料。若要查詢您的資料，請從下拉式選單中選取您的資料來源。如果您使用的是 Amazon S3 和 OpenSearch Dashboards，請前往探索並選取資料來源名稱。

如果您使用略過的索引或尚未建立索引，您可以使用 SQL 或 PPL 來查詢資料。如果您已設定具體化視觀表或涵蓋索引，表示您已經有 索引，並且可以在 Dashboards 中使用 Dashboards 查詢語言 (DQL)。您也可以使用 PPL 搭配可觀測性外掛程式，以及 SQL 搭配 Query Workbench 外掛程式。目前，只有可觀測性和 Query Workbench 外掛程式支援 PPL 和 SQL。如需使用 OpenSearch Service API 查詢資料，請參閱[非同步 API 文件](https://github.com/opensearch-project/sql/blob/main/docs/user/interfaces/asyncqueryinterface.rst)。

**注意**  
不支援所有 SQL 和 PPL 陳述式、命令和函數。如需支援的命令清單，請參閱 [支援的 SQL 和 PPL 命令](direct-query-supported-commands.md)。  
如果您已建立具體化檢視或涵蓋索引，您可以使用 DQL 來查詢資料，前提是您已在其中編製索引。

## 疑難排解
<a name="s3-troubleshooting"></a>

在某些情況下，結果可能無法如預期傳回。如果您遇到任何問題，請確定您正在遵循 [建議](direct-query-s3-overview.md#direct-query-s3-recommendations)。