

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# Amazon OpenSearch Ingestion 中的重要概念
<a name="ingestion-process"></a>

在您開始使用 OpenSearch Ingestion 之前，了解這些關鍵概念會很有幫助。

**管道**  
從 OpenSearch Ingestion 的角度來看，*管道*是指您在 OpenSearch Service 中建立的單一佈建資料收集器。您可以將其視為整個 YAML 組態檔案，其中包含一或多個子管道。如需建立擷取管道的步驟，請參閱 [建立管道](creating-pipeline.md#create-pipeline)。

**子管道**  
您可以在 ** YAML 組態檔案中定義子管道。每個子管道是來源、緩衝區、零或多個處理器和一或多個接收器的組合。您可以在單一 YAML 檔案中定義多個子管道，每個都具有唯一的來源、處理器和接收器。為了協助監控 CloudWatch 和其他 服務，建議您指定與其所有子管道不同的管道名稱。  
您可以在單一 YAML 檔案中將多個子管道串連在一起，以便一個子管道的來源是另一個子管道，而其接收器是第三個子管道。如需範例，請參閱 [搭配 OpenTelemetry Collector 使用 OpenSearch 擷取管道 OpenTelemetry](configure-client-otel.md)。

**來源**  
子管道的輸入元件。它定義管道使用記錄的機制。來源可以透過 HTTPS 接收事件，或從 Amazon S3 等外部端點讀取來取用事件。來源有兩種類型：*推送型*和*提取型*。以推送為基礎的來源，例如 [HTTP](https://opensearch.org/docs/latest/data-prepper/pipelines/configuration/sources/http-source/) 和 [OTel 日誌](https://opensearch.org/docs/latest/data-prepper/pipelines/configuration/sources/otel-logs-source/)，將記錄串流到擷取端點。提取型來源，例如 [OTel 追蹤](https://opensearch.org/docs/latest/data-prepper/pipelines/configuration/sources/otel-trace/)和 [S3](https://opensearch.org/docs/latest/data-prepper/pipelines/configuration/sources/s3/)，從來源提取資料。

**處理器**  
中繼處理單元，可在將記錄發佈到接收器之前，先篩選、轉換並將記錄充實為所需的格式。處理器是管道的選用元件。如果您未定義處理器，記錄會以來源中定義的格式發佈。您可以有多個處理器。管道會依照您定義的順序執行處理器。

**接收**  
子管道的輸出元件。它定義了子管道會將記錄發佈至其中的一或多個目的地。OpenSearch Ingestion 支援 OpenSearch Service 網域做為接收器。它也支援子管道做為接收器。這表示您可以在單一 OpenSearch Ingestion 管道 (YAML 檔案） 中將多個子管道綁定在一起。不支援自我管理 OpenSearch 叢集做為接收器。

**緩衝區**  
做為來源與接收器之間層的處理器部分。您無法在管道中手動設定緩衝區。OpenSearch Ingestion 使用預設緩衝區組態。

**路由**  
處理器的一部分，允許管道作者僅將符合特定條件的事件傳送至不同的接收器。

有效的子管道定義必須包含來源和接收器。如需這些管道元素的詳細資訊，請參閱[組態參考](pipeline-config-reference.md#ingestion-parameters)。