

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 資料格式相容性指南
<a name="clarify-processing-job-data-format"></a>

本指南說明與 SageMaker Clarify 處理任務相容的資料格式類型。支援的資料格式類型包含副檔名、資料結構，以及表格式、影像和時間序列資料集的特定要求或限制。本指南也會說明如何檢查您的資料集是否符合這些需求。

在高層級上，SageMaker Clarify 處理任務會遵循輸入程序輸出模型來運算偏差指標和功能屬性。請參考以下範例了解詳細資訊。

SageMaker Clarify 處理任務的輸入包含下列項目：
+ 要分析的資料集。
+ 分析組態。如需如何設定分析的詳細資訊，請參閱[分析組態檔案](clarify-processing-job-configure-analysis.md)。

在處理階段，SageMaker Clarify 會運算偏差指標和功能屬性。SageMaker Clarify 處理任務會在後端完成下列步驟：
+ SageMaker Clarify 處理任務會剖析您的分析組態並載入您的**資料集**。
+ 若要運算訓練後偏差指標和功能屬性，此任務需要您的模型預測模型。SageMaker Clarify 處理任務會序列化您的資料，並將其作為**請求**傳送至部署在 SageMaker AI 即時推論**端點**上的模型。之後，SageMaker Clarify 處理任務會從**回應**中擷取預測。
+ SageMaker Clarify 處理任務會執行偏差和解釋性分析，然後輸出結果。

如需詳細資訊，請參閱[SageMaker Clarify 處理工作的運作方式](clarify-configure-processing-jobs.md#clarify-processing-job-configure-how-it-works)。

您用來指定資料格式的參數取決於資料在處理流程中使用的位置，如下所示：
+ 對於**輸入資料集**，請使用 `dataset_type` 參數來指定格式或 MIME 類型。
+ 對於端點的**請求**，請使用 `content_type` 參數來指定格式。
+ 對於來自端點的**回應**，請使用 `accept_type` 參數來指定格式。

端點的輸入資料集、請求和來自端點的回應不需要相同的格式。例如，在符合下列條件的情況下，您可以使用具有 CSV **請求有效負載**和 JSON 行**回應有效負載**的 Parquet 資料集。
+ 您的分析設定正確。
+ 您的模型支援請求和回應格式。

**注意**  
如果未提供 `content_type` 或 `accept_type`，則 SageMaker Clarify 容器會推論 `content_type` 和 `accept_type`。

**Topics**
+ [表格式資料](clarify-processing-job-data-format-tabular.md)
+ [影像資料要求](clarify-processing-job-data-format-image.md)
+ [時間序列資料](clarify-processing-job-data-format-time-series.md)