

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 產生在 SageMaker Studio 訓練前資料中的偏差報告
<a name="clarify-data-bias-reports-ui"></a>

SageMaker Clarify 與 Amazon SageMaker Data Wrangler 整合，可協助您在資料準備過程中找出偏差，而不必撰寫自己的程式碼。Data Wrangler 提供端對端解決方案，可透過 Amazon SageMaker Studio 匯入、準備、轉換、特徵化和分析資料。有關 Data Wrangler 資料準備工作流程的概觀，請參閱[使用 Amazon SageMaker Data Wrangler 準備機器學習資料](data-wrangler.md)。

您可以指定感興趣的屬性，例如性別或年齡，SageMaker Clarify 會執行一組演算法來偵測這些屬性中是否存在偏差。執行演算法後，SageMaker Clarify 會提供視覺化報告，其中包含可能的偏差來源和偏差嚴重性說明，以便您可以規劃緩解的步驟。例如，相較於其他年齡組，在財務資料集中包含一個年齡群組的商業貸款範例，SageMaker AI 會標記不平衡，以便您可以避免使用該年齡層的模型。

**分析和報告資料偏差**

要開始使用 Data Wrangler，請參閱[開始使用 Data Wrangler](data-wrangler-getting-started.md)。

1. 在 Amazon SageMaker Studio Classic 中，從左側面板的**首頁** (![\[Black square icon representing a placeholder or empty image.\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/studio/icons/house.png)) 功能表導覽至**資料**節點，然後選擇 **Data Wrangler**。這會在 Studio Classic 中開啟**Data Wrangler 登陸頁面**。

1. 選擇 **\$1 匯入資料**按鈕以建立新流程。

1. 在流程頁面的**匯入**索引標籤，選擇 Amazon S3，導覽至 Amazon S3 儲存貯體，找到您的資料集，然後選擇**匯入**。

1. 匯入您的資料後，在**資料流量**索引標籤的流程圖上，選擇**資料類型**節點右側的 **\$1** 號。

1. 選擇 **新增分析**。

1. 在**建立分析**頁面上，選擇**偏差報告**作為**分析類型**。

1. 透過提供報告**名稱**、要預測的欄，以及其是值還是閾值、要分析偏差 (構面) 的欄，以及其是值還是閾值，設定偏差報告。

1. 選擇偏差指標，繼續設定偏差報告。  
![\[選擇偏差指標。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/clarify-data-wrangler-configure-bias-metrics.png)

1. 選擇**檢查偏差**，以產生並檢視偏差報告。向下捲動以檢視全部的報告。  
![\[產生並檢視偏差報告。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/clarify-data-wrangler-create-bias-report.png)

1. 選擇每個偏差指標說明右側的插入記號，參閱可協助您解讀指標值重要性的文件。

1. 若要檢視偏差指標值的表格摘要，請選擇**資料表**切換按鈕。若要儲存報告，請選擇頁面右下角的**儲存**。您可以在**資料流量**索引標籤的流程圖上查看報告。按兩下報告以開啟之。