

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 使用 Amazon SageMaker AI Data Wrangler 準備和匯入大量資料
<a name="preparing-importing-with-data-wrangler"></a>

**重要**  
當您使用 Data Wrangler 時，會產生 SageMaker AI 成本。如需費用和價格的完整清單，請參閱 [Amazon SageMaker AI 定價](https://aws.amazon.com/sagemaker/pricing/)的 Data Wrangler 標籤。為了避免產生額外費用，當您完成後，請關閉 Data Wrangler 執行個體。如需詳細資訊，請參閱[關閉 Data Wrangler](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-shut-down.html)。

建立資料集群組之後，您可以使用 Amazon SageMaker AI Data Wrangler (Data Wrangler) 將超過 40 個來源的資料匯入 Amazon Personalize 資料集。Data Wrangler 是 Amazon SageMaker AI Studio Classic 的一項功能，可提供end-to-end解決方案來匯入、準備、轉換和分析資料。您無法使用 Data Wrangler 來準備資料，並將資料匯入動作資料集或動作互動資料集。

 當您使用 Data Wrangler 準備和匯入資料時，您會使用資料流程。*資料流程*會定義一系列機器學習資料準備步驟，從匯入資料開始。每次將步驟新增至流程時，Data Wrangler 都會對資料採取動作，例如轉換資料或產生視覺化效果。

以下是您可以新增至流程以準備 Amazon Personalize 資料的一些步驟：
+ **洞見：**您可以將 Amazon Personalize 特定洞見步驟新增至流程。這些洞見可協助您了解資料，以及您可以採取哪些動作來改善資料。
+ **視覺化：**您可以新增視覺化步驟來產生長條圖和散佈圖等圖形。圖形可協助您探索資料中的問題，例如極端值或遺失值。
+ **轉換：**您可以使用 Amazon Personalize 特定和一般轉換步驟，確保您的資料符合 Amazon Personalize 要求。Amazon Personalize 轉換可協助您根據 Amazon Personalize 資料集類型，將資料欄映射至必要的資料欄。

如果您需要在將資料匯入 Amazon Personalize 之前離開 Data Wrangler，您可以在[從 Amazon Personalize 主控台啟動 Data Wrangler ](dw-launch-dw-from-personalize.md)時選擇相同的資料集類型，以返回您離開的位置。或者，您也可以直接透過 SageMaker AI Studio Classic 存取 Data Wrangler。

 建議您將資料從 Data Wrangler 匯入 Amazon Personalize，如下所示。轉換、視覺化和分析步驟是選用的、可重複的，並且可以按任何順序完成。

1. **[設定許可](dw-data-prep-minimum-permissions.md)** - 設定 Amazon Personalize 和 SageMaker AI 服務角色的許可。並為您的使用者設定許可。

1. **[從 Amazon Personalize 主控台啟動 SageMaker AI Studio Classic 中的 Data Wrangler](dw-launch-dw-from-personalize.md)** - 使用 Amazon Personalize 主控台設定 SageMaker AI 網域，並在 SageMaker AI Studio Classic 中啟動 Data Wrangler。

1. **[將您的資料匯入 Data Wrangler](dw-import-data.md)** - 將超過 40 個來源的資料匯入 Data Wrangler。來源包括 Amazon Redshift、Amazon EMR 或 Amazon Athena 等 AWS 服務，以及 Snowflake 或 DataBricks 等第三方。

1. **[轉換您的資料](dw-transform-data.md)** - 使用 Data Wrangler 轉換您的資料以符合 Amazon Personalize 需求。

1. **[視覺化和分析您的資料](dw-analyze-data.md)** - 使用 Data Wrangler 視覺化您的資料，並透過 Amazon Personalize 特定洞見進行分析。

1. **[處理資料並將其匯入 Amazon Personalize](dw-export-data.md)** - 使用 SageMaker AI Studio Classic Jupyter 筆記本將已處理的資料匯入 Amazon Personalize。

## 其他資訊
<a name="dw-additional-info"></a>

下列資源提供有關使用 Amazon SageMaker AI Data Wrangler 和 Amazon Personalize 的其他資訊。
+ 如需逐步解說處理和轉換範例資料集的教學課程，請參閱《*Amazon SageMaker AI 開發人員指南*》中的[示範：Data Wrangler Titanic 資料集演練](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-getting-started.html#data-wrangler-getting-started-demo)。本教學課程介紹 Data Wrangler 的欄位和函數。
+ 如需有關加入 Amazon SageMaker AI 網域的資訊，請參閱《[Amazon SageMaker AI 開發人員指南》中的快速加入 Amazon SageMaker AI 網域](https://docs.aws.amazon.com/sagemaker/latest/dg/onboard-quick-start.html)。 *Amazon SageMaker *
+ 如需 Amazon Personalize 資料需求的資訊，請參閱 [準備 Amazon Personalize 的訓練資料](preparing-training-data.md)。