

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 处理数据并将其导入 Amazon Personalize
<a name="dw-export-data"></a>

 当您完成数据分析和转换后，就可以对其进行处理并将其导入 Amazon Personalize 了。
+  **[处理数据](#dw-process-data)** - 处理数据会将转换应用于整个数据集并将其输出到您指定的目的地。在这种情况下，您可以指定 Amazon S3 存储桶。
+ **[将数据导入 Amazon P](#dw-import-into-personalize)** ersonalize — 要将处理过的数据导入亚马逊个性化，您需要运行 A SageMaker I Studio Classic 中提供的 Jupyter 笔记本。此笔记本可创建您的 Amazon Personalize 数据集并将您的数据导入其中。

## 处理数据
<a name="dw-process-data"></a>

 在将数据导入 Amazon Personalize 之前，您必须将转换应用于整个数据集并将其输出到 Amazon S3 存储桶。为此，您需要创建一个目标节点，并将目标设置为 Amazon S3 存储桶，然后启动转换的处理作业。

有关指定目标和启动流程任务的 step-by-step说明，请参阅[使用 Amazon A SageMaker I Data Wrangler 点击几下即可启动处理任务](https://aws.amazon.com/blogs/machine-learning/launch-processing-jobs-with-a-few-clicks-using-amazon-sagemaker-data-wrangler/)。添加目标时，选择 **Amazon S3**。将处理过的数据导入 Amazon Personalize 时，您将使用此位置。

处理完数据后，您就可以将其从 Amazon S3 存储桶导入到 Amazon Personalize 了。

## 将数据导入 Amazon Personalize
<a name="dw-import-into-personalize"></a>

处理完数据后，即可将其导入 Amazon Personalize。要将处理后的数据导入 Amazon Personalize，您需要运行 A SageMaker I Studio Classic 中提供的 Jupyter 笔记本。此笔记本可创建您的 Amazon Personalize 数据集并将您的数据导入其中。

**将处理过的数据导入 Amazon Personalize**

1. 对于要导出的转换，选择**导出到**，然后选择 **Amazon Personalize（通过 Jupyter 笔记本）**。

1. 修改笔记本，以指定您用作处理作业数据目标的 Amazon S3 存储桶。（可选）为您的数据集组指定域。默认情况下，笔记本会创建自定义数据集组。

1. 查看创建架构的笔记本单元格。在运行单元格之前，验证架构字段是否具有预期的类型和属性。
   +  验证支持空数据的字段是否在类型列表中列出了 `null`。以下示例说明了如何为字段添加 `null`。

     ```
     {
       "name": "GENDER",
       "type": [
         "null",
         "string"
       ],
       "categorical": true
     }
     ```
   +  验证分类字段的类别属性是否设置为 true。以下示例说明了如何标记字段类别。

     ```
     {
               "name": "SUBSCRIPTION_MODEL",
               "type": "string",
               "categorical": true
     }
     ```
   + 验证文本字段的文本属性是否设置为 true。以下示例说明了如何将字段标记为文本。

     ```
     {
           "name": "DESCRIPTION",
           "type": [
             "null",
             "string"
           ],
           "textual": true
     }
     ```

1. 运行笔记本以创建架构，创建数据集，然后将您的数据导入 Amazon Personalize 数据集。你可以像 SageMaker AI Studio Classic 之外的笔记本电脑一样运行笔记本电脑。有关运行 Jupyter 笔记本的信息，请参阅[运行代码](https://jupyter-notebook.readthedocs.io/en/stable/examples/Notebook/Running Code.html)。有关 SageMaker AI Studio Classic 中笔记本电脑的信息，请参阅[亚马逊 SageMaker AI *开发者指南中的使用亚马逊 SageMaker AI* 笔记本电脑](https://docs.aws.amazon.com/sagemaker/latest/dg/notebooks.html)。

    完成笔记本后，如果您导入了交互数据，则可以创建推荐器或自定义资源。或者，您可以对物品数据集或用户数据集重复该过程。
   + 有关创建域推荐器的信息，请参阅[Amazon Personalize 中的域推荐器](creating-recommenders.md)。
   + 有关创建和部署自定义资源的信息，请参阅[用于训练和部署 Amazon Personalize 模型的自定义资源](create-custom-resources.md)。