

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 用户数据集要求（VIDEO\$1ON\$1DEMAND 域）
<a name="VIDEO-ON-DEMAND-users-dataset"></a>

 *用户数据集* 存储有关用户的元数据。这可能包括每个用户的年龄、兴趣、性别或会员资格等信息。有关您可以导入 Amazon Personalize 的用户数据类型的信息，请参阅[用户元数据](users-datasets.md)。有关通用 Amazon Personalize 架构要求的信息，请参阅[为 Amazon Personalize 架构创建架构 JSON 文件](how-it-works-dataset-schema.md)。这些要求适用于所有架构，不论域如何。

 对于所有 VIDEO\$1ON\$1DEMAND 使用案例，用户数据集都是可选的。如果您有用户数据，我们建议您创建一个用户数据集，以获得最相关的建议。如果您创建用户数据集，则架构必须包含以下字段。
+ USER\$1ID
+ 1 个元数据字段（分类 `string` 或数字）

您可以根据您的使用案例和数据自由添加其他字段。只要字段未列为必填字段或保留字段，并且数据类型列在[架构数据类型](how-it-works-dataset-schema.md#personalize-datatypes)中，则字段名称和数据类型由您决定。有关 VIDEO\$1ON\$1DEMAND 域用户数据集的默认架构示例，请参阅[默认用户架构（VIDEO\$1ON\$1DEMAND 域）](#VIDEO-ON-DEMAND-users-dataset-schema)。

默认架构中包含 `SUBSCRIPTION_MODEL` 字段。此字段是一个可选保留关键字字段，其类型必须为 `string`，类别设置为 `true`。为了获得最佳建议，我们建议在您的数据中存在关于每个用户的订阅模式信息时，在架构中保留此字段。您导入的数据必须与您的架构相匹配。

## 使用分类数据
<a name="vod-categorical-users"></a>

 要使用分类数据，请添加类型为 `string` 的字段，并在架构中将该字段的类别属性设置为 `true`。然后，将分类数据包含在批量 CSV 文件和单个记录导入中。对于具有多个类别的用户，使用竖线“\$1”分隔每个值。例如，对于 SUBSCRIPTION\$1MODEL 字段，您的用户数据可能是 student\$1monthly\$1discount。

分类值最多可以有 1000 个字符。如果您的用户的分类值超过 1000 个字符，则您的数据集导入作业将失败。

## 默认用户架构（VIDEO\$1ON\$1DEMAND 域）
<a name="VIDEO-ON-DEMAND-users-dataset-schema"></a>

 以下是用户数据集的默认 VIDEO\$1ON\$1DEMAND 域架构。

```
{

  "type": "record",
  "name": "Users",
  "namespace": "com.amazonaws.personalize.schema",
  "fields": [
      {
          "name": "USER_ID",
          "type": "string"
      },
      {
          "name": "SUBSCRIPTION_MODEL",
          "type": "string",
          "categorical": true
      }
  ],
  "version": "1.0"
}
```