Amazon Forecast 不再向新买家开放。Amazon Forecast 的现有客户可以继续照常使用该服务。[了解更多](https://aws.amazon.com/blogs/machine-learning/transition-your-amazon-forecast-usage-to-amazon-sagemaker-canvas/)

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 预定义数据集域和数据集类型
<a name="howitworks-domains-ds-types"></a>

要训练预测器，请创建一个或多个数据集，将其添加到一个数据集组，然后提供该数据集组以进行训练。

对于您创建的每个数据集，您将一个数据集域和一个数据集类型相关联。*数据集域* 为常见使用场景指定预定义的数据集架构，不影响模型算法或超参数。

Amazon Forecast 支持以下数据集域：
+ [RETAIL 域](retail-domain.md) – 用于零售需求预测
+ [INVENTORY\$1PLANNING 域](inv-planning-domain.md) – 用于供应链和库存规划
+ [EC2 CAPACITY 域](ec2-capacity-domain.md) – 用于预测 Amazon Elastic Compute Cloud (Amazon EC2) 容量 
+ [WORK\$1FORCE 域](workforce-domain.md) – 用于劳动力规划 
+ [WEB\$1TRAFFIC 域](webtraffic-domain.md) – 用于估计未来的 Web 流量 
+ [METRICS 域](metrics-domain.md) – 用于预测指标，如收入和现金流
+ [CUSTOM 域](custom-domain.md) – 用于所有其他类型的时间序列预测

每个域都可以有一到三个*数据集类型*。您为域创建的数据集类型基于您拥有的数据的类型和要包含在训练中的内容。

每个域都需要一个目标时间序列数据集，并且可选支持相关时间序列和项目元数据数据集类型。

数据集类型为：
+ 目标时间序列 – 唯一必需的数据集类型。此类型定义您要为其生成预测的*目标*字段。例如，如果要预测一组产品的销售额，您必须为要预测的每个产品创建历史时间序列数据的数据集。同样，您可以为可能想要预测的指标（例如收入、现金流和销售额）创建目标时间序列数据集。
+ 相关时间序列 – 与目标时间序列数据相关的时间序列数据。例如，价格与产品销售数据相关，因此您可以将其作为相关时间序列提供。
+ 项目元数据 – 适用于目标时间序列数据的元数据。例如，如果您预测特定产品的销售额，则该产品的属性（例如品牌、颜色和流派）将成为项目元数据的一部分。当预测 EC2 实例的 EC2 容量时，元数据可能包含实例类型的 CPU 和内存。

对于每个数据集类型，您的输入数据必须包含某些必填字段。您还可以包含 Amazon Forecast 建议您包含的可选字段。

以下示例演示如何选择数据集域和相应的数据集类型。

**Example 示例 1：RETAIL 域中的数据集类型**  
如果您是对预测商品需求感兴趣的零售商，则可以在 RETAIL 域中创建以下数据集：  
+ 目标时间序列是每个商品（零售商出售的每个产品）的历史时间序列需求（销售）的必需数据集。在 RETAIL 域中，此数据集类型要求数据集包含 `item_id`、`timestamp` 和 `demand` 字段。`demand` 字段是预测目标，并且通常是零售商在某个特定周或日内出售的商品的数量。
+ （可选）相关时间序列类型的数据集。在 RETAIL 域中，此类型可包含可选但建议的时间序列信息，例如 `price`、`inventory_onhand` 和 `webpage_hits`。
+ （可选）项目元数据类型的数据集。在 RETAIL 域中，Amazon Forecast 建议提供与您在目标时间序列中提供的商品相关的元数据信息，如 `brand`、`color`、`category` 和 `genre`。

**Example 示例 2：METRICS 域中的数据集类型**  
如果您想预测组织的关键指标（例如收入、销售额和现金流），可以向 Amazon Forecast 提供以下数据集：  
+ 为要预测的指标提供历史时间序列数据的目标时间序列数据集。如果您的兴趣是预测您组织中所有业务部门的收入，您可以使用 `metric`、`business unit` 和 `metric_value` 字段创建 `target time series` 数据集。
+ 如果您有针对不需要的每个指标的任何元数据（如 `category` 或`location`），则可以提供相关时间序列和项目元数据类型的数据集。
您至少必须提供一个目标时间序列数据集，以便 Forecast 为您的目标指标生成预测。

**Example 示例 3：CUSTOM 域中的数据集类型**  
您的预测应用程序的训练数据可能不适合任何 Amazon Forecast 域。在这种情况下，请选择 CUSTOM 域。您必须提供目标时间序列数据集，但可以添加您自己的自定义字段。  
[入门](getting-started.md)练习预测了某个客户端的用电量。用电量训练数据不适合任何数据集域，因此我们使用了 CUSTOM 域。在该练习中，我们仅使用一个数据集类型 - 目标时间序列类型。我们将数据字段映射到数据集类型所需的最少数量的字段。

# RETAIL 域
<a name="retail-domain"></a>

RETAIL 域支持以下数据集类型。对于每个数据集类型，我们列出了必填字段和可选字段。有关如何将字段映射到您的训练数据中的列的信息，请参阅[数据集域和数据集类型](howitworks-datasets-groups.md#howitworks-dataset-domainstypes)。

**Topics**
+ [目标时间序列数据集类型](#target-time-series-type-retail-domain)
+ [相关时间序列数据集类型](#related-time-series-type-retail-domain)
+ [项目元数据数据集类型](#item-metadata-type-retail-domain)

## 目标时间序列数据集类型
<a name="target-time-series-type-retail-domain"></a>

目标时间序列是零售组织出售的每个商品或产品的历史时间序列数据。以下字段是必填字段：
+ `item_id `（字符串）– 要为其预测需求的商品或产品的唯一标识符。
+ `timestamp`（时间戳）
+ `demand`（浮点数）– 商品在此时间戳处的销售量。这也是 Amazon Forecast 为其生成预测的*目标* 字段。

下面的维度是可选的，可用于更改预测粒度：
+ `location`（字符串）– 出售商品的商店的位置。仅当您有多个商店/位置时，才应使用此选项。

理想情况下，应仅包含这些必填字段和可选维度。其他附加时间序列信息应包含在相关时间序列数据集中。

## 相关时间序列数据集类型
<a name="related-time-series-type-retail-domain"></a>

您可以为 Amazon Forecast 提供相关时间序列数据集，例如价格或商品在特定日期获得的 Web 点击量。您提供的信息越多，预测就越准确。以下字段是必填字段：
+ `item_id `（字符串）
+ `timestamp `（时间戳）

以下字段是可选字段，对于改进预测结果可能有所帮助：
+ `price`（浮点数）– 商品在时间戳的时间处的价格。
+ `promotion_applied`（整数；1=true，0=false）– 用于指示商品在时间戳处是否有营销促销的标记。

除了必填字段和建议的可选字段之外，您的训练数据还可以包含其他字段。要在数据集中包含其他字段，请在创建数据集时在架构中提供这些字段。

## 项目元数据数据集类型
<a name="item-metadata-type-retail-domain"></a>

此数据集为 Amazon Forecast 提供了正在为其预测需求的商品的元数据（属性）的相关信息。以下字段是必填字段：
+ `item_id `（字符串）

以下字段是可选字段，对于改进预测结果可能有所帮助：
+ `category`（字符串）
+ `brand`（字符串）
+ `color`（字符串）
+ `genre`（字符串）

除了必填字段和建议的可选字段之外，您的训练数据还可以包含其他字段。要在数据集中包含其他字段，请在创建数据集时在架构中提供这些字段。

# CUSTOM 域
<a name="custom-domain"></a>

CUSTOM 域支持以下数据集类型。对于每个数据集类型，我们列出了必填字段和可选字段。有关如何将字段映射到您的训练数据中的列的信息，请参阅[数据集域和数据集类型](howitworks-datasets-groups.md#howitworks-dataset-domainstypes)。

**Topics**
+ [目标时间序列数据集类型](#target-time-series-type-custom-domain)
+ [相关时间序列数据集类型](#related-time-series-type-custom-domain)
+ [项目元数据数据集类型](#item-metadata-type-custom-domain)

## 目标时间序列数据集类型
<a name="target-time-series-type-custom-domain"></a>

以下字段是必填字段：
+ `item_id `（字符串）
+ `timestamp`（时间戳）
+ `target_value`（浮点整数）– 这是 Amazon Forecast 为其生成预测的 `target` 字段。

理想情况下，应仅包括这些必填字段。其他附加时间序列信息应包含在相关时间序列数据集中。

## 相关时间序列数据集类型
<a name="related-time-series-type-custom-domain"></a>

以下字段是必填字段：
+ `item_id`（字符串）
+ `timestamp`（时间戳）

除了必填字段之外，您的训练数据还可以包含其他字段。要在数据集中包含其他字段，请在创建数据集时在架构中提供这些字段。

## 项目元数据数据集类型
<a name="item-metadata-type-custom-domain"></a>

以下字段是必填字段：
+ `item_id`（字符串）

以下字段是可选字段，可能有助于改进预测结果：
+ `category`（字符串）

除了必填字段和建议的可选字段之外，您的训练数据还可以包含其他字段。要在数据集中包含其他字段，请在创建数据集时在架构中提供这些字段。

# INVENTORY\$1PLANNING 域
<a name="inv-planning-domain"></a>

使用 INVENTORY\$1PLANNING 域预测原材料的需求并确定要存货的特定商品的库存量。它支持以下数据集类型。对于每个数据集类型，我们列出了必填字段和可选字段。有关如何将字段映射到您的训练数据中的列的信息，请参阅[数据集域和数据集类型](howitworks-datasets-groups.md#howitworks-dataset-domainstypes)。

**Topics**
+ [目标时间序列数据集类型](#target-time-series-type-inv-planning-domain)
+ [相关时间序列数据集类型](#related-time-series-type-related-time-series-domain)
+ [项目元数据数据集类型](#item-metadata-type-related-time-series-domain)

## 目标时间序列数据集类型
<a name="target-time-series-type-inv-planning-domain"></a>

以下字段是必填字段：
+ `item_id`（字符串）
+ `timestamp`（时间戳）
+ `demand`（浮点数）– 这是 Amazon Forecast 为其生成预测的 `target` 字段。

下面的维度是可选的，可用于更改预测粒度：
+ `location`（字符串）– 储存商品的配送中心的位置。仅当您有多个商店/位置时，才应使用此选项。

理想情况下，应仅包含这些必填字段和可选维度。其他附加时间序列信息应包含在相关时间序列数据集中。

## 相关时间序列数据集类型
<a name="related-time-series-type-related-time-series-domain"></a>

以下字段是必填字段：
+ `item_id`（字符串）
+ `timestamp`（时间戳）

以下字段是可选字段，对于改进预测结果可能有所帮助：
+ `price`（浮点数）– 商品的价格 

除了必填字段和建议的可选字段之外，您的训练数据还可以包含其他字段。要在数据集中包含其他字段，请在创建数据集时在架构中提供这些字段。

## 项目元数据数据集类型
<a name="item-metadata-type-related-time-series-domain"></a>

以下字段是必填字段：
+ `item_id`（字符串）

以下字段是可选字段，对于改进预测结果可能有所帮助：
+ `category`（字符串）– 商品的类别。
+ `brand`（字符串）– 商品的品牌。
+ `lead_time`（字符串）– 制造商品的前期时间（天）。
+ `order_cycle`（字符串）– 订购周期在工作开始时开始，在商品准备好交货时结束。
+ `safety_stock`（字符串）– 要为商品保留的最小库存量。

除了必填字段和建议的可选字段之外，您的训练数据还可以包含其他字段。要在数据集中包含其他字段，请在创建数据集时在架构中提供这些字段。

# EC2 CAPACITY 域
<a name="ec2-capacity-domain"></a>

使用 EC2 CAPACITY 域预测 Amazon EC2 容量。它支持以下数据集类型。对于每个数据集类型，我们列出了必填字段和可选字段。有关如何将字段映射到您的训练数据中的列的信息，请参阅[数据集域和数据集类型](howitworks-datasets-groups.md#howitworks-dataset-domainstypes)。

## 目标时间序列数据集类型
<a name="target-time-series-type-ec2-capacity-domain"></a>

以下字段是必填字段：
+ `instance_type`（字符串）– 实例的类型（例如，c5.xlarge）。
+ `timestamp`（时间戳）
+ `number_of_instances`（整数）– 在时间戳处使用的该特定实例类型的实例数。这是 Amazon Forecast 为其生成预测的 `target` 字段。

下面的维度是可选的，可用于更改预测粒度：
+ `location`（字符串）— 你可以提供一个 AWS 区域，比如 us-west-2 或 us-east-1。只有在您对多个区域进行建模时，才应使用此项。

理想情况下，应仅包含这些要求和建议的可选字段。其他附加时间序列信息应包含在相关时间序列数据集中。

## 相关时间序列数据集类型
<a name="related-time-series-type-ec2-capacity-domain"></a>

以下字段是必填字段：
+ `instance_type`（字符串）
+ `timestamp`（时间戳）

除了必填字段之外，您的训练数据还可以包含其他字段。要在数据集中包含其他字段，请在创建数据集时在架构中提供这些字段。

# WORK\$1FORCE 域
<a name="workforce-domain"></a>

使用 WORK\$1FORCE 域预测劳动力需求。它支持以下数据集类型。对于每个数据集类型，我们列出了必填字段和可选字段。有关如何将字段映射到您的训练数据中的列的信息，请参阅[数据集域和数据集类型](howitworks-datasets-groups.md#howitworks-dataset-domainstypes)。

**Topics**
+ [目标时间序列数据集类型](#target-time-series-type-workforce-domain)
+ [相关时间序列数据集类型](#related-time-series-type-workforce-domain)
+ [项目元数据数据集类型](#item-metadata-type-workforce-domain)

## 目标时间序列数据集类型
<a name="target-time-series-type-workforce-domain"></a>

以下字段是必填字段：
+ `workforce_type`（字符串）– 正被预测的劳动力的类型。例如，呼叫中心需求或履行中心劳动力需求。
+ `timestamp`（时间戳）
+ `workforce_demand`（浮点整数）– 这是 Amazon Forecast 为其生成预测的 `target` 字段。

下面的维度是可选的，可用于更改预测粒度：
+ `location`（字符串）– 寻找劳动力资源的位置。如果您有多个商店/位置，则应使用此项。

理想情况下，应仅包含这些必填字段和可选维度。其他附加时间序列信息应包含在相关时间序列数据集中。

## 相关时间序列数据集类型
<a name="related-time-series-type-workforce-domain"></a>

以下字段是必填字段：
+ `workforce_type`（字符串）
+ `timestamp`（时间戳）

除了必填字段之外，您的训练数据还可以包含其他字段。要在数据集中包含其他字段，请在创建数据集时在架构中提供这些字段。

## 项目元数据数据集类型
<a name="item-metadata-type-workforce-domain"></a>

以下字段是必填字段：
+ `workforce_type`（字符串）

以下字段是可选字段，对于改进预测结果可能有所帮助：
+ `wages`（浮点数）– 该特定劳动力类型的平均薪资。
+ `shift_length`（字符串）– 班次的长度。
+ `location`（字符串）– 劳动力的位置。

除了必填字段和建议的可选字段之外，您的训练数据还可以包含其他字段。要在数据集中包含其他字段，请在创建数据集时在架构中提供这些字段。

# WEB\$1TRAFFIC 域
<a name="webtraffic-domain"></a>

使用 WEB\$1TRAFFIC 域预测流至一个 Web 属性或一组 Web 属性的 Web 流量。它支持以下数据集类型。相关主题描述了该数据集类型支持的必填字段和可选字段。有关如何将这些字段映射到您的训练数据中的列的信息，请参阅[数据集域和数据集类型](howitworks-datasets-groups.md#howitworks-dataset-domainstypes)。

**Topics**
+ [目标时间序列数据集类型](#target-time-series-type-webtraffic-domain)
+ [相关时间序列数据集类型](#related-time-series-type-webtraffic-domain)

## 目标时间序列数据集类型
<a name="target-time-series-type-webtraffic-domain"></a>

以下字段是必填字段：
+ `item_id`（字符串）– 正被预测的每个 Web 属性的唯一标识符。
+ `timestamp`（时间戳）
+ `value`（浮点数）– 这是 Amazon Forecast 为其生成预测的 `target` 字段。

理想情况下，应仅包括这些必填字段。其他附加时间序列信息应包含在相关时间序列数据集中。

## 相关时间序列数据集类型
<a name="related-time-series-type-webtraffic-domain"></a>

以下字段是必填字段：
+ `item_id`（字符串）
+ `timestamp`（时间戳）

除了必填字段之外，您的训练数据还可以包含其他字段。要在数据集中包含其他字段，请在创建数据集时在架构中提供这些字段。

### 项目元数据数据集类型
<a name="idem-metadata-type-webtraffic-domain"></a>

以下字段是必填字段：
+ `item_id`（字符串）

以下字段是可选字段，可能有助于改进预测结果：
+ `category`（字符串）

除了必填字段和建议的可选字段之外，您的训练数据还可以包含其他字段。要在数据集中包含其他字段，请在创建数据集时在架构中提供这些字段。

# METRICS 域
<a name="metrics-domain"></a>

使用 METRICS 域预测指标，如收入、销售额和现金流。它支持以下数据集类型。对于每个数据集类型，我们列出了必填字段和可选字段。有关如何将字段映射到您的训练数据中的列的信息，请参阅[数据集域和数据集类型](howitworks-datasets-groups.md#howitworks-dataset-domainstypes)。

**Topics**
+ [目标时间序列数据集类型](#target-time-series-type-metrics-domain)
+ [相关时间序列数据集类型](#related-time-series-type-metrics-domain)
+ [项目元数据数据集类型](#item-metadata-type-metrics-domain)

## 目标时间序列数据集类型
<a name="target-time-series-type-metrics-domain"></a>

以下字段是必填字段：
+ `metric_name`（字符串）
+ `timestamp`（时间戳）
+ `metric_value`（浮点整数）– 这是 Amazon Forecast 为其生成预测的 `target` 字段（例如，特定一天内所产生的收入量）。

理想情况下，应仅包括这些必填字段。其他附加时间序列信息应包含在相关时间序列数据集中。

## 相关时间序列数据集类型
<a name="related-time-series-type-metrics-domain"></a>

以下字段是必填字段：
+ `metric_name`（字符串）
+ `timestamp`（时间戳）

除了必填字段之外，您的训练数据还可以包含其他字段。要在数据集中包含其他字段，请在创建数据集时在架构中提供这些字段。

## 项目元数据数据集类型
<a name="item-metadata-type-metrics-domain"></a>

以下字段是必填字段：
+ `metric_name`（字符串）

以下字段是可选字段，可能有助于改进预测结果：
+ `category`（字符串）

除了必填字段和建议的可选字段之外，您的训练数据还可以包含其他字段。要在数据集中包含其他字段，请在创建数据集时在架构中提供这些字段。