

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 項目資料集結構描述需求 （自訂）
<a name="item-dataset-requirements"></a>

 *項目資料集*會將項目的中繼資料存放在您的目錄中。這可能包括每個項目的價格、類型和可用性等資訊。如需可匯入 Amazon Personalize 的項目資料類型資訊，請參閱 [項目中繼資料](items-datasets.md)。

 您為每個項目提供的資料必須符合您的項目資料集結構描述。您必須為每個項目提供項目 ID （長度上限為 256 個字元）。根據您的結構描述，項目中繼資料可以包含空值/空值。您的結構描述必須至少有一個中繼資料欄位，但如果您新增`null`類型，則項目的這個值可以是 null。您可以根據您的使用案例和資料，自由新增其他欄位。只要欄位未列為必要或預留，且資料類型列於 中[結構描述資料類型](how-it-works-dataset-schema.md#personalize-datatypes)，欄位名稱和資料類型將由您決定。

 若要使用分類資料，請在結構描述`true`中新增 類型的欄位，`string`並將欄位的分類屬性設定為 。然後在大量 CSV 檔案和個別項目匯入中包含分類資料。分類值最多可有 1000 個字元。如果您有類別值超過 1000 個字元的項目，您的資料集匯入任務將會失敗。

 對於具有多個類別的項目，請使用垂直長條 '\|' 分隔每個值。例如，對於 GENRES 欄位，項目的資料可能是 `Action|Crime|Biopic`。如果您有多個層級的分類資料，而且有些項目在階層中的每個層級都有多個類別，請為每個層級新增欄位，並在每個欄位名稱後面附加層級指標：GENRES、GENRE\_L2、GENRE\_L3。這可讓您根據子類別篩選建議，即使項目屬於多個多層類別 （如需建立和使用篩選條件的資訊，請參閱 [篩選建議和使用者客群](filter.md))。例如，影片可能具有每個類別層級的下列資料：
+ GENRES：Action\|Adventure
+ GENRE\_L2：Criming\|Western
+ GENRE\_L3：生物特性

在此範例中，影片位於動作 > 犯罪 > 生物特徵階層*和*冒險 > 西部 > 生物特徵階層中。我們建議最多只使用 L3，但如有必要，您可以使用更多關卡。

在模型訓練期間，Amazon Personalize 會考慮最多 750，000 個項目。如果您匯入超過 750，000 個項目，Amazon Personalize 會決定要在訓練中包含哪些項目，重點是包含新項目 （您最近新增但未互動的項目） 和具有最近互動資料的現有項目。

 如需項目資料集最低需求和最高資料限制的詳細資訊，請參閱 [Service Quotas](limits.md#limits-table)。

## 項目資料集結構描述範例 （自訂）
<a name="schema-examples-items"></a>

下列範例示範如何建構項目結構描述。`ITEM_ID` 欄位是必要的。`GENRE` 欄位是分類中繼資料，而 `DESCRIPTION` 欄位是文字中繼資料。至少需要一個中繼資料欄位。您最多可以新增 100 個中繼資料欄位。`CREATION_TIMESTAMP` 欄位是預留關鍵字。如需結構描述需求的資訊，請參閱 [自訂資料集和結構描述需求](custom-datasets-and-schemas.md#dataset-requirements)。

```
{
  "type": "record",
  "name": "Items",
  "namespace": "com.amazonaws.personalize.schema",
  "fields": [
    {
      "name": "ITEM_ID",
      "type": "string"
    },
    {
      "name": "GENRES",
      "type": [
        "null",
        "string"
      ],
      "categorical": true
    },
    {
      "name": "CREATION_TIMESTAMP",
      "type": "long"
    },
    {
      "name": "DESCRIPTION",
      "type": [
        "null",
        "string"
      ],
      "textual": true
    }
  ],
  "version": "1.0"
}
```

在此結構描述中，CSV 檔案中的前幾行歷史資料可能如下所示。

```
ITEM_ID,GENRES,CREATION_TIMESTAMP,DESCRIPTION
1,Adventure|Animation|Children|Comedy|Fantasy,1570003267,"This is an animated movie that features action, comedy, and fantasy. Audience is children. This movie was released in 2004."
2,Adventure|Children|Fantasy,1571730101,"This is an adventure movie with elements of fantasy. Audience is children. This movie was release in 2010."
3,Comedy|Romance,1560515629,"This is a romantic comedy. The movie was released in 1999. Audience is young women."
4,Comedy|Drama|Romance,1581670067,"This movie includes elements of both comedy and drama as well as romance. This movie was released in 2020."
...
...
```