

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 自訂資料集和結構描述
<a name="custom-datasets-and-schemas"></a>

當您建立自訂資料集群組時，您會從頭開始建立自己的結構描述。自訂資料集群組資料集和結構描述具有較少的必要欄位和更多彈性。下列主題說明自訂資料集群組之資料集的結構描述和資料需求。每個資料集區段都會列出資料集類型的必要資料，並提供結構描述的 JSON 範例。

如需有關您可以匯入 Amazon Personalize 的資料類型的資訊，請參閱 [Amazon Personalize 可以使用的資料類型](datasets.md)。如需有關一般 Amazon Personalize 結構描述要求的資訊，例如格式化要求和可用的欄位資料類型，請參閱 [為 Amazon Personalize 結構描述建立結構描述 JSON 檔案](how-it-works-dataset-schema.md)。這些要求適用於所有 Amazon Personalize 結構描述。

**Topics**
+ [自訂資料集和結構描述需求](#dataset-requirements)
+ [項目互動資料集結構描述要求 （自訂）](interactions-dataset-requirements.md)
+ [使用者資料集結構描述要求 （自訂）](user-dataset-requirements.md)
+ [項目資料集結構描述需求 （自訂）](item-dataset-requirements.md)
+ [動作資料集結構描述需求 （自訂）](action-dataset-requirements.md)
+ [動作互動資料集結構描述要求 （自訂）](action-interactions-dataset-requirements.md)

## 自訂資料集和結構描述需求
<a name="dataset-requirements"></a>

當您為自訂資料集群組建立資料集時，每個資料集類型都有下列必要欄位，以及具有必要資料類型的預留關鍵字。


| 資料集類型 | 必要欄位 | 保留的關鍵字 | 
| --- | --- | --- | 
| 項目互動 ([結構描述範例](interactions-dataset-requirements.md#schema-examples-interactions)) | USER\_ID (`string`)<br />ITEM\_ID (`string`)<br />TIMESTAMP (`long`) | EVENT\_TYPE (`string`)<br />EVENT\_VALUE (`float`、`null`)<br />印象 (`string`、`null`)<br />RECOMMENDATION\_ID (`string`、`null`)<br />EVENT\_ATTRIBUTION\_SOURCE (`string`、`null`) | 
| 使用者 ([結構描述範例](user-dataset-requirements.md#schema-examples-users)) | USER\_ID (`string`)<br />1 個中繼資料欄位 （分類`string`或數值） |  | 
| 項目 ([結構描述範例](item-dataset-requirements.md#schema-examples-items)) | ITEM\_ID (`string`)<br />1 個中繼資料欄位 （分類或文字`string`欄位或數值欄位） | CREATION\_TIMESTAMP (`long`) | 
| 動作 ([結構描述範例](action-dataset-requirements.md#schema-examples-actions)) | ACTION\_ID (`string`)<br />1 個中繼資料欄位 （分類`string`或數值） | CREATION\_TIMESTAMP (`long`)<br />VALUE (`long`、`null`)<br />TYPE (`string`、`null`)<br />EXPIRATION\_TIMESTAMP (`long`、`null`)<br />REPEAT\_FREQUENCY (`long`、`null`) | 
| 動作互動 ([結構描述範例](action-interactions-dataset-requirements.md#schema-examples-action-interactions)) | USER\_ID (`string`)<br />ACTION\_ID (`string`)<br />EVENT\_TYPE (`string`)<br />TIMESTAMP (`long`) | 印象 (`string`、`null`)<br />RECOMMENDATION\_ID (`string`、`null`) | 

### 中繼資料欄位
<a name="metadata-fields"></a>

中繼資料包含非必要或不使用預留關鍵字的字串或非字串欄位。中繼資料結構描述具有下列限制：
+ 使用者、項目和動作結構描述至少需要一個中繼資料欄位。
+ 您可以為使用者結構描述新增最多 25 個中繼資料欄位、為項目結構描述新增 100 個中繼資料欄位，以及為動作結構描述新增 10 個中繼資料欄位。
+ 如果您新增自己的中繼資料欄位類型 `string`，則必須包含 `categorical` 屬性或 `textual` 屬性 （僅限具有文字屬性的項目結構描述支援欄位）。否則，Amazon Personalize 在訓練模型時不會使用 欄位。

### 保留的關鍵字
<a name="reserved-keywords"></a>

預留關鍵字是選用的非中繼資料欄位。這些欄位被視為預留，因為您必須在使用它們時將欄位定義為其必要資料類型，而且關鍵字無法用作資料中的值。預留類別字串欄位必須`categorical`設定為 `true`，而預留字串欄位不能是類別。以下是預留關鍵字：
+ EVENT\_TYPE：對於具有一或多個事件類型的項目互動資料集，例如*點選*和*下載*，請使用 `EVENT_TYPE` 欄位。您必須將 EVENT\_TYPE 欄位定義為 `string`，且無法設定為分類。
+ EVENT\_VALUE：對於包含事件值資料的項目互動資料集，例如使用者觀看的影片百分比，請使用具有 類型 `float`和選用 `EVENT_VALUE`的欄位`null`。
+  CREATION\_TIMESTAMP：對於具有每個項目建立日期時間戳記的項目或動作資料集，請使用類型為 `CREATION_TIMESTAMP`的欄位`long`。Amazon Personalize 使用`CREATION_TIMESTAMP`資料來計算項目的存留期，並相應地調整建議。請參閱 [建立時間戳記資料](items-datasets.md#creation-timestamp-data)。
+  IMPRESSION：對於具有明確印模資料的項目互動資料集，請使用具有類型 `String`和選用類型 `IMPRESSION`的欄位`null`。印模是使用者與特定項目互動 （例如，點按或觀看） 時可見的項目清單。如需詳細資訊，請參閱[印象資料](interactions-datasets.md#interactions-impressions-data)。
+  RECOMMENDATION\_ID：對於使用先前建議做為隱含印模資料的項目互動資料集，選擇性地使用具有類型 `String`和選擇性類型 `RECOMMENDATION_ID`的欄位`null`。

  您不需要為 Amazon Personalize 新增`RECOMMENDATION_ID`欄位，即可在產生建議時使用隱含印模。您可以在[PutEvents](API_UBS_PutEvents.md)操作`recommendationId`中傳遞 而不需要它。如需詳細資訊，請參閱[印象資料](interactions-datasets.md#interactions-impressions-data)。
+ 值：對於動作資料集，如果您有部分或全部動作的資料值，請將`VALUE`欄位新增至結構描述。對於其類型，請使用 `long`，並選擇性地輸入 `null`。如需動作及其值的詳細資訊，請參閱 [值資料](actions-datasets.md#action-value-data)。
+ ACTION\_EXPIRATION\_TIMESTAMP：對於動作資料集，如果您有部分或全部動作的過期時間戳記，請將`ACTION_EXPIRATION_TIMESTAMP`欄位新增至結構描述。對於其類型，請使用 `long`，並選擇性地輸入 `null`。如需過期時間戳記的詳細資訊，請參閱 [動作過期時間戳記資料](actions-datasets.md#action-expiration-timestamp-data)。
+ REPEAT\_FREQUENCY：對於動作資料集，如果您有部分或全部動作的重複頻率資料，請將`REPEAT_FREQUENCY`欄位新增至結構描述。對於其類型，請使用 `long`，並選擇性地輸入 `null`。如需重複頻率資料的詳細資訊，請參閱 [重複頻率資料](actions-datasets.md#action-repeat-frequency)。