

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 準備分類器訓練資料
<a name="prep-classifier-data"></a>

對於自訂分類，您可以在多類別模式或多標籤模式中訓練模型。多類別模式會將單一類別與每個文件建立關聯。多標籤模式會將一或多個類別與每個文件建立關聯。每個模式的輸入檔案格式都不同，因此請在建立訓練資料之前選擇要使用的模式。

**注意**  
Amazon Comprehend 主控台將多類別模式稱為單一標籤模式。

自訂分類支援您使用純文字文件訓練的模型，以及您使用原生文件訓練的模型 （例如 PDF、Word 或影像）。如需分類器模型及其支援的文件類型的詳細資訊，請參閱 [訓練分類模型](training-classifier-model.md)。

若要準備資料以訓練自訂分類器模型：

1. 識別您希望此分類器分析的類別。決定要使用的模式 （多類別或多標籤）。

1. 根據模型是否用於分析純文字文件或半結構化文件，決定分類器模型類型。

1. 收集每個類別的文件範例。如需最低訓練需求，請參閱 [文件分類的一般配額](guidelines-and-limits.md#limits-class-general)。

1. 對於純文字模型，選擇要使用的訓練檔案格式 (CSV 檔案或擴增資訊清單檔案）。若要訓練原生文件模型，請一律使用 CSV 檔案。

**Topics**
+ [分類器訓練檔案格式](prep-class-data-format.md)
+ [多類別模式](prep-classifier-data-multi-class.md)
+ [多標籤模式](prep-classifier-data-multi-label.md)