

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Preparar dados de treinamento do classificador
<a name="prep-classifier-data"></a>

Para classificação personalizada, você treina o modelo no modo multiclasse ou no modo com vários rótulos. Multi-class mode associa uma única classe a cada documento. Multi-label mode associa uma ou mais classes a cada documento. Os formatos de arquivo de entrada são diferentes para cada modo, então escolha o modo a ser usado antes de criar os dados de treinamento. 

**nota**  
O console do Amazon Comprehend se refere ao modo multiclasse como modo de rótulo único.

A classificação personalizada é compatível com modelos que você treina com documentos sem formatação e modelos treinados com documentos originais (como PDF, Word ou imagens). Para mais informações sobre modelos de classificadores e seus tipos de documentos compatíveis, consulte [Modelos de classificação de treinamento](training-classifier-model.md).

Preparar dados para treinar um modelo de classificador personalizado: 

1. Identifique as classes que você deseja que esse classificador analise. Decida qual modo usar (multiclasse ou multirrótulo).

1. Decida o tipo de modelo do classificador, com base no modelo ter o fim de analisar documentos de texto simples ou documentos semiestruturados. 

1. Reúna exemplos de documentos para cada uma das classes. Para obter os requisitos mínimos de treinamento, consulte[Cotas gerais para classificação de documentos](guidelines-and-limits.md#limits-class-general).

1. Para um modelo de texto sem formatação, escolha o formato de arquivo de treinamento a ser usado (arquivo CSV ou arquivo de manifesto aumentado). Para treinar um modelo de documento nativo, você sempre usa um arquivo CSV. 

**Topics**
+ [Formatos de arquivo de treinamento do classificador](prep-class-data-format.md)
+ [Multi-class modo](prep-classifier-data-multi-class.md)
+ [Multi-label modo](prep-classifier-data-multi-label.md)