

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Preparación de los datos de entrenamiento del clasificador
<a name="prep-classifier-data"></a>

Para una clasificación personalizada, se entrena el modelo en el modo multiclase o en el modo multietiqueta. Multi-class el modo asocia una sola clase a cada documento. Multi-label el modo asocia una o más clases a cada documento. Los formatos de archivo de entrada son diferentes para cada modo, por lo que debe elegir el modo que desea utilizar antes de crear los datos de entrenamiento. 

**nota**  
La consola Amazon Comprehend se refiere al modo multiclase como modo de etiqueta única.

La clasificación personalizada admite los modelos que se entrenan con documentos de texto sin formato y los modelos que se entrenan con documentos nativos (como PDF, Word o imágenes). Para obtener más información sobre los modelos de clasificadores y los tipos de documentos compatibles, consulte [Modelos de clasificación de entrenamiento](training-classifier-model.md).

Cómo preparar los datos para entrenar un modelo de clasificador personalizado: 

1. Identifique las clases que desea que analice este clasificador. Decida qué modo utilizar (multiclase o multietiqueta).

1. Decida el tipo de modelo de clasificador, en función de si el modelo es para analizar documentos de texto sin formato o documentos semiestructurados. 

1. Reúna ejemplos de documentos para cada una de las clases. Para conocer los requisitos mínimos del entrenamiento, consulte [Cuotas generales para la clasificación de documentos](guidelines-and-limits.md#limits-class-general).

1. Para un modelo de texto sin formato, elija el formato de archivo de entrenamiento que desee utilizar (archivo CSV o archivo de manifiesto aumentado). Para entrenar un modelo de documento nativo, siempre debe utilizar un archivo CSV. 

**Topics**
+ [Formatos de archivos de entrenamiento del clasificador](prep-class-data-format.md)
+ [Multi-class modo](prep-classifier-data-multi-class.md)
+ [Multi-label modo](prep-classifier-data-multi-label.md)