

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Importación de datos de entrenamiento
<a name="create-ml-model-training-data"></a>

**nota**  
Solo puede proporcionar un conjunto de datos de entrenamiento para usarlo en un modelo similar a Clean Rooms ML que tenga datos almacenados en Amazon S3. Sin embargo, puede proporcionar los datos iniciales para un modelo similar mediante SQL que agrupe los datos almacenados en cualquier fuente de datos compatible. 

Antes de crear un modelo similar, debe especificar la AWS Glue tabla que contiene los datos de entrenamiento. Clean Rooms ML no almacena una copia de estos datos, solo los metadatos que le permiten acceder a los datos.

**Para importar los datos de entrenamiento en AWS Clean Rooms**

1. Inicia sesión Consola de administración de AWS y abre la [AWS Clean Rooms consola](https://console.aws.amazon.com/cleanrooms/home) con tu Cuenta de AWS (si aún no lo has hecho).

1. En el panel de navegación izquierdo, selecciona **los modelos AWS ML**.

1. En la pestaña **Conjuntos de datos de entrenamiento**, seleccione **Crear conjunto de datos de entrenamiento**.

1. En la página **Crear conjunto de datos de entrenamiento**, en los **detalles del conjunto de datos de entrenamiento**, ingrese un **nombre** y, de forma opcional, una **descripción**.

1. Elija el **origen de datos de entrenamiento** seleccionando la **base de datos** y la **tabla** que desee configurar en las listas desplegables.
**nota**  
Para comprobar que se trata de la tabla correcta, realice una de las siguientes acciones:  
Seleccione **Ver en AWS Glue**.
Active **Ver esquema** para ver el esquema.

1. Para **Detalles de entrenamiento**, elija la **Columna de identificador de usuario**, la **Columna de identificador de elemento** y la **Columna de marca temporal** de las listas desplegables. Los datos de entrenamiento deben contener estas tres columnas. También puede seleccionar cualquier otra columna que quiera incluir en los datos de entrenamiento.

   Los datos de la **Columna de marca temporal** deben estar en formato de tiempo Unix en formato de segundos.

1. (Opcional) Si tiene **columnas adicionales que entrenar**, elija el **nombre** y el **tipo** de la columna de las listas desplegables.

1. En **Acceso al servicio**, debe especificar un rol de servicio que pueda acceder a los datos y proporcionar una clave de KMS si los datos están cifrados. Elija **Crear y usar un nuevo rol de servicio** y Clean Rooms ML creará automáticamente un rol de servicio y agregará la política de permisos necesaria. Elija **Usar un rol de servicio existente** e ingréselo en el campo **Nombre del rol de servicio** si tiene un rol de servicio específico que quiera usar.

   Si los datos están cifrados, ingrese la clave de KMS en el campo **AWS KMS key** o haga clic en **Crear una AWS KMS key** para generar una nueva clave de KMS.

1. Si desea habilitar la opción de **Etiquetas** para el conjunto de datos de entrenamiento, seleccione **Añadir nueva etiqueta** y, a continuación, introduzca el par de **Clave** y **Valor**. 

1. Elija **Crear el conjunto de datos de entrenamiento**. 

Para ver la acción de API correspondiente, consulte [CreateTrainingDataset](https://docs.aws.amazon.com/cleanrooms-ml/latest/APIReference/API_CreateTrainingDataset.html).