

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Importation de données d'entraînement
<a name="create-ml-model-training-data"></a>

**Note**  
Vous pouvez uniquement fournir un ensemble de données d'entraînement à utiliser dans un modèle similaire à Clean Rooms ML dont les données sont stockées dans Amazon S3. Toutefois, vous pouvez fournir les données de départ d'un modèle similaire à l'aide de SQL qui analyse les données stockées dans n'importe quelle source de données prise en charge. 

Avant de créer un modèle similaire, vous devez spécifier la AWS Glue table contenant les données d'entraînement. Clean Rooms ML ne stocke pas de copie de ces données, mais uniquement des métadonnées qui lui permettent d'accéder aux données.

**Pour importer des données d'entraînement dans AWS Clean Rooms**

1. Connectez-vous à la [AWS Clean Rooms console AWS Management Console et ouvrez-la](https://console.aws.amazon.com/cleanrooms/home) avec votre Compte AWS (si ce n'est pas encore fait).

1. Dans le volet de navigation de gauche, choisissez **AWS ML models**.

1. Dans l'onglet **Ensembles de données d'entraînement**, choisissez **Créer un jeu de données d'entraînement**.

1. Sur la page **Créer un jeu de données d'entraînement**, pour les **détails du jeu de données d'entraînement**, entrez un **nom** et une **description** facultative.

1. Choisissez la **source de données d'entraînement** en sélectionnant la **base de données** et la **table** que vous souhaitez configurer dans les listes déroulantes.
**Note**  
Pour vérifier que ce tableau est correct, effectuez l'une des opérations suivantes :  
Choisissez **Afficher dans AWS Glue**.
Activez **Afficher le schéma** pour afficher le schéma.

1. Pour les **détails de la formation**, choisissez la **colonne Identifiant utilisateur, la colonne** **Identifiant de l'article et la colonne** **Horodatage dans** les listes déroulantes. Les données d'entraînement doivent contenir ces trois colonnes. Vous pouvez également sélectionner les autres colonnes que vous souhaitez inclure dans les données d'entraînement.

   Les données de la **colonne Horodatage** doivent être au format Unix Epoch en secondes.

1. (Facultatif) Si vous avez **des colonnes supplémentaires à entraîner**, choisissez le **nom et le **type** de colonne** dans les listes déroulantes.

1. Dans **Accès aux services**, vous devez spécifier un rôle de service qui peut accéder à vos données et fournir une clé KMS si vos données sont chiffrées. Choisissez **Créer et utiliser un nouveau rôle de service** et Clean Rooms ML créera automatiquement un rôle de service et ajoutera la politique d'autorisation nécessaire. Choisissez **Utiliser un rôle de service existant** et saisissez-le dans le champ **Nom du rôle** de service si vous souhaitez utiliser un rôle de service spécifique.

   Si vos données sont chiffrées, entrez votre clé KMS dans le **AWS KMS key**champ ou cliquez sur **Créer une AWS KMS key** pour générer une nouvelle clé KMS.

1. Si vous souhaitez activer les **balises** pour le jeu de données d'entraînement, choisissez **Ajouter une nouvelle balise**, puis entrez la paire ****clé/valeur****. 

1. Choisissez **Créer un jeu de données d'entraînement**. 

Pour l'action d'API correspondante, consultez [CreateTrainingDataset](https://docs.aws.amazon.com/cleanrooms-ml/latest/APIReference/API_CreateTrainingDataset.html).