

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Préparation et importation de données en masse à l'aide d'Amazon SageMaker AI Data Wrangler
<a name="preparing-importing-with-data-wrangler"></a>

**Important**  
Lorsque vous utilisez Data Wrangler, vous encourez des coûts liés à l'IA. SageMaker Pour obtenir la liste complète des frais et des prix, consultez l'onglet Data Wrangler des tarifs d'[Amazon SageMaker AI](https://aws.amazon.com/sagemaker/pricing/). Pour éviter d'encourir des frais supplémentaires, arrêtez votre instance Data Wrangler lorsque vous avez terminé. Pour plus d'informations, voir [Arrêter Data Wrangler](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-shut-down.html). 

Après avoir créé un groupe de jeux de données, vous pouvez utiliser Amazon SageMaker AI Data Wrangler (Data Wrangler) pour importer des données provenant de plus de 40 sources dans un ensemble de données Amazon Personalize. Data Wrangler est une fonctionnalité d'Amazon SageMaker AI Studio Classic qui fournit une end-to-end solution pour importer, préparer, transformer et analyser des données. Vous ne pouvez pas utiliser Data Wrangler pour préparer et importer des données dans un ensemble de données Actions ou Action interactions.

 Lorsque vous utilisez Data Wrangler pour préparer et importer des données, vous utilisez un flux de données. Un *flux de données* définit une série d'étapes de préparation des données d'apprentissage automatique, en commençant par l'importation des données. Chaque fois que vous ajoutez une étape à votre flux, Data Wrangler agit sur vos données, par exemple en les transformant ou en générant une visualisation. 

Voici certaines des étapes que vous pouvez ajouter à votre flux pour préparer les données pour Amazon Personalize :
+ **Informations :** vous pouvez ajouter des étapes d'analyse spécifiques à Amazon Personalize à votre flux. Ces informations peuvent vous aider à mieux connaître vos données et les mesures que vous pouvez prendre pour les améliorer.
+ **Visualisations :** vous pouvez ajouter des étapes de visualisation pour générer des graphiques tels que des histogrammes et des nuages de points. Les graphiques peuvent vous aider à détecter les problèmes liés à vos données, tels que les valeurs aberrantes ou les valeurs manquantes.
+ **Transformations :** vous pouvez utiliser les étapes de transformation spécifiques et générales d'Amazon Personalize pour vous assurer que vos données répondent aux exigences d'Amazon Personalize. La transformation Amazon Personalize vous permet de mapper vos colonnes de données aux colonnes requises en fonction du type de jeu de données Amazon Personalize.

Si vous devez quitter Data Wrangler avant d'importer des données dans Amazon Personalize, vous pouvez revenir là où vous vous êtes arrêté en choisissant le même type de jeu de données lorsque vous [lancez Data Wrangler depuis la console Amazon Personalize](dw-launch-dw-from-personalize.md). Vous pouvez également accéder à Data Wrangler directement via SageMaker AI Studio Classic.

 Nous vous recommandons d'importer les données de Data Wrangler dans Amazon Personalize comme suit. Les étapes de transformation, de visualisation et d'analyse sont facultatives, répétables et peuvent être effectuées dans n'importe quel ordre. 

1. **[Configurer les autorisations](dw-data-prep-minimum-permissions.md)** : configurez les autorisations pour Amazon Personalize et les rôles de service SageMaker AI. Et configurez des autorisations pour vos utilisateurs.

1. **[Lancez Data Wrangler dans SageMaker AI Studio Classic depuis la console Amazon Personalize : utilisez la console](dw-launch-dw-from-personalize.md)** Amazon Personalize pour configurer un domaine SageMaker AI et lancez Data Wrangler dans SageMaker AI Studio Classic.

1. **[Importez vos données dans Data Wrangler](dw-import-data.md)** - Importez des données provenant de plus de 40 sources dans Data Wrangler. Les sources incluent AWS des services, tels qu'Amazon Redshift, Amazon EMR ou Amazon Athena, et des tiers tels que Snowflake ou. DataBricks

1. **[Transformez vos données](dw-transform-data.md)** : utilisez Data Wrangler pour transformer vos données afin de répondre aux exigences d'Amazon Personalize.

1. **[Visualisez et analysez vos données](dw-analyze-data.md)** : utilisez Data Wrangler pour visualiser vos données et les analyser grâce à des informations spécifiques d'Amazon Personalize.

1. **[Traitez et importez des données dans Amazon Personalize](dw-export-data.md)** : utilisez un bloc-notes Jupyter SageMaker AI Studio Classic pour importer vos données traitées dans Amazon Personalize.

## Informations supplémentaires
<a name="dw-additional-info"></a>

Les ressources suivantes fournissent des informations supplémentaires sur l'utilisation d'Amazon SageMaker AI Data Wrangler et d'Amazon Personalize.
+ Pour un didacticiel expliquant le traitement et la transformation d'un exemple de jeu de données, consultez [Demo : Data Wrangler Titanic Dataset Walkthrough dans](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-getting-started.html#data-wrangler-getting-started-demo) le guide du développeur *Amazon SageMaker * AI. Ce didacticiel présente les champs et les fonctions de Data Wrangler.
+ Pour plus d'informations sur l'intégration aux domaines Amazon SageMaker AI, consultez la section Intégration [rapide au domaine Amazon SageMaker AI](https://docs.aws.amazon.com/sagemaker/latest/dg/onboard-quick-start.html) dans le manuel *Amazon SageMaker AI Developer Guide*.
+ Pour plus d'informations sur les exigences relatives aux données d'Amazon Personalize, consultez[Préparation des données de formation pour Amazon Personalize](preparing-training-data.md).

# Configurer les autorisations
<a name="dw-data-prep-minimum-permissions"></a>

Pour préparer les données avec Data Wrangler, vous devez configurer les autorisations suivantes : 
+ **Créez un rôle de service pour Amazon Personalize :** si ce n'est pas déjà fait, suivez les instructions [Configuration d'Amazon Personalize](setup.md) pour créer un rôle de service IAM pour Amazon Personalize. Ce rôle doit comporter `GetObject` des `ListBucket` autorisations pour les compartiments Amazon S3 qui stockent vos données traitées. Et il doit être autorisé à utiliser n'importe quelle AWS KMS clé.

   Pour plus d'informations sur l'octroi à Amazon Personalize de l'accès à vos compartiments Amazon S3, consultez[Permettre à Amazon Personalize d'accéder aux ressources Amazon S3](granting-personalize-s3-access.md). Pour plus d'informations sur l'octroi à Amazon Personalize de l'accès à vos AWS KMS clés, consultez[Autoriser Amazon Personalize à utiliser votre AWS KMS clé](granting-personalize-key-access.md). 
+  **Créez un utilisateur administratif avec des autorisations SageMaker AI :** votre administrateur doit avoir un accès complet à l' SageMaker IA et doit être en mesure de créer un domaine SageMaker AI. Pour plus d'informations, consultez la section [Créer un utilisateur et un groupe administratifs](https://docs.aws.amazon.com/sagemaker/latest/dg/gs-set-up.html#gs-account-user) dans le manuel *Amazon SageMaker AI Developer Guide*. 
+ **Création d'un rôle d'exécution SageMaker AI :** créez un rôle d'exécution SageMaker AI avec accès aux ressources d' SageMaker IA et aux opérations d'importation de données Amazon Personalize. La [https://console.aws.amazon.com/iam/home?#/policies/arn:aws:iam::aws:policy/AmazonSageMakerFullAccess](https://console.aws.amazon.com/iam/home?#/policies/arn:aws:iam::aws:policy/AmazonSageMakerFullAccess)politique doit être attachée au rôle d'exécution de l' SageMaker IA. *Si vous avez besoin d'autorisations Data Wrangler plus détaillées, consultez [Data Wrangler Security and Permissions dans](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-security.html#data-wrangler-security-iam-policy) le manuel Amazon AI Developer Guide. SageMaker * Pour plus d'informations sur les rôles d' SageMaker IA, consultez la section [Rôles d'SageMaker IA](https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker-roles.html). 

  Pour accorder l'accès aux opérations d'importation de données Amazon Personalize, associez la politique IAM suivante au rôle d'exécution SageMaker AI. Cette politique accorde les autorisations requises pour importer des données dans Amazon Personalize et associer une politique à votre compartiment Amazon S3. Et il accorde des `PassRole` autorisations lorsque le service est Amazon Personalize. Mettez à jour Amazon S3 `amzn-s3-demo-bucket` avec le nom du compartiment Amazon S3 que vous souhaitez utiliser comme destination pour vos données formatées après les avoir préparées avec Data Wrangler. 

------
#### [ JSON ]

****  

  ```
  {
      "Version":"2012-10-17",		 	 	 
      "Statement": [
          {
              "Effect": "Allow",
              "Action": [
                  "personalize:Create*",
                  "personalize:List*",
                  "personalize:Describe*"
              ],
              "Resource": "*"
          },
          {
              "Effect": "Allow",
              "Action": [
                  "s3:PutBucketPolicy"
              ],
              "Resource": [
                  "arn:aws:s3:::amzn-s3-demo-bucket",
                  "arn:aws:s3:::amzn-s3-demo-bucket/*"
              ]
          },
          {
              "Effect": "Allow",
              "Action": [
                  "iam:PassRole"
              ],
              "Resource": "*",
              "Condition": {
                  "StringEquals": {
                      "iam:PassedToService": "personalize.amazonaws.com"
                  }
              }
          }
      ]
  }
  ```

------

  Pour plus d'informations sur la création d'une stratégie IAM, consultez la section [Création de politiques IAM](https://docs.aws.amazon.com/IAM/latest/UserGuide/access_policies_create.html) dans le Guide de l'utilisateur *IAM*. Pour plus d'informations sur l'attachement d'une politique IAM à un rôle, consultez la section [Ajouter et supprimer des autorisations d'identité IAM](https://docs.aws.amazon.com/IAM/latest/UserGuide/access_policies_manage-attach-detach.html) dans le guide de l'utilisateur *IAM*.

# Lancement de Data Wrangler depuis Amazon Personalize
<a name="dw-launch-dw-from-personalize"></a>

Pour lancer Data Wrangler depuis Amazon Personalize, vous devez utiliser la console Amazon Personalize pour configurer un domaine SageMaker AI et lancer Data Wrangler. 

**Pour lancer Data Wrangler depuis Amazon Personalize**

1. Ouvrez la console Amazon Personalize [https://console.aws.amazon.com/personalize/chez](https://console.aws.amazon.com/personalize/home) vous et connectez-vous à votre compte.

1. Sur la page **Groupes de jeux de données**, choisissez votre groupe de jeux de données.

1. Dans **Configurer des ensembles de données**, choisissez **Créer un ensemble de données** et choisissez le type de jeu de données à créer. Vous ne pouvez pas utiliser Data Wrangler pour préparer un ensemble de données Actions ou Action interactions.

1. **Choisissez **Importer des données à l'aide de Data Wrangler**, puis cliquez sur Suivant.**

1. Pour le **SageMaker domaine**, choisissez d'utiliser un domaine existant ou d'en créer un nouveau. Vous avez besoin d'un domaine SageMaker AI pour accéder à Data Wrangler dans SageMaker AI Studio Classic. Pour plus d'informations sur les domaines et les profils utilisateur, consultez [SageMaker AI Domain](https://docs.aws.amazon.com/sagemaker/latest/dg/sm-domain.html) dans le manuel *Amazon SageMaker AI Developer Guide*.

1. Pour utiliser un domaine existant, choisissez un **domaine SageMaker AI** et un **profil utilisateur** pour configurer le domaine.

1. Pour créer un nouveau domaine :
   + Donnez un nom au nouveau domaine.
   + Choisissez un **nom de profil utilisateur**.
   +  Pour **Rôle d'exécution**, choisissez le rôle que vous avez créé dans[Configurer les autorisations](dw-data-prep-minimum-permissions.md). Ou, si vous disposez d' CreateRole autorisations, créez un nouveau rôle à l'aide de l'assistant de création de rôle. La `AmazonSageMakerFullAccess` politique doit être attachée au rôle que vous utilisez. 

1. Choisissez **Suivant**. Si vous créez un nouveau domaine, SageMaker AI commence à créer votre domaine. Cela peut prendre jusqu'à dix minutes.

1. Vérifiez les détails de votre domaine SageMaker AI.

1. Choisissez **Importer des données avec Data Wrangler**. SageMaker AI Studio Classic commence à créer votre environnement et, une fois terminée, la page de **flux** de données de Data Wrangler dans SageMaker AI Studio Classic s'ouvre dans un nouvel onglet. SageMaker AI Studio Classic peut mettre jusqu'à cinq minutes pour terminer la création de votre environnement. Une fois l'opération terminée, vous êtes prêt à commencer à importer des données dans Data Wrangler. Pour de plus amples informations, veuillez consulter [Importation de données dans Data Wrangler](dw-import-data.md).

# Importation de données dans Data Wrangler
<a name="dw-import-data"></a>

 Après avoir configuré un domaine SageMaker AI et lancé Data Wrangler dans un nouvel onglet, vous êtes prêt à importer les données de votre source dans Data Wrangler. Lorsque vous utilisez Data Wrangler pour préparer des données pour Amazon Personalize, vous importez un ensemble de données à la fois. Nous vous recommandons de commencer par un ensemble de données d'interactions entre objets. Vous ne pouvez pas utiliser Data Wrangler pour préparer un ensemble de données Actions ou Action interactions.

 Vous commencez sur la page **Flux de données**. La page doit ressembler à ce qui suit. 

![\[Représente la page de flux de données de Data Wrangler avec les options d'importation de données et d'utilisation d'exemples de jeux de données.\]](http://docs.aws.amazon.com/fr_fr/personalize/latest/dg/images/dw-data-sources.png)


Pour commencer à importer des données, sélectionnez **Importer des données** et spécifiez votre source de données. Data Wrangler prend en charge plus de 40 sources. Il s'agit notamment de AWS services, tels qu'Amazon Redshift, Amazon EMR ou Amazon Athena, et de tiers, tels que Snowflake ou. DataBricks Les différentes sources de données utilisent des procédures différentes pour connecter et importer des données. 

Pour obtenir la liste complète des sources disponibles et des step-by-step instructions sur l'importation de données, consultez la section [Importer](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-import.html) dans le manuel *Amazon SageMaker AI Developer Guide*. 

Après avoir importé des données dans Data Wrangler, vous êtes prêt à les transformer. Pour plus d'informations sur la transformation des données, consultez[Transformation de données](dw-transform-data.md).

# Transformation de données
<a name="dw-transform-data"></a>

 Pour transformer les données dans Data Wrangler, vous devez ajouter une étape de **transformation** à votre flux de données. Data Wrangler inclut plus de 300 transformations que vous pouvez utiliser pour préparer vos données, y compris une **colonne de carte pour la transformation Amazon Personalize**. Vous pouvez également utiliser les transformations générales de Data Wrangler pour résoudre des problèmes tels que les valeurs aberrantes, les problèmes de type et les valeurs manquantes. 

Une fois que vous avez fini de transformer vos données, vous pouvez les analyser avec Data Wrangler. Ou, si vous avez terminé de préparer vos données dans Data Wrangler, vous pouvez les traiter et les importer dans Amazon Personalize. Pour plus d'informations sur l'analyse des données, consultez[Génération de visualisations et d'informations sur les données](dw-analyze-data.md). Pour plus d'informations sur le traitement et l'importation de données, consultez[Traitement des données et importation de celles-ci dans Amazon Personalize](dw-export-data.md).

**Topics**
+ [Colonnes de mappage pour Amazon Personalize](#dw-personalize-transform)
+ [Transformations de General Data Wrangler](#dw-general-transform)

## Colonnes de mappage pour Amazon Personalize
<a name="dw-personalize-transform"></a>

 Pour transformer vos données afin qu'elles répondent aux exigences d'Amazon Personalize, vous devez ajouter les **colonnes de carte pour la transformation Amazon Personalize** et mapper vos colonnes aux champs obligatoires et facultatifs d'Amazon Personalize.

**Pour utiliser les colonnes de la carte pour la transformation Amazon Personalize**

1.  Choisissez **\$1** pour votre dernière transformation, puis choisissez **Ajouter une transformation**. Si vous n'avez pas ajouté de transformation, sélectionnez le signe **\$1** pour la transformation **des types de données**. Data Wrangler ajoute automatiquement cette transformation à votre flux. 

1.  Choisissez **Ajouter une étape**. 

1.  Choisissez **Transforms for Amazon Personalize**. Les **colonnes de carte pour la transformation Amazon Personalize** sont sélectionnées par défaut. 

1. Utilisez les champs de transformation pour associer vos données aux attributs Amazon Personalize requis.

   1. Choisissez le type de jeu de données qui correspond à vos données (interactions, éléments ou utilisateurs). 

   1. Choisissez votre domaine (ECOMMERCE, VIDEO\$1ON\$1DEMAND ou personnalisé). Le domaine que vous choisissez doit correspondre au domaine que vous avez spécifié lors de la création de votre groupe de jeux de données.

   1. Choisissez les colonnes qui correspondent aux champs obligatoires et facultatifs pour Amazon Personalize. Par exemple, pour la colonne Item\$1ID, choisissez la colonne de vos données qui stocke les informations d'identification uniques pour chacun de vos articles. 

      Chaque champ de colonne est filtré par type de données. Seules les colonnes de vos données qui répondent aux exigences relatives aux types de données Amazon Personalize sont disponibles. Si vos données ne sont pas du type requis, vous pouvez utiliser la transformation [Parse Value as Type](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-transform.html#data-wrangler-transform-cast-type) Data Wrangler pour les convertir.

## Transformations de General Data Wrangler
<a name="dw-general-transform"></a>

 Les transformations générales de Data Wrangler suivantes peuvent vous aider à préparer les données pour Amazon Personalize : 
+ Conversion du type de données : si votre champ ne figure pas parmi les options possibles dans les **colonnes de la carte pour la transformation Amazon Personalize**, vous devrez peut-être convertir son type de données. Le Data Wrangler transforme [Parse Value as Type](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-transform.html#data-wrangler-transform-cast-type) pour vous aider à convertir vos données. Vous pouvez également utiliser la transformation **des types de** données que Data Wrangler ajoute par défaut lorsque vous créez un flux. Pour utiliser cette transformation, vous devez sélectionner le type de données dans les listes déroulantes **Type**, choisir **Aperçu**, puis choisir **Mettre à jour**.

   Pour plus d'informations sur les types de données requis pour les champs, consultez la section relative à votre domaine et au type de jeu de données dans[Création de fichiers JSON pour les schémas Amazon Personalize](how-it-works-dataset-schema.md). 
+ Gestion des valeurs manquantes et des valeurs aberrantes : si vous générez des informations sur les valeurs manquantes ou les valeurs aberrantes, vous pouvez utiliser le Data Wrangler qui transforme les transformations Handle [Outliers et Handle](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-transform.html#data-wrangler-transform-handle-outlier) [Missing Values](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-transform.html#data-wrangler-transform-handle-missing) pour résoudre ces problèmes. 
+  Transformations personnalisées : avec Data Wrangler, vous pouvez créer vos propres transformations avec Python (fonction définie par l'utilisateur) PySpark, pandas ou PySpark (SQL). Vous pouvez utiliser une transformation personnalisée pour effectuer des tâches telles que la suppression de colonnes dupliquées ou le regroupement par colonnes. Pour plus d'informations, consultez la section [Custom Transforms](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-transform.html#data-wrangler-transform-custom) du manuel *Amazon SageMaker AI Developer Guide*. 

# Génération de visualisations et d'informations sur les données
<a name="dw-analyze-data"></a>

Après avoir importé vos données dans Data Wrangler, vous pouvez les utiliser pour générer des visualisations et des informations sur les données. 
+  **[Visualisations](#dw-visualizing-data)** : Data Wrangler peut générer différents types de graphiques, tels que des histogrammes et des diagrammes de points. Par exemple, vous pouvez générer un histogramme pour identifier les valeurs aberrantes dans vos données. 
+ **[Informations sur les données](#dw-generating-insights)** : vous pouvez utiliser un *rapport sur la qualité et les informations des données pour Amazon Personalize pour* en savoir plus sur vos données grâce à des informations sur les données et à des statistiques sur les colonnes et les lignes. Ce rapport peut vous indiquer si vous rencontrez des problèmes de type dans vos données. Et vous pouvez découvrir les mesures que vous pouvez prendre pour améliorer vos données. Ces actions peuvent vous aider à répondre aux besoins en ressources d'Amazon Personalize, tels que les exigences en matière de formation des modèles, ou elles peuvent mener à de meilleures recommandations.

 Après avoir découvert vos données grâce à des visualisations et à des informations, vous pouvez utiliser ces informations pour appliquer des transformations supplémentaires afin d'améliorer vos données. Ou, si vous avez terminé de préparer vos données, vous pouvez les traiter et les importer dans Amazon Personalize. Pour plus d'informations sur la transformation de vos données, consultez[Transformation de données](dw-transform-data.md). Pour plus d'informations sur le traitement et l'importation de données, consultez[Traitement des données et importation de celles-ci dans Amazon Personalize](dw-export-data.md). 

## Génération de visualisations
<a name="dw-visualizing-data"></a>

Vous pouvez utiliser Data Wrangler pour créer différents types de graphiques, tels que des histogrammes et des diagrammes de points. Par exemple, vous pouvez générer un histogramme pour identifier les valeurs aberrantes dans vos données. Pour générer une visualisation des données, vous ajoutez une étape d'**analyse** à votre flux et, dans **Type d'analyse**, choisissez la visualisation que vous souhaitez créer. 

 Pour plus d'informations sur la création de visualisations dans Data Wrangler, consultez [Analyser et visualiser](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-analyses.html) dans le manuel *Amazon SageMaker AI* Developer Guide. 

## Générer des informations sur les données
<a name="dw-generating-insights"></a>

 Vous pouvez utiliser Data Wrangler pour générer un **rapport sur la qualité et les informations des données pour Amazon Personalize** spécifique à votre type de jeu de données. Avant de générer le rapport, nous vous recommandons de transformer vos données pour répondre aux exigences d'Amazon Personalize. Cela permettra d'obtenir des informations plus pertinentes. Pour de plus amples informations, veuillez consulter [Transformation de données](dw-transform-data.md). 

**Topics**
+ [Contenu du rapport](#dw-report-content)
+ [Génération du rapport](#dw-generating-insight-report)

### Contenu du rapport
<a name="dw-report-content"></a>

Le **rapport sur la qualité et les informations des données pour Amazon Personalize** comprend les sections suivantes : 
+ **Résumé :** Le résumé du rapport inclut les statistiques du jeu de données et les avertissements prioritaires :
  + **Statistiques du jeu de données :** il s'agit notamment des statistiques spécifiques d'Amazon Personalize, telles que le nombre d'utilisateurs uniques dans vos données d'interactions, et des statistiques générales, telles que le nombre de valeurs manquantes ou aberrantes.
  +  **Avertissements prioritaires :** il s'agit des informations spécifiques à Amazon Personalize qui ont le plus d'impact sur la formation ou les recommandations. Chaque avertissement inclut une mesure recommandée que vous pouvez prendre pour résoudre le problème. 
+  **Lignes dupliquées et lignes incomplètes :** ces sections contiennent des informations sur les lignes contenant des valeurs manquantes et sur les lignes dupliquées dans vos données. 
+  **Résumé des fonctionnalités :** Cette section inclut le type de données pour chaque colonne, les informations de données non valides ou manquantes et le nombre d'avertissements. 
+  **Détails des fonctionnalités :** Cette section comprend des sous-sections contenant des informations détaillées pour chacune de vos colonnes de données. Chaque sous-section inclut des statistiques pour la colonne, telles que le nombre de valeurs catégorielles et les informations sur les valeurs manquantes. Et chaque sous-section inclut des informations spécifiques d'Amazon Personalize et des actions recommandées pour les colonnes de données. Par exemple, un aperçu peut indiquer qu'une colonne comporte plus de 30 catégories possibles. 

#### Problèmes liés aux types de données
<a name="dw-report-type-issues"></a>

 Le rapport identifie les colonnes dont le type de données n'est pas correct et précise le type requis. Pour obtenir des informations relatives à ces fonctionnalités, vous devez convertir le type de données de la colonne et générer à nouveau le rapport. Pour convertir le type, vous pouvez utiliser le Data Wrangler pour transformer [Parse Value](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-transform.html#data-wrangler-transform-cast-type) as Type. 

#### Amazon Personalize : informations
<a name="dw-report-insights"></a>

Les informations d'Amazon Personalize incluent une constatation et une action suggérée. L'action est facultative. Par exemple, le rapport peut inclure un aperçu et une action liés au nombre de catégories pour une colonne de données catégorielles. Si vous pensez que la chronique n'est pas catégorique, vous pouvez ignorer cette information et ne rien faire.

 À l'exception de légères différences de formulation, les informations spécifiques à Amazon Personalize sont les mêmes que les informations relatives à *un seul ensemble de données* que vous pouvez générer lorsque vous analysez vos données avec Amazon Personalize. Par exemple, le rapport d'analyse de Data Wrangler inclut des informations telles que « Le jeu de données sur les interactions entre éléments ne compte que X utilisateurs uniques avec deux interactions ou plus ». Mais il n'inclut pas d'informations telles que « X % des éléments du jeu de *données Items n'ont aucune interaction dans le jeu* de *données des interactions Item* ».

 Pour obtenir une liste des informations spécifiques possibles à Amazon Personalize, consultez les informations qui ne font pas référence à [Informations sur les données](analyzing-data.md#data-insights) plusieurs ensembles de données.

#### Exemples de rapports
<a name="dw-insight-report-examples"></a>

L'apparence du rapport Amazon Personalize est identique à celle du rapport d'analyse générale de Data Wrangler. Pour des exemples du rapport d'analyse générale, consultez [Get Insights On Data and Data Quality](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-data-insights.html) dans le manuel *Amazon SageMaker AI Developer Guide*. L'exemple suivant montre comment fonctionne la section récapitulative d'un rapport pour un ensemble de données d'interactions entre éléments. Il inclut des statistiques sur les ensembles de données et certains avertissements possibles concernant les interactions entre objets et ensembles de données présentant une priorité élevée.

![\[Représente la section récapitulative d'un rapport pour un ensemble de données d'interactions entre éléments.\]](http://docs.aws.amazon.com/fr_fr/personalize/latest/dg/images/dw-reports-summary.png)


 L'exemple suivant montre comment la section des détails des fonctionnalités d'une colonne EVENT\$1TYPE d'un ensemble de données d'interactions entre éléments peut apparaître dans un rapport. 

![\[Décrit la section des détails des fonctionnalités d'une colonne EVENT_TYPE d'un ensemble de données d'interactions Item.\]](http://docs.aws.amazon.com/fr_fr/personalize/latest/dg/images/dw-event-type-report.png)


### Génération du rapport
<a name="dw-generating-insight-report"></a>

Pour générer le **rapport sur la qualité et les informations des données pour Amazon Personalize**, vous sélectionnez **Obtenir des informations sur les données** pour votre transformation et créer une analyse.

**Pour générer un rapport sur la qualité et les informations des données pour Amazon Personalize**

1. Choisissez l'option **\$1** pour la transformation que vous analysez. Si vous n'avez pas ajouté de transformation, sélectionnez le signe **\$1** pour la transformation **des types de données**. Data Wrangler ajoute automatiquement cette transformation à votre flux. 

1. Choisissez **Obtenir des informations sur les données**. Le panneau **Créer une analyse** s'affiche.

1. Pour le **type d'analyse**, choisissez **Data Quality and Insights Report for Amazon Personalize**. 

1.  Pour le **type de jeu de données**, choisissez le type de jeu de données Amazon Personalize que vous analysez. 

1. Choisissez éventuellement **Exécuter sur des données complètes**. Par défaut, Data Wrangler génère des informations uniquement sur un échantillon de vos données. 

1. Choisissez **Créer**. Lorsque l'analyse est terminée, le rapport apparaît. 

# Traitement des données et importation de celles-ci dans Amazon Personalize
<a name="dw-export-data"></a>

 Lorsque vous avez terminé d'analyser et de transformer vos données, vous êtes prêt à les traiter et à les importer dans Amazon Personalize. 
+  **[Traitement des données](#dw-process-data)** : le traitement des données applique votre transformation à l'ensemble de votre ensemble de données et la renvoie vers une destination que vous spécifiez. Dans ce cas, vous spécifiez un compartiment Amazon S3. 
+ **[Importation de données dans Amazon Personalize](#dw-import-into-personalize)** — Pour importer des données traitées dans Amazon Personalize, vous devez exécuter un bloc-notes Jupyter fourni dans SageMaker AI Studio Classic. Ce carnet crée vos ensembles de données Amazon Personalize et y importe vos données. 

## Traitement des données
<a name="dw-process-data"></a>

 Avant d'importer des données dans Amazon Personalize, vous devez appliquer votre transformation à l'ensemble de votre ensemble de données et la transférer dans un compartiment Amazon S3. Pour ce faire, vous créez un nœud de destination dont la destination est définie sur un compartiment Amazon S3, puis vous lancez une tâche de traitement pour la transformation.

Pour step-by-step obtenir des instructions sur la spécification d'une destination et le lancement d'une tâche de traitement, consultez [Lancer des tâches de traitement en quelques clics à l'aide d'Amazon SageMaker AI Data Wrangler](https://aws.amazon.com/blogs/machine-learning/launch-processing-jobs-with-a-few-clicks-using-amazon-sagemaker-data-wrangler/). Lorsque vous ajoutez une destination, choisissez **Amazon S3**. Vous utiliserez cet emplacement lorsque vous importerez les données traitées dans Amazon Personalize.

Lorsque vous avez terminé de traiter vos données, vous êtes prêt à les importer depuis le compartiment Amazon S3 dans Amazon Personalize.

## Importation de données dans Amazon Personalize
<a name="dw-import-into-personalize"></a>

Après avoir traité vos données, vous êtes prêt à les importer dans Amazon Personalize. Pour importer des données traitées dans Amazon Personalize, vous devez exécuter un bloc-notes Jupyter fourni dans SageMaker AI Studio Classic. Ce carnet crée vos ensembles de données Amazon Personalize et y importe vos données.

**Pour importer des données traitées dans Amazon Personalize**

1. Pour la transformation que vous souhaitez exporter, choisissez **Exporter vers** et **Amazon Personalize (via Jupyter Notebook**).

1. Modifiez le bloc-notes pour spécifier le compartiment Amazon S3 que vous avez utilisé comme destination des données pour la tâche de traitement. Spécifiez éventuellement le domaine de votre groupe de jeux de données. Par défaut, le bloc-notes crée un groupe de jeux de données personnalisé.

1. Passez en revue les cellules du bloc-notes qui créent le schéma. Vérifiez que les champs du schéma possèdent les types et attributs attendus avant d'exécuter la cellule. 
   +  Vérifiez que les champs prenant en charge les données nulles `null` figurent dans la liste des types. L'exemple suivant montre comment ajouter `null` pour un champ. 

     ```
     {
       "name": "GENDER",
       "type": [
         "null",
         "string"
       ],
       "categorical": true
     }
     ```
   +  Vérifiez que l'attribut catégorique est défini sur true pour les champs catégoriels. L'exemple suivant montre comment marquer un champ comme catégorique. 

     ```
     {
               "name": "SUBSCRIPTION_MODEL",
               "type": "string",
               "categorical": true
     }
     ```
   + Vérifiez que l'attribut textuel des champs textuels est défini sur true. L'exemple suivant montre comment marquer un champ comme textuel.

     ```
     {
           "name": "DESCRIPTION",
           "type": [
             "null",
             "string"
           ],
           "textual": true
     }
     ```

1. Exécutez le bloc-notes pour créer un schéma, créer un ensemble de données et importer vos données dans le jeu de données Amazon Personalize. Vous exécutez le bloc-notes comme vous le feriez avec un bloc-notes en dehors d' SageMaker AI Studio Classic. [Pour plus d'informations sur l'exécution des blocs-notes Jupyter, consultez Running Code.](https://jupyter-notebook.readthedocs.io/en/stable/examples/Notebook/Running Code.html) Pour plus d'informations sur les blocs-notes dans SageMaker AI Studio Classic, consultez la section [Utiliser les blocs-notes Amazon SageMaker AI](https://docs.aws.amazon.com/sagemaker/latest/dg/notebooks.html) dans le manuel *Amazon SageMaker AI Developer Guide*.

    Une fois le bloc-notes terminé, si vous avez importé des données d'interactions, vous êtes prêt à créer des recommandations ou des ressources personnalisées. Vous pouvez également répéter le processus avec un jeu de données d'éléments ou un ensemble de données d'utilisateurs.
   + Pour plus d'informations sur la création de recommandeurs de domaine, consultez[Recommandeurs de domaines dans Amazon Personalize](creating-recommenders.md). 
   + Pour plus d'informations sur la création et le déploiement de ressources personnalisées, consultez[Ressources personnalisées pour la formation et le déploiement des modèles Amazon Personalize](create-custom-resources.md).