

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Utilisation d'une recette de préparation des données dans AWS Glue Studio
<a name="glue-studio-data-preparation"></a>

 La transformation **Recettes de préparation des données** vous permet de créer une recette de préparation des données à partir de zéro à l’aide d’une interface de création interactive de type grille. Elle vous permet également d’importer une recette AWS Glue DataBrew existante, puis de la modifier dans AWS Glue Studio. 

 Le nœud **Recette de préparation des données** est disponible dans le panneau Ressources. Vous pouvez connecter le nœud **Recette de préparation des données** à un autre nœud du flux de travail visuel, qu'il s'agisse d'un nœud de source de données ou d'un autre nœud de transformation. Après avoir choisi une AWS Glue DataBrew recette et une version, les étapes appliquées dans la recette sont visibles dans l'onglet des propriétés du nœud. 

## Conditions préalables
<a name="glue-studio-databrew-prerequisites"></a>
+  Si vous importez une AWS Glue DataBrew recette, vous disposez des autorisations IAM requises, comme décrit dans[Importer une AWS Glue DataBrew recette dans AWS Glue Studio](glue-studio-data-preparation-import-recipe.md). 
+  Une session de prévisualisation des données doit être créée. 

## Limitations
<a name="glue-studio-databrew-limitations"></a>
+  AWS Glue DataBrew les recettes ne sont prises en charge que dans [ DataBrew les régions commerciales](https://docs.aws.amazon.com/general/latest/gr/databrew.html). 
+  Toutes les AWS Glue DataBrew recettes ne sont pas prises en charge parAWS Glue. Certaines recettes ne pourront pas être exécutées dans AWS Glue Studio. 
  +  Les recettes avec des transformations de type `UNION` et `JOIN` ne sont pas prises en charge, mais AWS Glue Studio dispose déjà de nœuds de transformation « Join » et « Union » qui peuvent être utilisés avant ou après un nœud **Data Preparation Recipe**. 
+  Les nœuds **Recette de préparation des données** sont pris en charge pour les tâches à partir de la version 4.0 de AWS Glue. Cette version sera sélectionnée automatiquement après l'ajout d'un nœud **Recette de préparation des données** à la tâche. 
+  Les nœuds **Recette de préparation des données** nécessitent Python. Ceci est automatiquement défini lorsque le nœud **Recette de préparation des données** est ajouté à la tâche. 
+  L’ajout d’un nouveau nœud **Data Preparation Recipe** au graphique visuel redémarrera automatiquement votre session de prévisualisation des données avec les bibliothèques appropriées pour utiliser le nœud **Data Preparation Recipe**. 
+  Les transformations suivantes ne sont pas prises en charge pour l’importation ou la modification dans un nœud **Data Preparation Recipe** : `GROUP_BY`, `PIVOT`, `UNPIVOT` et `TRANSPOSE`. 

## Fonctionnalités supplémentaires
<a name="glue-studio-data-preparation-recipe-transform-features"></a>

 Lorsque vous avez sélectionné la transformation de **Recette de préparation des données**, vous pouvez effectuer des actions supplémentaires après avoir sélectionné **Créer une recette**. 
+  Ajouter une étape : vous pouvez ajouter des étapes supplémentaires à une recette selon vos besoins en cliquant sur l’icône d’ajout d’étape, ou utiliser la barre d’outils du volet de prévisualisation en choisissant une action.   
![\[La capture d’écran montre l’icône d’ajout d’une recette.\]](http://docs.aws.amazon.com/fr_fr/glue/latest/dg/images/add-recipe-icon.png)  
![\[La capture d’écran montre l’icône d’ajout d’une recette.\]](http://docs.aws.amazon.com/fr_fr/glue/latest/dg/images/author-recipe-toolbar.png)
+  Importer une recette : choisissez **Plus**, puis **Importer une recette** à utiliser dans le cadre de votre tâche AWS Glue Studio .   
![\[La capture d’écran montre l’icône Plus.\]](http://docs.aws.amazon.com/fr_fr/glue/latest/dg/images/data-preparation-recipe-node-more-icon.png)  
![\[La capture d’écran montre l’icône Plus.\]](http://docs.aws.amazon.com/fr_fr/glue/latest/dg/images/data-preparation-recipe-node-more-features.png)
+  Télécharger au format YAML : choisissez **Plus** puis **Télécharger au format YAML** pour télécharger votre recette et l'enregistrer en dehors de. AWS Glue Studio
+  Télécharger au format JSON : choisissez **Plus** puis **Télécharger au format JSON** pour télécharger votre recette à enregistrer en dehors de AWS Glue Studio. 
+  Annuler et rétablir les étapes de la recette : vous pouvez annuler et rétablir les étapes de la recette dans le volet de prévisualisation lorsque vous travaillez avec des données dans la grille.   
![\[La capture d’écran montre l’icône Plus.\]](http://docs.aws.amazon.com/fr_fr/glue/latest/dg/images/author-recipe-toolbar-undo-redo.png)

# Créez et exécutez des recettes de préparation de données dans une AWS Glue tâche ETL visuelle
<a name="glue-studio-data-preparation-recipe-transform-tutorial"></a>

 Dans ce scénario, vous pouvez créer des recettes de préparation des données sans avoir à les créer au préalable DataBrew. Avant de commencer à créer des recettes, vous devez respecter les conditions suivantes : 
+  Disposer d’une session de prévisualisation des données active et en cours d’exécution. Lorsque la session de prévisualisation des données est PRÊTE, l’option **Créer une recette** devient active et vous pouvez commencer à créer ou à modifier votre recette.   
![\[La capture d’écran montre que la session de prévisualisation des données est terminée.\]](http://docs.aws.amazon.com/fr_fr/glue/latest/dg/images/data-preparation-recipe-data-preview-complete.png)
+  Assurez-vous que l’option **Importer automatiquement les bibliothèques Glue** est activée.   
![\[La capture d’écran montre que l’option Importer automatiquement les bibliothèques Glue est activée.\]](http://docs.aws.amazon.com/fr_fr/glue/latest/dg/images/data-preparation-recipe-automatically-import-glue-libraries.png)

   Vous pouvez procéder en choisissant l’icône d’engrenage dans le volet Prévisualisation des données.   
![\[La capture d’écran montre que l’option Importer automatiquement les bibliothèques Glue est activée.\]](http://docs.aws.amazon.com/fr_fr/glue/latest/dg/images/data-preview-preferences.png)

**Pour créer une recette de préparation des données dans AWS Glue Studio :**

1.  Ajoutez la transformation **Recette de préparation des données** à votre canevas de tâches. Votre transformation doit être connectée à un nœud de source de données parent. Lorsque vous ajoutez le nœud **Data Preparation Recipe**, celui-ci redémarrera avec les bibliothèques appropriées et vous verrez la trame de données en cours de préparation.   
![\[La capture d’écran montre le chargement de la trame de données après l’ajout de Data Preparation Recipe.\]](http://docs.aws.amazon.com/fr_fr/glue/latest/dg/images/data-preparation-preparing-dataframe.png)

1.  Une fois que la session de prévisualisation des données est prête, les données contenant les étapes précédemment appliquées apparaîtront en bas de l’écran. 

1.  Choisissez **Créer une recette**. Cela vous permettra de démarrer une nouvelle recette dans AWS Glue Studio.   
![\[La capture d’écran montre le panneau Transformation avec les champs pour les parents Nom et Nœud, ainsi que l’option Créer une recette.\]](http://docs.aws.amazon.com/fr_fr/glue/latest/dg/images/data-preparation-recipe-transform-tab-new.png)

1.  Dans le panneau **Transformation** situé à droite du canevas de tâches, saisissez le nom de votre recette de préparation des données. 

1.  Sur le côté gauche, le canevas sera remplacé par une vue en grille de vos données. Sur la droite, le panneau **Transformation** changera pour vous montrer les étapes de votre recette. Choisissez **Ajouter une étape** pour ajouter la première étape à votre recette.   
![\[La capture d’écran montre le panneau Transformation après avoir choisi Ajouter une étape. Lorsque vous choisissez une colonne, les options changent de manière dynamique. Vous pouvez choisir de trier, d’effectuer une action sur la colonne et de filtrer les valeurs.\]](http://docs.aws.amazon.com/fr_fr/glue/latest/dg/images/author-recipe-preview-data-transform-panel.png)

1.  Dans le panneau **Transformation**, choisissez de trier, d’effectuer une action sur la colonne et de filtrer les valeurs. Par exemple, choisissez **Renommer la colonne**.   
![\[La capture d’écran montre le panneau Transformation après avoir choisi Ajouter une étape. Lorsque vous choisissez une colonne, les options changent de manière dynamique. Vous pouvez choisir de trier, d’effectuer une action sur la colonne et de filtrer les valeurs.\]](http://docs.aws.amazon.com/fr_fr/glue/latest/dg/images/author-recipe-add-step.png)

1.  Dans le panneau Transformation sur le côté droit, les options visant à renommer une colonne vous permettent de choisir la colonne source à renommer et de saisir le nouveau nom de colonne. Une fois que vous l’avez fait, choisissez **Appliquer**. 

    Vous pouvez prévisualiser chaque étape, annuler une étape, réorganiser les étapes et utiliser n’importe laquelle des icônes d’action, telles que Filtrer, Trier, Diviser, Fusionner, etc. Lorsque vous effectuez des actions dans la grille de données, les étapes sont ajoutées à la recette dans le panneau Transformation.   
![\[La capture d’écran montre la grille de données de prévisualisation avec la barre d’outils surlignée. Vous pouvez appliquer une action à l’aide de n’importe quel outil et elle sera ajoutée à la recette dans le panneau Transformation sur la droite.\]](http://docs.aws.amazon.com/fr_fr/glue/latest/dg/images/author-recipe-preview-data-grid.png)

    Si vous devez apporter une modification, vous pouvez le faire dans le volet d’aperçu en prévisualisant le résultat de chaque étape, en annulant une étape et en réorganisant les étapes. Par exemple : 
   +  Undo/redo étape : annuler une étape en choisissant l'icône d'**annulation**. Vous pouvez répéter une étape en choisissant l’icône de **rétablissement**.   
![\[La capture d’écran montre l’icône Plus.\]](http://docs.aws.amazon.com/fr_fr/glue/latest/dg/images/author-recipe-toolbar-undo-redo.png)
   +  Étape de réorganisation : lorsque vous réorganisez une étape, AWS Glue Studio chaque étape est validée et vous indique si l'étape n'est pas valide. 

1.  Une fois que vous avez appliqué une étape, le panneau Transformation affiche toutes les étapes de votre recette. Vous pouvez effacer toutes les étapes pour recommencer, ajouter d’autres étapes en cliquant sur l’icône d’ajout ou choisir **Terminer la création de la recette**.   
![\[La capture d’écran montre le panneau Transformation avec les étapes ajoutées à votre recette. Lorsque vous avez terminé, choisissez Terminer la création de la recette ou cliquez sur l’icône d’ajout pour ajouter d’autres étapes à la recette.\]](http://docs.aws.amazon.com/fr_fr/glue/latest/dg/images/author-recipe-done-authoring-recipe.png)

1.  Choisissez **Enregistrer** en haut à droite de votre écran. Les étapes de votre recette ne sont pas enregistrées tant que vous n’avez pas enregistré votre tâche. 

# Importer une AWS Glue DataBrew recette dans AWS Glue Studio
<a name="glue-studio-data-preparation-import-recipe"></a>

 Dans AWS Glue DataBrew, une recette est un ensemble d'étapes de transformation de données. AWS Glue DataBrew recipes décrit comment transformer des données déjà lues et ne décrit pas où et comment lire les données, ni comment et où écrire des données. Ceci est configuré dans les nœuds source et cible dans AWS Glue Studio. Pour plus d'informations sur les recettes, voir [Création et utilisation de AWS Glue DataBrew recettes](https://docs.aws.amazon.com/databrew/latest/dg/recipes.html). 

 Pour utiliser AWS Glue DataBrew des recettes dansAWS Glue Studio, commencez par créer des recettes dans AWS Glue DataBrew. Si vous avez des recettes que vous souhaitez utiliser, vous pouvez ignorer cette étape. 

## Autorisations IAM pour AWS Glue DataBrew
<a name="glue-studio-databrew-permissions"></a>

 Cette rubrique fournit des informations pour vous aider à comprendre les actions et les ressources qu'un administrateur IAM peut utiliser dans une politique Gestion des identités et des accès AWS (IAM) pour la transformation de la recette de préparation des données. 

 Pour plus d'informations sur la sécurité dans AWS Glue, consultez la section [Gestion des accès](https://docs.aws.amazon.com/glue/latest/dg/security.html). 

**Note**  
 Le tableau suivant répertorie les autorisations dont les utilisateurs ont besoin pour importer une recette AWS Glue DataBrew existante. 


**Actions de la transformation Recette de préparation des données**  

| Action | Description | 
| --- | --- | 
| databrew:ListRecipes | Accorde l'autorisation de récupérer AWS Glue DataBrew des recettes. | 
| databrew:ListRecipeVersions | Accorde l'autorisation de récupérer des versions de AWS Glue DataBrew recettes. | 
| databrew:DescribeRecipe | Accorde l'autorisation de récupérer AWS Glue DataBrew la description de la recette. | 



 Le rôle que vous utilisez pour accéder à cette fonctionnalité doit être doté d’une politique qui autorise plusieurs actions AWS Glue DataBrew . Vous pouvez y parvenir soit en utilisant la politique `AWSGlueConsoleFullAccess` qui inclut les actions nécessaires, soit en ajoutant la politique en ligne suivante à votre rôle : 

------
#### [ JSON ]

****  

```
{
  "Version":"2012-10-17",		 	 	 
  "Statement": [
    {
      "Effect": "Allow",
      "Action": [
        "databrew:ListRecipes",
        "databrew:ListRecipeVersions",
        "databrew:DescribeRecipe"
      ],
      "Resource": [
        "*"
      ]
    }
  ]
}
```

------



 Pour utiliser la transformation Recette de préparation des données, vous devez ajouter l'action `IAM:PassRole` à la politique d'autorisation. 


**Autorisations supplémentaires requises**  

| Action | Description | 
| --- | --- | 
| iam:PassRole | Permet à IAM d'autoriser l'utilisateur à transmettre les rôles approuvés. | 

Sans ces autorisations, l'erreur suivante se produit :

```
"errorCode": "AccessDenied"
"errorMessage": "User: arn:aws:sts::account_id:assumed-role/AWSGlueServiceRole is not 
authorized to perform: iam:PassRole on resource: arn:aws:iam::account_id:role/service-role/AWSGlueServiceRole 
because no identity-based policy allows the iam:PassRole action"
```



## Importer une AWS Glue DataBrew recette
<a name="glue-studio-databrew-import-steps"></a>

**Pour importer une AWS Glue DataBrew recette et l'utiliser dans AWS Glue Studio :**

 Si vous possédez déjà un nœud de **recette de préparation des données** et que vous souhaitez modifier les étapes de la recette directement dans celui-ci AWS Glue Studio, vous devrez importer les étapes de la recette dans votre AWS Glue Studio tâche. 

1.  Démarrez une tâche AWS Glue dans AWS Glue Studio avec une source de données. 

1.  Ajoutez le nœud **Data Preparation Recipe** au canevas de tâches.   
![\[La capture d’écran montre la fenêtre modale Ajouter un nœud avec une recette de préparation des données disponible à la sélection.\]](http://docs.aws.amazon.com/fr_fr/glue/latest/dg/images/glue-add-node-data-preparation-recipe.png)

1.  Dans le panneau Transformation, saisissez un nom pour votre recette. 

1.  Sélectionnez un ou plusieurs nœuds parent en sélectionnant les nœuds disponibles sur le canevas dans la liste déroulante. 

1.  Choisissez **Créer une recette**. Si l’option **Créer une recette** est grisée, elle n’est pas disponible tant que les nœuds parent n’ont pas été sélectionnés et qu’une session de prévisualisation des données ne s’est pas terminée.   
![\[Author Data Preparation Recipe form with name field and node parents selection dropdown.\]](http://docs.aws.amazon.com/fr_fr/glue/latest/dg/images/glue-author-data-preparation-recipe.png)

1.  La trame de données se charge et affiche des informations détaillées sur vos données source. 

    Sélectionnez l’icône **Autres actions** et choisissez **Importer la recette**.   
![\[Data preparation interface showing "Build your Recipe" with an "Add step" button.\]](http://docs.aws.amazon.com/fr_fr/glue/latest/dg/images/glue-dataframe-import-recipe.png)

1.  Utilisez l’assistant d’importation de recettes pour effectuer la procédure. À l’étape 1, recherchez votre recette, sélectionnez-la, puis cliquez sur **Suivant**.   
![\[Import recipe interface showing two recipes, with one selected for import.\]](http://docs.aws.amazon.com/fr_fr/glue/latest/dg/images/import-recipe-step-1.png)

1.  À l’étape 2, choisissez vos options d’importation. Vous pouvez choisir d’ajouter une nouvelle recette à une recette existante ou de remplacer une recette existante. Choisissez **Suivant**.   
![\[Import recipe interface showing selected recipe, version, and two imported steps.\]](http://docs.aws.amazon.com/fr_fr/glue/latest/dg/images/import-recipe-step-2.png)

1.  À l’étape 3, validez les étapes de la recette. Une fois que vous avez importé votre AWS Glue DataBrew recette, vous pouvez la modifier directement dans AWS Glue Studio.   
![\[Recipe import interface showing two steps and a validation progress indicator.\]](http://docs.aws.amazon.com/fr_fr/glue/latest/dg/images/import-recipe-step-3.png)  
![\[Import recipe interface showing validated steps for sorting and formatting data.\]](http://docs.aws.amazon.com/fr_fr/glue/latest/dg/images/import-recipe-step-3-validated-2.png)

1.  Ensuite, les étapes seront importées dans le cadre de votre AWS Glue travail. Apportez les modifications de configuration nécessaires dans l’onglet **Informations de la tâche**, par exemple en nommant votre tâche et en ajustant la capacité allouée selon les besoins. Choisissez **Enregistrer** pour enregistrer votre tâche et votre recette. 
**Note**  
 JOIN, UNION, GROUP\$1BY, PIVOT, UNPIVOT, TRANSPOSE ne sont pas pris en charge pour l’importation de recettes et ne seront pas non plus disponibles en mode de création de recettes. 

1.  En option, vous pouvez terminer la création de la tâche en ajoutant d’autres nœuds de transformation selon les besoins et ajouter des nœuds Cible de données. 

    Si vous réorganisez les étapes après avoir importé une recette, AWS Glue effectue la validation de ces étapes. Par exemple, si vous renommez puis supprimez une colonne et que vous déplacez l’étape de suppression vers le haut, l’étape de renommage ne sera pas valide. Vous pouvez ensuite modifier les étapes pour corriger l’erreur de validation. 

# Migration depuis AWS Glue DataBrew AWS Glue Studio
<a name="databrew-migration-to-glue-studio"></a>

 Si vous avez des recettes AWS Glue DataBrew, utilisez la liste de contrôle suivante pour migrer vos recettes vers AWS Glue Studio. 


| Si vous souhaitez | Procédez comme suit | 
| --- | --- | 
|  Permettez aux utilisateurs de récupérer AWS Glue DataBrew des recettes, des versions de recettes et des descriptions de recettes.  |  Ajouter des autorisations IAM à une politique qui permet à votre rôle d’accéder aux actions nécessaires. Consultez [Autorisations IAM pour AWS Glue DataBrew](glue-studio-data-preparation-import-recipe.md#glue-studio-databrew-permissions).  | 
|  Importez une AWS Glue DataBrew recette existante dans AWS Glue Studio.  |  Suivez les étapes de [Importer une AWS Glue DataBrew recette](glue-studio-data-preparation-import-recipe.md#glue-studio-databrew-import-steps).  | 
|  Importer une recette avec JOIN et UNION.  |  Les recettes comportant des transformations UNION et JOIN ne sont pas prises en charge. Utilisez les transformations Join et Union dans AWS Glue Studio avant ou après un nœud Data Preparation Recipe.  | 