

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Connexion à Amazon Redshift dans AWS Glue Studio
<a name="connecting-to-data-redshift"></a>

**Note**  
 Vous pouvez utiliser Spark AWS Glue pour lire et écrire dans des tables de Amazon Redshift bases de données extérieures àAWS Glue Studio. Pour configurer Amazon Redshift des AWS Glue tâches par programmation, voir[Connexions Redshift](aws-glue-programming-etl-connect-redshift-home.md). 

 AWS Gluefournit un support intégré pour Amazon Redshift. AWS Glue Studiofournit une interface visuelle permettant de se connecter Amazon Redshift, de créer des tâches d'intégration de données et de les exécuter sur un environnement d'exécution Spark AWS Glue Studio sans serveur. 

**Topics**
+ [Création d'une Amazon Redshift connexion](creating-redshift-connection.md)
+ [Création d'un nœud Amazon Redshift source](creating-redshift-source-node.md)
+ [Création d'un nœud Amazon Redshift cible](creating-redshift-target-node.md)
+ [Options avancées](creating-redshift-connection-advanced-options.md)

# Création d'une Amazon Redshift connexion
<a name="creating-redshift-connection"></a>

## Autorisations nécessaires
<a name="creating-redshift-connection-permissions"></a>

 Des autorisations supplémentaires sont nécessaires pour utiliser les Amazon Redshift clusters et les environnements Amazon Redshift sans serveur. Pour plus d'informations sur la façon d'ajouter des autorisations aux tâches ETL, consultez [Review IAM permissions needed for ETL jobs](https://docs.aws.amazon.com/glue/latest/ug/setting-up.html#getting-started-min-privs-job). 
+  décalage vers le rouge : DescribeClusters 
+  redshift-serverless : ListWorkgroups 
+  redshift-serverless : ListNamespaces 

## Présentation de
<a name="w2aac25c27c13c11b5"></a>

 Lorsque vous ajoutez une Amazon Redshift connexion, vous pouvez choisir une Amazon Redshift connexion existante ou en créer une nouvelle lorsque vous ajoutez une **source de données - nœud Redshift**. AWS Glue Studio 

 AWS Glueprend en charge à la fois les Amazon Redshift clusters et les environnements Amazon Redshift sans serveur. Lorsque vous créez une connexion, les environnements Amazon Redshift sans serveur affichent l'étiquette **sans serveur** à côté de l'option de connexion. 

 Pour plus d'informations sur la création d'une Amazon Redshift connexion, consultez la section [Déplacement de données vers et depuis Amazon Redshift](https://docs.aws.amazon.com/glue/latest/dg/aws-glue-programming-etl-redshift.html#aws-glue-programming-etl-redshift-using). 

# Création d'un nœud Amazon Redshift source
<a name="creating-redshift-source-node"></a>

## Autorisations nécessaires
<a name="creating-redshift-source-node-permissions"></a>

 AWS Glue Studio les tâches utilisant Amazon Redshift des sources de données nécessitent des autorisations supplémentaires. Pour plus d'informations sur la façon d'ajouter des autorisations aux tâches ETL, consultez [Review IAM permissions needed for ETL jobs](https://docs.aws.amazon.com/glue/latest/ug/setting-up.html#getting-started-min-privs-job). 

 Les autorisations suivantes sont nécessaires pour utiliser une Amazon Redshift connexion. 
+  données redshift : ListSchemas 
+  données redshift : ListTables 
+  données redshift : DescribeTable 
+  données redshift : ExecuteStatement 
+  données redshift : DescribeStatement 
+  données redshift : GetStatementResult 

## Ajouter une source Amazon Redshift de données
<a name="creating-redshift-source-node-add"></a>

**Pour ajouter un nœud **Source de données – Amazon Redshift** :**

1.  Choisissez le type Amazon Redshift d'accès : 
   +  Connexion directe aux données (recommandée) : choisissez cette option si vous souhaitez accéder directement à vos données Amazon Redshift . Il s'agit de l'option recommandée, mais également de l'option par défaut. 
   +  Data Catalog tables : choisissez cette option si vous souhaitez utiliser des tables du catalogue de données. 

1.  Si vous choisissez Connexion directe aux données, choisissez la connexion pour votre source de Amazon Redshift données. Cela suppose que la connexion existe déjà et que vous pouvez la sélectionner parmi les connexions existantes. Si vous devez créer une connexion, choisissez **Créer une connexion Redshift**. Pour en savoir plus, consultez [ Overview of using connectors and connections ](https://docs.aws.amazon.com/glue/latest/ug/connectors-chapter.html#using-connectors-overview). 

    Une fois que vous avez choisi une connexion, vous pouvez afficher ses propriétés en cliquant sur **Afficher les propriétés**. Les informations relatives à la connexion sont visibles, notamment l'URL, les groupes de sécurité, le sous-réseau, la zone de disponibilité, la description et les horodatages de création (UTC) et de dernière mise à jour (UTC). 

1.  Choisissez une option Amazon Redshift de source : 
   +  **Choisissez une seule table** : il s'agit de la table qui contient les données auxquelles vous souhaitez accéder à partir d'une seule Amazon Redshift table. 
   +  **Saisir une requête personnalisée** : vous permet d'accéder à un jeu de données à partir de plusieurs tables Amazon Redshift en fonction de votre requête personnalisée. 

1.  Si vous avez choisi une seule table, choisissez le Amazon Redshift schéma. La liste des schémas disponibles parmi lesquels choisir est déterminée par la table sélectionnée. 

    Vous pouvez également choisir **Saisir une requête personnalisée**. Choisissez cette option pour accéder à un jeu de données personnalisé à partir de plusieurs tables Amazon Redshift . Lorsque vous choisissez cette option, entrez la Amazon Redshift requête. 

    Lorsque vous vous connectez à un environnement Amazon Redshift sans serveur, ajoutez l'autorisation suivante à la requête personnalisée : 

   ```
               GRANT SELECT ON ALL TABLES IN <schema> TO PUBLIC
   ```

    Vous pouvez choisir **Déduire un schéma** pour lire le schéma en fonction de la requête que vous avez saisie. Vous pouvez également choisir l'**éditeur de requêtes Open Redshift pour saisir une Amazon Redshift requête**. Pour plus d'informations, consultez [Interrogation d'une base de données à l'aide de l'éditeur de requête](https://docs.aws.amazon.com/redshift/latest/mgmt/query-editor.html). 

1.  Dans **Performances et sécurité**, choisissez le répertoire intermédiaire Amazon S3 et le rôle IAM. 
   +  **Répertoire intermédiaire Amazon S3** : choisissez l'emplacement Amazon S3 pour les données intermédiaires temporaires. 
   +  **Rôle IAM** : choisissez le rôle IAM qui peut écrire sur l'emplacement Amazon S3 que vous avez sélectionné. 

1.  Dans **Paramètres Redshift personnalisés – facultatif**, saisissez le paramètre et la valeur. 

# Création d'un nœud Amazon Redshift cible
<a name="creating-redshift-target-node"></a>

## Autorisations nécessaires
<a name="creating-redshift-target-node-permissions"></a>

 AWS Glue Studio les tâches utilisant une cible de Amazon Redshift données nécessitent des autorisations supplémentaires. Pour plus d'informations sur la façon d'ajouter des autorisations aux tâches ETL, consultez [Review IAM permissions needed for ETL jobs](https://docs.aws.amazon.com/glue/latest/ug/setting-up.html#getting-started-min-privs-job). 

 Les autorisations suivantes sont nécessaires pour utiliser une Amazon Redshift connexion. 
+  données redshift : ListSchemas 
+  données redshift : ListTables 

## Ajouter un nœud Amazon Redshift cible
<a name="w2aac25c27c13c15b5"></a>

**Pour créer un nœud Amazon Redshift cible :**

1.  Choisissez une Amazon Redshift table existante comme cible ou entrez un nouveau nom de table. 

1.  Lorsque vous utilisez le nœud cible **Cible de données – Redshift**, vous pouvez choisir l'une des options suivantes : 
   +  **APPREND** : si une table existe déjà, insérez toutes les nouvelles données dans la table sous forme d'insertion. Si la table n'existe pas, créez-la, puis insérez toutes les nouvelles données. 

      Cochez également la case si vous souhaitez mettre à jour (UPSERT) les enregistrements existants dans la table cible. La table doit d'abord exister, sinon l'opération échouera. 
   +  **MERGE** : AWS Glue met à jour ou ajoute des données à votre table cible en fonction des conditions que vous spécifiez. 
**Note**  
 Pour utiliser l'action de fusion dansAWS Glue, vous devez activer la fonctionnalité de Amazon Redshift fusion. Pour savoir comment activer la fusion pour votre Amazon Redshift instance, consultez [MERGE (aperçu)](https://docs.aws.amazon.com/redshift/latest/dg/r_MERGE.html). 

      Choisissez parmi les options : 
     + **Choisir des clés et des actions simples** : choisissez les colonnes à utiliser comme clés de correspondance entre les données source et votre jeu de données cible. 

       Spécifiez les options suivantes lorsqu'elles correspondent :
       + Mettez à jour l'enregistrement dans votre jeu de données cible avec les données de la source.
       + Supprimez l'enregistrement dans votre jeu de données cible.

       Spécifiez les options suivantes lorsqu'elles ne correspondent pas :
       + Insérez les données source en tant que nouvelle ligne dans votre jeu de données cible.
       + Ne rien faire.
     + **Saisir une instruction MERGE personnalisée** : vous pouvez ensuite choisir **Valider l'instruction de fusion** pour vérifier si l'instruction est valide ou non.
   +  **TRUNCATE** : si une table existe déjà, tronquez les données de la table en effaçant d'abord le contenu de la table cible. Si la troncature est réussie, insérez toutes les données. Si la table n'existe pas, créez-la, puis insérez toutes les nouvelles données. Si la troncature échoue, l'opération échouera. 
   +  **DROP** : si une table existe déjà, supprimez les métadonnées et les données de la table. Si la suppression est réussie, insérez toutes les données. Si la table n'existe pas, créez-la, puis insérez toutes les nouvelles données. Si la suppression échoue, l'opération échouera. 
   +  **CREATE** : créez une table avec le nom par défaut. Si le nom de la table existe déjà, créez-en une avec le suffixe `job_datetime` au nom pour garantir son unicité. Toutes les données seront alors insérées dans la nouvelle table. Si la table existe, le suffixe sera ajouté au nom final de la table. Si elle n'existe pas, une table sera créée. Dans les deux cas, une nouvelle table sera créée. 

# Options avancées
<a name="creating-redshift-connection-advanced-options"></a>

 Consultez la section [Utilisation du connecteur Amazon Redshift Spark sur AWS Glue](https://docs.aws.amazon.com/glue/latest/dg/aws-glue-programming-etl-redshift.html#aws-glue-programming-etl-redshift-using). 