Enregistrement de catalogues de données Redshift dans Athena - Amazon Athena

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Enregistrement de catalogues de données Redshift dans Athena

Athena peut lire et écrire des données stockées dans des espaces de noms sans serveur ou des clusters Redshift enregistrés dans le AWS Glue Data Catalog. Cela fonctionne en parallèle avec AWS Lake Formation, ce qui fournit une sécurité et une gouvernance centralisées, garantit que l'accès aux données est géré de manière cohérente sur les différents moteurs de requête et maintient des contrôles d'accès précis pour les données Redshift partagées.

Considérations et restrictions

  • Vues matérialisées : les vues matérialisées Amazon Redshift peuvent être interrogées à partir d’Athena, mais la création de vues matérialisées à l’aide d’Athena ou de Spark n’est pas prise en charge.

  • Les opérations DDL, y compris le paramétrage AWS Glue Data Catalog de la configuration et les opérations sur les tables de stockage gérées par Amazon Redshift, ne sont pas prises en charge.

Conditions préalables

Avant de pouvoir interroger un catalogue de AWS Glue données auprès d'Athena, effectuez les tâches suivantes :

  1. Créez et enregistrez un cluster ou un espace de noms sans serveur Amazon Redshift dans le AWS Glue Data Catalog. Pour plus d’informations, consultez Registering a cluster to the AWS Glue Data Catalog ou Registering namespaces to the AWS Glue Data Catalog dans le Guide de gestion d’Amazon Redshift.

  2. Créez un catalogue de données à AWS Lake Formation partir de l'espace de noms enregistré. Pour plus d'informations, consultez la section Création de catalogues fédérés Amazon Redshift dans le manuel du développeur. AWS Lake Formation

  3. (Facultatif) Utilisez Lake Formation pour définir des contrôles d’accès précis dans le catalogue. Pour plus d'informations, consultez la section Intégrer vos données AWS Glue Data Catalog dans le Guide du AWS Lake Formation développeur.

Enregistrement d’un catalogue de données Redshift à l’aide de la console Athena

Pour enregistrer un catalogue de données Redshift à l’aide de la console Athena, effectuez les étapes suivantes.

  1. Ouvrez la console à l'adresse https://console.aws.amazon.com/athena/.

  2. Dans le panneau de navigation, sélectionnez Sources de données et catalogues.

  3. Sur la page Sources de données et catalogues, sélectionnez Créer une source de données.

  4. Dans Choisir une source de données, sélectionnez Amazon S3 – AWS Glue Data Catalog.

  5. Dans la section AWS Glue Data Catalog, dans Compte de source de données, sélectionnez AWS Glue Data Catalog dans ce compte.

  6. Pour Créer une table ou enregistrer un catalogue, choisissez Enregistrer un nouveau AWS Glue catalogue.

  7. Dans la section Détails de la source de données, dans Nom de la source de données, saisissez le nom que vous souhaitez utiliser pour spécifier la source de données dans vos requêtes SQL ou utilisez le nom par défaut généré.

  8. Pour Catalogue, choisissez Parcourir pour rechercher une liste de AWS Glue catalogues dans le même compte. Si vous ne voyez aucun catalogue existant, créez-en un dans la console AWS Glue.

  9. Dans la boîte de dialogue Parcourir AWS Glue les catalogues, sélectionnez le catalogue que vous souhaitez utiliser, puis choisissez Choisir.

  10. (Facultatif) Pour les balises, entrez les key/value paires que vous souhaitez associer à la source de données.

  11. Choisissez Suivant.

  12. Sur la page Vérifier et créer, vérifiez que les informations que vous avez saisies sont correctes, puis sélectionnez Créer une source de données.