Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Exécution d'une PySpark tâche sur une table configurée à l'aide d'un modèle d' PySpark analyse
Cette procédure explique comment utiliser un modèle d' PySpark analyse dans la AWS Clean Rooms console pour analyser des tables configurées à l'aide de la règle d'analyse personnalisée.
Pour exécuter une PySpark tâche sur une table configurée à l'aide d'un modèle d' PySpark analyse
Connectez-vous à la AWS Clean Rooms console AWS Management Console et ouvrez-la à l'adresse https://console.aws.amazon.com/cleanrooms
-
Dans le volet de navigation de gauche, sélectionnez Collaborations.
-
Choisissez la collaboration dont le statut de compétences de vos membres est Run jobs.
-
Dans l'onglet Analyse, sous la section Tables, visualisez les tables et le type de règle d'analyse associé (règle d'analyse personnalisée).
Note
Si les tables attendues ne figurent pas dans la liste, c'est peut-être pour les raisons suivantes :
-
Les tables n'ont pas été associées.
-
Aucune règle d'analyse n'est configurée pour les tables.
-
-
Dans la section Analyse, pour le mode Analyse, sélectionnez Exécuter les modèles d'analyse.
-
Choisissez le modèle PySpark d'analyse dans la liste déroulante des modèles d'analyse.
Les paramètres du modèle PySpark d'analyse seront automatiquement renseignés dans la définition.
-
Si des paramètres sont définis dans le modèle d'analyse, sous Paramètres, fournissez les valeurs des paramètres :
-
Pour chaque paramètre, consultez le nom du paramètre et la valeur par défaut (si configuré).
-
Entrez une valeur pour chaque paramètre que vous souhaitez remplacer.
Note
Si vous ne fournissez aucune valeur mais qu'une valeur par défaut existe, la valeur par défaut sera utilisée.
Important
Les valeurs des paramètres peuvent comporter jusqu'à 1 000 caractères et sont compatibles avec le codage UTF-8. Toutes les valeurs de paramètres sont traitées comme des chaînes et transmises à votre script utilisateur via l'objet de contexte.
Assurez-vous que votre script utilisateur valide et gère les valeurs des paramètres en toute sécurité. Pour plus d'informations sur la gestion sécurisée des paramètres, consultezUtilisation des paramètres dans les modèles PySpark d'analyse.
-
-
Spécifiez le type de travailleur pris en charge et le nombre de travailleurs.
Utilisez le tableau suivant pour déterminer le type et le nombre de travailleurs dont vous avez besoin pour votre cas d'utilisation.
Type d’employé vCPU Mémoire (Go) Stockage (Go) Nombre d'employés Nombre total d'unités de traitement pour salles blanches (CRPU) CR.1X (par défaut) 4 30 100 4 8 128 256 CR.4X 16 120 400 4 32 32 256 Note
Les différents types de travailleurs et le nombre de travailleurs entraînent des coûts associés. Pour en savoir plus sur les tarifs, consultez la section AWS Clean Rooms Tarifs
. -
Cliquez sur Exécuter.
Note
Vous ne pouvez pas exécuter le travail si le membre qui peut recevoir les résultats n'a pas configuré les paramètres des résultats du travail.
-
Continuez à ajuster les paramètres et réexécutez votre tâche, ou cliquez sur le bouton + pour démarrer une nouvelle tâche dans un nouvel onglet.