

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Résolution des problèmes
<a name="sagemaker-hyperpod-studio-troubleshoot"></a>

La section suivante répertorie les solutions de résolution des problèmes pour HyperPod Studio.

**Topics**
+ [Onglet Tâches](#sagemaker-hyperpod-studio-troubleshoot-tasks)
+ [Onglet Métriques](#sagemaker-hyperpod-studio-troubleshoot-metrics)

## Onglet Tâches
<a name="sagemaker-hyperpod-studio-troubleshoot-tasks"></a>

Si vous obtenez le message Custom Resource Definition (CRD) is not configured on the cluster dans l’onglet **Tâches**.
+ Accordez les politiques `EKSAdminViewPolicy` et `ClusterAccessRole` à votre rôle d’exécution de domaine. 

  Pour en savoir plus sur la façon d’ajouter des balises à votre rôle d’exécution, consultez [Balisage des rôles IAM](https://docs.aws.amazon.com/IAM/latest/UserGuide/id_tags_roles.html).

  Pour découvrir comment attacher des politiques à un utilisateur ou à un groupe IAM, consultez [Ajout et suppression d’autorisations basées sur l’identité IAM](https://docs.aws.amazon.com/IAM/latest/UserGuide/access_policies_manage-attach-detach.html).

Si la grille des tâches pour les métriques Slurm n’arrête pas de se charger dans l’onglet **Tâches**.
+ Assurez-vous que `RunAs` est activé dans les préférences de votre [gestionnaire de session AWS](https://docs.aws.amazon.com/systems-manager/latest/userguide/session-manager.html) et que le rôle que vous utilisez dispose de la balise `SSMSessionRunAs` attachée. 
  + Pour activer `RunAs`, accédez à l’onglet **Préférence** dans la [console Systems Manager](https://console.aws.amazon.com/systems-manager/session-manager). 
  +  [Activez la prise en charge de la fonctionnalité Exécuter en tant que pour les nœuds gérés Linux et macOS](https://docs.aws.amazon.com/systems-manager/latest/userguide/session-preferences-run-as.html). 

Pour une vue des tâches restreinte dans Studio pour les clusters EKS :
+ Si votre rôle d’exécution n’est pas autorisé à répertorier les espaces de noms pour les clusters EKS.
  + Consultez [Restriction de l’affichage des tâches dans Studio pour les clusters EKS](sagemaker-hyperpod-studio-setup-eks.md#sagemaker-hyperpod-studio-setup-eks-restrict-tasks-view).
+ Si les utilisateurs rencontrent des problèmes d’accès aux clusters EKS.

  1. Vérifiez que le RBAC est activé en exécutant la AWS CLI commande suivante.

     ```
     kubectl api-versions | grep rbac
     ```

     Cela devrait renvoyer rbac.authorization.k8s.io/v1.

  1. Vérifiez si `ClusterRole` et `ClusterRoleBinding` existent en exécutant les commandes suivantes.

     ```
     kubectl get clusterrole pods-events-crd-cluster-role
     kubectl get clusterrolebinding pods-events-crd-cluster-role-binding
     ```

  1. Vérifiez l’appartenance au groupe d’utilisateurs. Assurez-vous que l’utilisateur est correctement affecté au groupe `pods-events-crd-cluster-level` dans votre fournisseur d’identité ou IAM.
+ Si l’utilisateur ne peut pas voir de ressources.
  + Vérifiez l’appartenance aux groupes et assurez-vous que `ClusterRoleBinding` est correctement appliqué.
+ Si les utilisateurs peuvent voir les ressources dans tous les espaces de noms.
  + Si une restriction d’espace de noms est requise, envisagez d’utiliser `Role` et `RoleBinding` au lieu de `ClusterRole` et `ClusterRoleBinding`.
+ Si la configuration semble correcte, mais que les autorisations ne sont pas appliquées.
  + Vérifiez si des politiques `NetworkPolicies` ou `PodSecurityPolicies` interfèrent avec l’accès.

## Onglet Métriques
<a name="sagemaker-hyperpod-studio-troubleshoot-metrics"></a>

S'il n'y a pas de CloudWatch métriques Amazon, elles sont affichées dans l'onglet **Metrics**.
+ La `Metrics` section des détails du HyperPod cluster permet CloudWatch de récupérer les données. Afin de voir les métriques dans cette section, vous devez avoir activé [Observabilité des clusters et des tâches](sagemaker-hyperpod-eks-cluster-observability-cluster.md). Contactez votre administrateur pour configurer les métriques.