Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Le planificateur enregistre dans PCS AWS
Vous pouvez configurer AWS PCS pour envoyer des données de journalisation détaillées depuis votre planificateur de cluster à Amazon CloudWatch Logs, Amazon Simple Storage Service (Amazon S3) et Amazon Data Firehose. Cela peut faciliter la surveillance et le dépannage.
AWS PCS fournit des journaux à partir des démons Slurm suivants via le type de journal : PCS_SCHEDULER_LOGS
-
slurmctld— Le démon du contrôleur Slurm. Disponible pour toutes les versions de Slurm prises en charge. -
slurmdbd— Le démon de base de données Slurm. Disponible pour Slurm 24.11 et versions ultérieures. -
slurmrestd— Le démon de l'API REST de Slurm. Disponible pour Slurm 25.05 et versions ultérieures.
Les clusters dont la PCS_SCHEDULER_LOGS livraison est déjà configurée commencent automatiquement à recevoir slurmdbd et à slurmrestd se connecter lorsqu'ils exécutent une version compatible de Slurm. Aucune configuration supplémentaire n’est requise.
Table des matières
Conditions préalables
Le principal IAM qui gère le cluster AWS PCS doit autoriser l'pcs:AllowVendedLogDeliveryForResourceaction.
L'exemple de politique IAM suivant accorde les autorisations requises.
Configurer les journaux du planificateur
Vous pouvez configurer les journaux du planificateur pour votre cluster AWS PCS à l'aide du AWS Management Console ou. AWS CLI
Le planificateur enregistre les chemins et les noms des flux
Le chemin et le nom des journaux du planificateur AWS PCS dépendent du type de destination.
La ${log_name} valeur indiquée dans les chemins ci-dessous est slurmctldslurmdbd, ouslurmrestd, selon le démon qui a produit le journal.
-
CloudWatch Journaux
-
Un flux CloudWatch Logs suit cette convention de dénomination.
AWSLogs/PCS/${cluster_id}/${log_name}_${scheduler_major_version}.logExemple
AWSLogs/PCS/abcdef0123/slurmctld_25.11.log AWSLogs/PCS/abcdef0123/slurmdbd_24.11.log AWSLogs/PCS/abcdef0123/slurmrestd_25.05.log
-
-
Compartiment S3
-
Le chemin de sortie d'un compartiment S3 suit cette convention de dénomination :
AWSLogs/${account-id}/PCS/${region}/${cluster_id}/${log_name}/${scheduler_major_version}/yyyy/MM/dd/HH/Exemple
AWSLogs/111111111111/PCS/us-east-2/abcdef0123/slurmctld/25.11/2024/09/01/00/ AWSLogs/111111111111/PCS/us-east-2/abcdef0123/slurmdbd/24.11/2024/09/01/00/ AWSLogs/111111111111/PCS/us-east-2/abcdef0123/slurmrestd/25.05/2024/09/01/00/
-
Le nom d'un objet S3 suit cette convention :
PCS_${log_name}_${scheduler_major_version}_#{expr date 'event_timestamp', format: "yyyy-MM-dd-HH"}_${cluster_id}_${hash}.logExemple
PCS_slurmctld_25.11_2024-09-01-00_abcdef0123_0123abcdef.log
-
Exemples d'enregistrements du journal du planificateur
AWS Les journaux du planificateur PCS sont structurés. Ils incluent des champs tels que l'identifiant du cluster, le type de planificateur, les versions majeures et de correctif, en plus du message de journal émis par le processus du démon Slurm. Les node_type champs log_name et identifient le démon qui a produit le journal.
L'exemple suivant montre un enregistrement de slurmctld journal.
{
"resource_id": "s3431v9rx2",
"resource_type": "PCS_CLUSTER",
"event_timestamp": 1721230979,
"log_level": "info",
"log_name": "slurmctld",
"scheduler_type": "slurm",
"scheduler_major_version": "25.11",
"scheduler_patch_version": "2",
"node_type": "controller_primary",
"message": "[2024-07-17T15:42:58.614+00:00] Running as primary controller\n"
}
L'exemple suivant montre un enregistrement de slurmdbd journal (Slurm 24.11 et versions ultérieures).
{
"resource_id": "pcs_bu93qsds2j",
"resource_type": "PCS_CLUSTER",
"event_timestamp": 1774485082772,
"log_level": "info",
"log_name": "slurmdbd",
"scheduler_type": "slurm",
"scheduler_major_version": "25.11",
"scheduler_patch_version": "2",
"node_type": "slurmdbd_primary",
"message": "[2026-03-26T00:31:22.772+00:00] mysql_common: storage token refreshed"
}
L'exemple suivant montre un enregistrement de slurmrestd journal (Slurm 25.05 et versions ultérieures).
{
"resource_id": "pcs_bu93qsds2j",
"resource_type": "PCS_CLUSTER",
"event_timestamp": 1774485082772,
"log_level": "info",
"log_name": "slurmrestd",
"scheduler_type": "slurm",
"scheduler_major_version": "25.05",
"scheduler_patch_version": "3",
"node_type": "slurmrestd_primary",
"message": "[2026-03-26T00:31:22.772+00:00] slurmrestd: Listening on port 6820\n"
}