

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Essayer de créer un cluster
<a name="troubleshooting-fc-v3-create-cluster"></a>

Lorsque vous utilisez AWS ParallelCluster la version 3.5.0 ou ultérieure pour créer un cluster et que la création d'un cluster a échoué avec `--rollback-on-failure` set to`false`, utilisez la commande [`pcluster describe-cluster`](pcluster.describe-cluster-v3.md) CLI pour obtenir des informations sur l'état et les défaillances. Dans ce cas, le `pcluster describe-cluster` résultat attendu `clusterStatus` est`CREATE_FAILED`. Consultez la `failures` section de la sortie pour trouver le `failureCode` et`failureReason`. Ensuite, dans la section suivante, recherchez la solution correspondante `failureCode` pour obtenir une aide supplémentaire en matière de dépannage. Pour de plus amples informations, veuillez consulter [`pcluster describe-cluster`](pcluster.describe-cluster-v3.md).

Dans les sections suivantes, nous vous recommandons de consulter les journaux du nœud principal, tels que les `/var/log/chef-client.log` fichiers `/var/log/cfn-init.log` et. Pour plus d'informations sur AWS ParallelCluster les journaux et sur la façon de les consulter, consultez [Journaux clés pour le débogage](troubleshooting-v3-scaling-issues.md#troubleshooting-v3-key-logs) et[Récupération et conservation des journaux](troubleshooting-v3-get-logs.md).

Si vous n'en avez pas`failureCode`, accédez à la CloudFormation console pour afficher la pile du cluster. Vérifiez les `Status Reason` défaillances `HeadNodeWaitCondition` ou sur d'autres ressources pour obtenir des informations supplémentaires sur les défaillances. Pour de plus amples informations, veuillez consulter [Afficher CloudFormation les événements sur `CREATE_FAILED`](troubleshooting-v3-cluster-deployment.md#troubleshooting-v3-cluster-deployment-events). Vérifiez les `/var/log/chef-client.log` fichiers `/var/log/cfn-init.log` et sur le nœud principal. Si la création du cluster échoue en raison d'un échec de création du nœud principal et que les journaux du cluster ne sont pas disponibles dans le groupe de journaux du cluster, vous devez conserver le cluster en cas d'échec, spécifier `--rollback-on-failure` = `True` et récupérer les journaux depuis le nœud principal lui-même.

## `failureCode` est `OnNodeConfiguredExecutionFailure`
<a name="create-cluster-on-node-configured-executed-failure-v3"></a>
+ **Pourquoi a-t-il échoué ?**

  Vous avez fourni un script personnalisé dans la section `OnNodeConfigured` du nœud principal de la configuration pour créer un cluster. Cependant, le script personnalisé n'a pas pu être exécuté.
+ **Comment résoudre le problème ?**

  Consultez le `/var/log/cfn-init.log` fichier pour en savoir plus sur l'échec et sur la manière de résoudre le problème dans votre script personnalisé. Vers la fin de ce journal, des informations relatives à l'exécution du `OnNodeConfigured` script peuvent s'afficher après le `Running command runpostinstall` message.

## `failureCode` est `OnNodeConfiguredDownloadFailure`
<a name="create-cluster-on-node-configured-download-failure-v3"></a>
+ **Pourquoi a-t-il échoué ?**

  Vous avez fourni un script personnalisé dans la section `OnNodeConfigured` du nœud principal de la configuration pour créer un cluster. Cependant, le script personnalisé n'a pas pu être téléchargé.
+ **Comment résoudre le problème ?**

  Assurez-vous que l'URL est valide et que l'accès est correctement configuré. Pour plus d'informations sur la configuration des scripts bootstrap personnalisés, consultez[Actions de bootstrap personnalisées](custom-bootstrap-actions-v3.md).

  Vérifiez le `/var/log/cfn-init.log` fichier. Vers la fin de ce journal, vous pouvez voir des informations d'exécution relatives au traitement du `OnNodeConfigured` script, y compris au téléchargement, après le `Running command runpostinstall` message.

## `failureCode` est `OnNodeConfiguredFailure`
<a name="create-cluster-on-node-configured-failure-v3"></a>
+ **Pourquoi a-t-il échoué ?**

  Vous avez fourni un script personnalisé dans la section `OnNodeConfigured` du nœud principal de la configuration pour créer un cluster. Cependant, l'utilisation du script personnalisé a échoué lors du déploiement du cluster. Aucune cause immédiate ne peut être déterminée et une enquête supplémentaire est nécessaire.
+ **Comment résoudre le problème ?**

  Vérifiez le `/var/log/cfn-init.log` fichier. Vers la fin de ce journal, vous pouvez voir des informations d'exécution relatives au traitement du `OnNodeConfigured` script après le `Running command runpostinstall` message.

## `failureCode` est `OnNodeStartExecutionFailure`
<a name="create-cluster-on-node-start-execution-failure-v3"></a>
+ **Pourquoi a-t-il échoué ?**

  Vous avez fourni un script personnalisé dans la section `OnNodeStart` du nœud principal de la configuration pour créer un cluster. Cependant, le script personnalisé n'a pas pu être exécuté.
+ **Comment résoudre le problème ?**

  Consultez le `/var/log/cfn-init.log` fichier pour en savoir plus sur l'échec et sur la manière de résoudre le problème dans votre script personnalisé. Vers la fin de ce journal, des informations relatives à l'exécution du `OnNodeStart` script peuvent s'afficher après le `Running command runpreinstall` message.

## `failureCode` est `OnNodeStartDownloadFailure`
<a name="create-cluster-on-node-start-download-failure-v3"></a>
+ **Pourquoi a-t-il échoué ?**

  Vous avez fourni un script personnalisé dans la section `OnNodeStart` du nœud principal de la configuration pour créer un cluster. Cependant, le script personnalisé n'a pas pu être téléchargé.
+ **Comment résoudre le problème ?**

  Assurez-vous que l'URL est valide et que l'accès est correctement configuré. Pour plus d'informations sur la configuration des scripts bootstrap personnalisés, consultez[Actions de bootstrap personnalisées](custom-bootstrap-actions-v3.md).

  Vérifiez le `/var/log/cfn-init.log` fichier. Vers la fin de ce journal, vous pouvez voir des informations d'exécution relatives au traitement du `OnNodeStart` script, y compris au téléchargement, après le `Running command runpreinstall` message.

## `failureCode` est `OnNodeStartFailure`
<a name="create-cluster-on-node-start-failure-v3"></a>
+ **Pourquoi a-t-il échoué ?**

  Vous avez fourni un script personnalisé dans la section `OnNodeStart` du nœud principal de la configuration pour créer un cluster. Cependant, l'utilisation du script personnalisé a échoué lors du déploiement du cluster. Aucune cause immédiate ne peut être déterminée et une enquête supplémentaire est nécessaire.
+ **Comment résoudre le problème ?**

  Vérifiez le `/var/log/cfn-init.log` fichier. Vers la fin de ce journal, vous pouvez voir des informations d'exécution relatives au traitement du `OnNodeStart` script après le `Running command runpreinstall` message.

## `failureCode` est `EbsMountFailure`
<a name="create-cluster-ebs-mount-failure-v3"></a>
+ **Pourquoi a-t-il échoué ?**

  Le volume EBS défini dans la configuration du cluster n'a pas pu être monté.
+ **Comment résoudre le problème ?**

  Consultez le `/var/log/chef-client.log` fichier pour obtenir des informations détaillées sur l'échec.

## `failureCode` est `EfsMountFailure`
<a name="create-cluster-efs-mount-failure-v3"></a>
+ **Pourquoi a-t-il échoué ?**

  Le volume Amazon EFS défini dans la configuration du cluster n'a pas pu être monté.
+ **Comment résoudre le problème ?**

  Si vous avez défini un système de fichiers Amazon EFS existant, assurez-vous que le trafic est autorisé entre le cluster et le système de fichiers. Pour plus d'informations, consultez [`SharedStorage`](SharedStorage-v3.md)/[`EfsSettings`](SharedStorage-v3.md#SharedStorage-v3-EfsSettings)/[`FileSystemId`](SharedStorage-v3.md#yaml-SharedStorage-EfsSettings-FileSystemId).

  Consultez le `/var/log/chef-client.log` fichier pour obtenir des informations détaillées sur l'échec.

## `failureCode` est `FsxMountFailure`
<a name="create-cluster-fsx-mount-failure-v3"></a>
+ **Pourquoi a-t-il échoué ?**

  Le système de FSx fichiers Amazon défini dans la configuration du cluster n'a pas pu être monté.
+ **Comment résoudre le problème ?**

  Si vous avez défini un système de FSx fichiers Amazon existant, assurez-vous que le trafic est autorisé entre le cluster et le système de fichiers. Pour plus d'informations, consultez [`SharedStorage`](SharedStorage-v3.md)/[`FsxLustreSettings`](SharedStorage-v3.md#SharedStorage-v3-FsxLustreSettings)/[`FileSystemId`](SharedStorage-v3.md#yaml-SharedStorage-FsxLustreSettings-FileSystemId).

  Consultez le `/var/log/chef-client.log` fichier pour obtenir des informations détaillées sur l'échec.

## `failureCode` est `RaidMountFailure`
<a name="create-cluster-raid-mount-failure-v3"></a>
+ **Pourquoi a-t-il échoué ?**

  Les volumes RAID définis dans la configuration du cluster n'ont pas pu être montés.
+ **Comment résoudre le problème ?**

  Consultez le `/var/log/chef-client.log` fichier pour obtenir des informations détaillées sur l'échec.

## `failureCode` est `AmiVersionMismatch`
<a name="create-cluster-ami-version-mismatch-v3"></a>
+ **Pourquoi a-t-il échoué ?**

  La AWS ParallelCluster version utilisée pour créer l'AMI personnalisée est différente de AWS ParallelCluster celle utilisée pour configurer le cluster. Dans la CloudFormation console, consultez les détails de la CloudFormation pile de clusters et cochez la case « `Status Reason` for `HeadNodeWaitCondition` the » pour obtenir des informations supplémentaires sur les AWS ParallelCluster versions et l'AMI. Pour de plus amples informations, veuillez consulter [Afficher CloudFormation les événements sur `CREATE_FAILED`](troubleshooting-v3-cluster-deployment.md#troubleshooting-v3-cluster-deployment-events).
+ **Comment résoudre le problème ?**

  Assurez-vous que la AWS ParallelCluster version utilisée pour créer l'AMI personnalisée est la même que celle AWS ParallelCluster utilisée pour configurer le cluster. Vous pouvez modifier la version personnalisée de l'AMI ou la version de la `pcluster` CLI pour les rendre identiques.

## `failureCode` est `InvalidAmi`
<a name="create-cluster-invalid-ami-v3"></a>
+ **Pourquoi a-t-il échoué ?**

  L'AMI personnalisée n'est pas valide car elle n'a pas été créée à l'aide de AWS ParallelCluster.
+ **Comment résoudre le problème ?**

  Utilisez la `pcluster build-image` commande pour créer une AMI en faisant de votre AMI l'image parent. Pour de plus amples informations, veuillez consulter [`pcluster build-image`](pcluster.build-image-v3.md).

## `failureCode`porte `HeadNodeBootstrapFailure` la mention « `failureReason` Impossible de configurer le nœud principal ».
<a name="create-cluster-head-node-bootstrap-setup-failure-v3"></a>
+ **Pourquoi a-t-il échoué ?**

  Aucune cause immédiate ne peut être déterminée et une enquête supplémentaire est nécessaire. Par exemple, il se peut que le cluster soit protégé, ce qui peut être dû à un échec du provisionnement du parc informatique statique.
+ **Comment résoudre le problème ?**

  Consultez le `/var/log/chef-client.log.` fichier pour obtenir des informations détaillées sur l'échec.
**Note**  
Si vous `RuntimeError` `Cluster state has been set to PROTECTED mode due to failures detected in static node provisioning` constatez une exception, le cluster est protégé. Pour de plus amples informations, veuillez consulter [Comment déboguer le mode protégé](slurm-protected-mode-v3.md#slurm-protected-mode-debug-v3).

## `failureCode`est que `HeadNodeBootstrapFailure` le délai de création `failureReason` du cluster est expiré.
<a name="create-cluster-head-node-bootstrap-timeout-failure-v3"></a>
+ **Pourquoi a-t-il échoué ?**

  Par défaut, la création du cluster est limitée à 30 minutes. Si la création du cluster n'est pas terminée dans ce délai, la création du cluster échoue avec une erreur de temporisation. La création du cluster peut être interrompue pour différentes raisons. Par exemple, les délais d'expiration peuvent être dus à un échec de création d'un nœud principal, à un problème réseau, à l'exécution de scripts personnalisés trop longs dans le nœud principal, à une erreur dans un script personnalisé exécuté dans les nœuds de calcul ou à de longs délais d'attente pour le provisionnement du nœud de calcul. Aucune cause immédiate ne peut être déterminée et une enquête supplémentaire est nécessaire.
+ **Comment résoudre le problème ?**

  Consultez les `/var/log/chef-client.log` fichiers `/var/log/cfn-init.log` et pour obtenir des informations détaillées sur les défaillances. Pour plus d'informations sur AWS ParallelCluster les journaux et sur la façon de les obtenir, consultez [Journaux clés pour le débogage](troubleshooting-v3-scaling-issues.md#troubleshooting-v3-key-logs) et[Récupération et conservation des journaux](troubleshooting-v3-get-logs.md).

  Vous découvrirez peut-être ce qui suit dans ces journaux.
  + **Vu `Waiting for static fleet capacity provisioning` vers la fin du `chef-client.log`**

    Cela indique que le délai de création du cluster a expiré lors de l'attente du démarrage des nœuds statiques. Pour de plus amples informations, veuillez consulter [Observation des erreurs lors de l'initialisation des nœuds de calcul](troubleshooting-fc-v3-compute-node-initialization-v3.md).
  + **Le script Seeing `OnNodeConfigured` ou `OnNodeStart` Head Node n'est pas terminé à la fin du `cfn-init.log`**

    Cela indique que l'exécution du script `OnNodeConfigured` ou du script `OnNodeStart` personnalisé a pris du temps et a provoqué une erreur de temporisation. Vérifiez que votre script personnalisé ne présente aucun problème susceptible de provoquer son exécution prolongée. Si l'exécution de votre script personnalisé prend du temps, pensez à modifier le délai d'expiration en ajoutant une `DevSettings` section au fichier de configuration de votre cluster, comme illustré dans l'exemple suivant :

    ```
    DevSettings:
      Timeouts:
        HeadNodeBootstrapTimeout: 1800 # default setting: 1800 seconds
    ```
  + **Impossible de trouver les journaux ou le nœud principal n'a pas été créé correctement**

    Il est possible que le nœud principal n'ait pas été créé correctement et que les journaux soient introuvables. Dans ce cas, vous pouvez obtenir des informations supplémentaires sur les défaillances en consultant les événements de la CloudFormation pile et le journal de la console du nœud principal. Vous pouvez récupérer le journal de la console du nœud principal via la console Amazon EC2 ou en exécutant la commande Amazon EC2 CLI suivante :

    ```
    aws ec2 get-console-output --instance-id {{HEAD_NODE_INSTANCE_ID}} --output text
    ```

## `failureCode`est `HeadNodeBootstrapFailure` associé à `failureReason` Failed to bootstrap the head node.
<a name="create-cluster-head-node-bootstrap-failure-v3"></a>
+ **Pourquoi a-t-il échoué ?**

  Aucune cause immédiate ne peut être déterminée et une enquête supplémentaire est nécessaire.
+ **Comment résoudre le problème ?**

  Vérifiez les `/var/log/chef-client.log` fichiers `/var/log/cfn-init.log` et.

## `failureCode` est `ResourceCreationFailure`
<a name="create-cluster-resource-creation-failure-v3"></a>
+ **Pourquoi a-t-il échoué ?**

  La création de certaines ressources a échoué lors du processus de création du cluster. La panne peut survenir pour diverses raisons. Par exemple, les échecs de création de ressources peuvent être dus à des problèmes de capacité ou à une politique IAM mal configurée.
+ **Comment résoudre le problème ?**

  Dans la CloudFormation console, consultez la pile de clusters pour vérifier les détails supplémentaires relatifs à l'échec de création de ressources.

## `failureCode` est `ClusterCreationFailure`
<a name="cluster-creation-failure-v3"></a>
+ **Pourquoi a-t-il échoué ?**

  Aucune cause immédiate ne peut être déterminée et une enquête supplémentaire est nécessaire.
+ **Comment résoudre le problème ?**

  Dans la CloudFormation console, consultez la pile du cluster et vérifiez la présence de `Status Reason` `HeadNodeWaitCondition` pour trouver des informations supplémentaires sur les défaillances.

  Vérifiez les `/var/log/chef-client.log` fichiers `/var/log/cfn-init.log` et.

## Voir `WaitCondition timed out...` dans la CloudFormation pile
<a name="create-cluster-wait-condition-timeout-v3"></a>

Pour de plus amples informations, veuillez consulter [`failureCode`est que `HeadNodeBootstrapFailure` le délai de création `failureReason` du cluster est expiré.](#create-cluster-head-node-bootstrap-timeout-failure-v3).

## Voir `Resource creation cancelled` dans la CloudFormation pile
<a name="create-cluster-resource-create-error-v3"></a>

Pour de plus amples informations, veuillez consulter [`failureCode` est `ResourceCreationFailure`](#create-cluster-resource-creation-failure-v3).

## Erreurs `Failed to run cfn-init...` visibles ou autres dans la CloudFormation pile
<a name="create-cluster-cfn-init-fail-error-v3"></a>

Consultez le `/var/log/cfn-init.log` et `/var/log/chef-client.log` pour obtenir des informations supplémentaires sur les défaillances.

## Voir `chef-client.log` se termine par `INFO: Waiting for static fleet capacity provisioning`
<a name="create-cluster-wait-on-fleet-capacity-v3"></a>

Cela est lié au délai de création du cluster lorsque vous attendez que les nœuds statiques s'allument. Pour de plus amples informations, veuillez consulter [Observation des erreurs lors de l'initialisation des nœuds de calcul](troubleshooting-fc-v3-compute-node-initialization-v3.md).

## Voyant `Failed to run preinstall or postinstall in cfn-init.log`
<a name="create-cluster-pre-post-install-v3"></a>

Vous avez un `OnNodeStart` script `OnNodeConfigured` or dans la `HeadNode` section de configuration du cluster. Le script ne fonctionne pas correctement. Consultez le `/var/log/cfn-init.log` fichier pour obtenir des informations détaillées sur les erreurs de script personnalisées.

## Voir `This AMI was created with xxx, but is trying to be used with xxx...` dans la CloudFormation pile
<a name="create-cluster-ami-mismatch-error-v3"></a>

Pour de plus amples informations, veuillez consulter [`failureCode` est `AmiVersionMismatch`](#create-cluster-ami-version-mismatch-v3).

## Voir `This AMI was not baked by AWS ParallelCluster...` dans la CloudFormation pile
<a name="create-cluster-ami-incomplete-error-v3"></a>

Pour de plus amples informations, veuillez consulter [`failureCode` est `InvalidAmi`](#create-cluster-invalid-ami-v3).

## Voir que `pcluster create-cluster` la commande ne s'exécute pas localement
<a name="create-cluster-pcluster-cli-error-v3"></a>

Consultez le fichier `~/.parallelcluster/pcluster-cli.log` de votre système de fichiers local pour obtenir des informations sur les défaillances.

## Support supplémentaire
<a name="create-cluster-additional-support-v3"></a>

Suivez les instructions de dépannage dans[Résolution des problèmes de déploiement de clusters](troubleshooting-v3-cluster-deployment.md).

Vérifiez si votre scénario est couvert dans la section [Problèmes GitHub connus](https://github.com/aws/aws-parallelcluster/wiki) à AWS ParallelCluster On GitHub.