

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Intentando crear un clúster
<a name="troubleshooting-fc-v3-create-cluster"></a>

Si utiliza la AWS ParallelCluster versión 3.5.0 y versiones posteriores para crear un clúster y se produce un error en la creación de un clúster con el `--rollback-on-failure` valor establecido en`false`, utilice el comando [`pcluster describe-cluster`](pcluster.describe-cluster-v3.md) CLI para obtener información sobre el estado y el error. En este caso, lo que se espera `clusterStatus` del `pcluster describe-cluster` resultado es`CREATE_FAILED`. Compruebe la `failures` sección de la salida para encontrar el `failureCode` y`failureReason`. Luego, en la siguiente sección, busque la solución adecuada `failureCode` para obtener ayuda adicional sobre la solución de problemas. Para obtener más información, consulte [`pcluster describe-cluster`](pcluster.describe-cluster-v3.md).

En las siguientes secciones, le recomendamos que compruebe los registros del nodo principal, como los `/var/log/chef-client.log` archivos `/var/log/cfn-init.log` and. Para obtener más información sobre AWS ParallelCluster los registros y cómo verlos, consulte [Registros clave para la depuración](troubleshooting-v3-scaling-issues.md#troubleshooting-v3-key-logs) y[Recuperación y conservación de registros](troubleshooting-v3-get-logs.md).

Si no tiene uno`failureCode`, vaya a la CloudFormation consola para ver la pila de clústeres. Compruebe si hay errores en otros recursos para obtener información adicional sobre los errores. `Status Reason` `HeadNodeWaitCondition` Para obtener más información, consulte [Vea CloudFormation los eventos en `CREATE_FAILED`](troubleshooting-v3-cluster-deployment.md#troubleshooting-v3-cluster-deployment-events). Compruebe los `/var/log/chef-client.log` archivos `/var/log/cfn-init.log` y del nodo principal. Si la creación del clúster falla debido a un error en la creación del nodo principal y los registros del clúster no están disponibles en el grupo de registros del clúster, debe conservar el clúster en caso de error, especificar `--rollback-on-failure` = `True` y recuperar los registros desde el propio nodo principal.

## `failureCode` es `OnNodeConfiguredExecutionFailure`
<a name="create-cluster-on-node-configured-executed-failure-v3"></a>
+ **¿Por qué falló?**

  Proporcionó un script personalizado en la sección `OnNodeConfigured` del nodo principal de la configuración para crear un clúster. Sin embargo, el script personalizado no se pudo ejecutar.
+ **¿Cómo resolverlo?**

  Consulte el `/var/log/cfn-init.log` archivo para obtener más información sobre el error y cómo solucionar el problema en su script personalizado. Cerca del final de este registro, es posible que veas información de ejecución relacionada con el `OnNodeConfigured` script después del `Running command runpostinstall` mensaje.

## `failureCode` es `OnNodeConfiguredDownloadFailure`
<a name="create-cluster-on-node-configured-download-failure-v3"></a>
+ **¿Por qué falló?**

  Proporcionó un script personalizado en la sección `OnNodeConfigured` del nodo principal de la configuración para crear un clúster. Sin embargo, no se pudo descargar el script personalizado.
+ **¿Cómo resolverlo?**

  Asegúrese de que la URL sea válida y de que el acceso esté configurado correctamente. Para obtener más información sobre la configuración de los scripts de arranque personalizados, consulte[Acciones de arranque personalizadas](custom-bootstrap-actions-v3.md).

  Compruebe los archivos en `/var/log/cfn-init.log`. Al final de este registro, es posible que, después del `Running command runpostinstall` mensaje, aparezca información sobre la ejecución relacionada con el procesamiento de los `OnNodeConfigured` scripts, incluida la descarga.

## `failureCode` es `OnNodeConfiguredFailure`
<a name="create-cluster-on-node-configured-failure-v3"></a>
+ **¿Por qué falló?**

  Proporcionó un script personalizado en la sección `OnNodeConfigured` del nodo principal de la configuración para crear un clúster. Sin embargo, el uso del script personalizado falló en la implementación del clúster. No se puede determinar una causa inmediata y es necesaria una investigación adicional.
+ **¿Cómo resolverlo?**

  Compruebe los archivos en `/var/log/cfn-init.log`. Cerca del final de este registro, es posible que vea información de ejecución relacionada con el procesamiento de `OnNodeConfigured` scripts después del `Running command runpostinstall` mensaje.

## `failureCode` es `OnNodeStartExecutionFailure`
<a name="create-cluster-on-node-start-execution-failure-v3"></a>
+ **¿Por qué falló?**

  Proporcionó un script personalizado en la sección `OnNodeStart` del nodo principal de la configuración para crear un clúster. Sin embargo, el script personalizado no se pudo ejecutar.
+ **¿Cómo resolverlo?**

  Consulte el `/var/log/cfn-init.log` archivo para obtener más información sobre el error y cómo solucionar el problema en su script personalizado. Cerca del final de este registro, es posible que veas información de ejecución relacionada con el `OnNodeStart` script después del `Running command runpreinstall` mensaje.

## `failureCode` es `OnNodeStartDownloadFailure`
<a name="create-cluster-on-node-start-download-failure-v3"></a>
+ **¿Por qué falló?**

  Proporcionó un script personalizado en la sección `OnNodeStart` del nodo principal de la configuración para crear un clúster. Sin embargo, no se pudo descargar el script personalizado.
+ **¿Cómo resolverlo?**

  Asegúrese de que la URL sea válida y de que el acceso esté configurado correctamente. Para obtener más información sobre la configuración de los scripts de arranque personalizados, consulte[Acciones de arranque personalizadas](custom-bootstrap-actions-v3.md).

  Compruebe los archivos en `/var/log/cfn-init.log`. Al final de este registro, es posible que, después del `Running command runpreinstall` mensaje, aparezca información sobre la ejecución relacionada con el procesamiento de los `OnNodeStart` scripts, incluida la descarga.

## `failureCode` es `OnNodeStartFailure`
<a name="create-cluster-on-node-start-failure-v3"></a>
+ **¿Por qué falló?**

  Proporcionó un script personalizado en la sección `OnNodeStart` del nodo principal de la configuración para crear un clúster. Sin embargo, el uso del script personalizado falló en la implementación del clúster. No se puede determinar una causa inmediata y es necesaria una investigación adicional.
+ **¿Cómo resolverlo?**

  Compruebe los archivos en `/var/log/cfn-init.log`. Cerca del final de este registro, es posible que vea información de ejecución relacionada con el procesamiento de `OnNodeStart` scripts después del `Running command runpreinstall` mensaje.

## `failureCode` es `EbsMountFailure`
<a name="create-cluster-ebs-mount-failure-v3"></a>
+ **¿Por qué falló?**

  No se pudo montar el volumen de EBS definido en la configuración del clúster.
+ **¿Cómo resolverlo?**

  Consulte el archivo `/var/log/chef-client.log` para conocer los detalles del error.

## `failureCode` es `EfsMountFailure`
<a name="create-cluster-efs-mount-failure-v3"></a>
+ **¿Por qué falló?**

  No se pudo montar el volumen de Amazon EFS definido en la configuración del clúster.
+ **¿Cómo resolverlo?**

  Si ha definido un sistema de archivos Amazon EFS existente, asegúrese de que se permita el tráfico entre el clúster y el sistema de archivos. Para obtener más información, consulte [`SharedStorage`](SharedStorage-v3.md). [`EfsSettings`](SharedStorage-v3.md#SharedStorage-v3-EfsSettings) [`FileSystemId`](SharedStorage-v3.md#yaml-SharedStorage-EfsSettings-FileSystemId).

  Consulte el archivo `/var/log/chef-client.log` para conocer los detalles del error.

## `failureCode` es `FsxMountFailure`
<a name="create-cluster-fsx-mount-failure-v3"></a>
+ **¿Por qué falló?**

  No se pudo montar el sistema de FSx archivos de Amazon definido en la configuración del clúster.
+ **¿Cómo resolverlo?**

  Si has definido un sistema de FSx archivos de Amazon existente, asegúrate de que se permita el tráfico entre el clúster y el sistema de archivos. Para obtener más información, consulte [`SharedStorage`](SharedStorage-v3.md). [`FsxLustreSettings`](SharedStorage-v3.md#SharedStorage-v3-FsxLustreSettings) [`FileSystemId`](SharedStorage-v3.md#yaml-SharedStorage-FsxLustreSettings-FileSystemId).

  Consulte el archivo `/var/log/chef-client.log` para conocer los detalles del error.

## `failureCode` es `RaidMountFailure`
<a name="create-cluster-raid-mount-failure-v3"></a>
+ **¿Por qué falló?**

  No se pudieron montar los volúmenes RAID definidos en la configuración del clúster.
+ **¿Cómo resolverlo?**

  Consulte el archivo `/var/log/chef-client.log` para conocer los detalles del error.

## `failureCode` es `AmiVersionMismatch`
<a name="create-cluster-ami-version-mismatch-v3"></a>
+ **¿Por qué falló?**

  La AWS ParallelCluster versión utilizada para crear la AMI personalizada es diferente de la AWS ParallelCluster versión utilizada para configurar el clúster. En la CloudFormation consola, consulte los detalles de la CloudFormation `Status Reason` pila de clústeres y compruebe si `HeadNodeWaitCondition` desea obtener información adicional sobre las AWS ParallelCluster versiones y la AMI. Para obtener más información, consulte [Vea CloudFormation los eventos en `CREATE_FAILED`](troubleshooting-v3-cluster-deployment.md#troubleshooting-v3-cluster-deployment-events).
+ **¿Cómo resolverlo?**

  Asegúrese de que la AWS ParallelCluster versión utilizada para crear la AMI personalizada sea la misma AWS ParallelCluster que se utilizó para configurar el clúster. Puede cambiar la versión de la AMI personalizada o la versión de la `pcluster` CLI para que sean iguales.

## `failureCode` es `InvalidAmi`
<a name="create-cluster-invalid-ami-v3"></a>
+ **¿Por qué falló?**

  La AMI personalizada no es válida porque no se creó con AWS ParallelCluster.
+ **¿Cómo resolverlo?**

  Use el `pcluster build-image` comando para crear una AMI haciendo que su AMI sea la imagen principal. Para obtener más información, consulte [`pcluster build-image`](pcluster.build-image-v3.md).

## `failureCode`está `HeadNodeBootstrapFailure` con `failureReason` No se pudo configurar el nodo principal.
<a name="create-cluster-head-node-bootstrap-setup-failure-v3"></a>
+ **¿Por qué falló?**

  No se puede determinar una causa inmediata y es necesaria una investigación adicional. Por ejemplo, podría ser que el clúster esté en estado protegido y esto podría deberse a un fallo en el aprovisionamiento de la flota de computación estática.
+ **¿Cómo resolverlo?**

  Consulte el archivo `/var/log/chef-client.log.` para conocer los detalles del error.
**nota**  
Si ve la excepción de `RuntimeError` `Cluster state has been set to PROTECTED mode due to failures detected in static node provisioning`, el clúster está en estado protegido. Para obtener más información, consulte [Cómo depurar el modo protegido](slurm-protected-mode-v3.md#slurm-protected-mode-debug-v3).

## `failureCode`está `HeadNodeBootstrapFailure` agotando el tiempo de espera para la creación del `failureReason` clúster.
<a name="create-cluster-head-node-bootstrap-timeout-failure-v3"></a>
+ **¿Por qué falló?**

  De forma predeterminada, hay un límite de 30 minutos para que se complete la creación del clúster. Si la creación del clúster no se ha completado dentro de este período de tiempo, se produce un error de tiempo de espera. La creación del clúster puede agotarse por diferentes motivos. Por ejemplo, los errores de tiempo de espera pueden deberse a un error en la creación del nodo principal, a un problema de red, a scripts personalizados que tardan demasiado en ejecutarse en el nodo principal, a un error en un script personalizado que se ejecuta en los nodos de procesamiento o a tiempos de espera prolongados para el aprovisionamiento del nodo de procesamiento. No se puede determinar una causa inmediata y es necesaria una investigación adicional.
+ **¿Cómo resolverlo?**

  Consulte los archivos `/var/log/cfn-init.log` y `/var/log/chef-client.log` para conocer los detalles del error. Para obtener más información sobre los registros de AWS ParallelCluster y cómo obtenerlos, consulte [Registros clave para la depuración](troubleshooting-v3-scaling-issues.md#troubleshooting-v3-key-logs) y [Recuperación y conservación de registros](troubleshooting-v3-get-logs.md).

  Puede que descubra lo siguiente en estos registros.
  + **Visualización de `Waiting for static fleet capacity provisioning` cerca del final del `chef-client.log`**

    Esto indica que se agotó el tiempo de espera para la creación del clúster al esperar a que se enciendan los nodos estáticos. Para obtener más información, consulte [Visualización de errores en las inicializaciones de los nodos de computación](troubleshooting-fc-v3-compute-node-initialization-v3.md).
  + **La visualización del script del nodo principal de `OnNodeConfigured` o `OnNodeStart` no ha finalizado al final del `cfn-init.log`**

    Esto indica que el script `OnNodeConfigured` o el script `OnNodeStart` personalizado tardaron mucho en ejecutarse y provocaron un error de tiempo de espera. Compruebe si su script personalizado tiene problemas que puedan provocar que se ejecute durante mucho tiempo. Si el script personalizado tarda mucho en ejecutarse, considere la posibilidad de cambiar el límite de tiempo de espera añadiendo una `DevSettings` sección al archivo de configuración del clúster, como se muestra en el siguiente ejemplo:

    ```
    DevSettings:
      Timeouts:
        HeadNodeBootstrapTimeout: 1800 # default setting: 1800 seconds
    ```
  + **No se encuentran los registros o el nodo principal no se creó correctamente**

    Es posible que el nodo principal no se haya creado correctamente y que no se puedan encontrar los registros. En este caso, puede obtener información adicional sobre el error consultando los eventos de la CloudFormation pila y el registro de la consola del nodo principal. Puede recuperar el registro de la consola del nodo principal a través de la consola de Amazon EC2 o ejecutando el siguiente comando de la CLI de Amazon EC2:

    ```
    aws ec2 get-console-output --instance-id {{HEAD_NODE_INSTANCE_ID}} --output text
    ```

## `failureCode`está `HeadNodeBootstrapFailure` con `failureReason` No se pudo iniciar el nodo principal.
<a name="create-cluster-head-node-bootstrap-failure-v3"></a>
+ **¿Por qué falló?**

  No se puede determinar una causa inmediata y es necesaria una investigación adicional.
+ **¿Cómo resolverlo?**

  Compruebe los campos `/var/log/cfn-init.log` y `/var/log/chef-client.log`.

## `failureCode` es `ResourceCreationFailure`
<a name="create-cluster-resource-creation-failure-v3"></a>
+ **¿Por qué falló?**

  La creación de algunos recursos falló durante el proceso de creación del clúster. El fallo puede producirse por varias razones: Por ejemplo, los errores en la creación de recursos pueden deberse a problemas de capacidad o a una política de IAM mal configurada.
+ **¿Cómo resolverlo?**

  En la CloudFormation consola, consulte la pila de clústeres para comprobar si hay más detalles sobre el error de creación de recursos.

## `failureCode` es `ClusterCreationFailure`
<a name="cluster-creation-failure-v3"></a>
+ **¿Por qué falló?**

  No se puede determinar una causa inmediata y es necesaria una investigación adicional.
+ **¿Cómo resolverlo?**

  En la CloudFormation consola, visualice la pila de clústeres y compruebe si hay más detalles sobre el `HeadNodeWaitCondition` error. `Status Reason`

  Compruebe los campos `/var/log/cfn-init.log` y `/var/log/chef-client.log`.

## ¿Está viendo `WaitCondition timed out...` en la CloudFormation pila
<a name="create-cluster-wait-condition-timeout-v3"></a>

Para obtener más información, consulte [`failureCode`está `HeadNodeBootstrapFailure` agotando el tiempo de espera para la creación del `failureReason` clúster.](#create-cluster-head-node-bootstrap-timeout-failure-v3).

## Ver `Resource creation cancelled` en CloudFormation pila
<a name="create-cluster-resource-create-error-v3"></a>

Para obtener más información, consulte [`failureCode` es `ResourceCreationFailure`](#create-cluster-resource-creation-failure-v3).

## `Failed to run cfn-init...`¿Ve u otros errores en la CloudFormation pila
<a name="create-cluster-cfn-init-fail-error-v3"></a>

Compruebe los detalles adicionales del fallo `/var/log/cfn-init.log` y `/var/log/chef-client.log` compruebe si hay más detalles.

## Visualización de cómo `chef-client.log` termina con `INFO: Waiting for static fleet capacity provisioning`
<a name="create-cluster-wait-on-fleet-capacity-v3"></a>

Esto está relacionado con el tiempo de espera para la creación del clúster cuando se espera a que se enciendan los nodos estáticos. Para obtener más información, consulte [Visualización de errores en las inicializaciones de los nodos de computación](troubleshooting-fc-v3-compute-node-initialization-v3.md).

## Visualización de `Failed to run preinstall or postinstall in cfn-init.log`
<a name="create-cluster-pre-post-install-v3"></a>

Tiene un `OnNodeStart` script `OnNodeConfigured` or en la `HeadNode` sección de configuración del clúster. El script no funciona correctamente. Compruebe el `/var/log/cfn-init.log` archivo para ver los detalles de error del script personalizado.

## ¿Está viendo `This AMI was created with xxx, but is trying to be used with xxx...` en la CloudFormation pila
<a name="create-cluster-ami-mismatch-error-v3"></a>

Para obtener más información, consulte [`failureCode` es `AmiVersionMismatch`](#create-cluster-ami-version-mismatch-v3).

## Ver `This AMI was not baked by AWS ParallelCluster...` en CloudFormation pila
<a name="create-cluster-ami-incomplete-error-v3"></a>

Para obtener más información, consulte [`failureCode` es `InvalidAmi`](#create-cluster-invalid-ami-v3).

## Visualización de cómo el comando `pcluster create-cluster` no se ejecuta localmente
<a name="create-cluster-pcluster-cli-error-v3"></a>

Consulte el `~/.parallelcluster/pcluster-cli.log` en su sistema de archivos local para conocer los detalles del error.

## Compatibilidad adicional
<a name="create-cluster-additional-support-v3"></a>

Siga las instrucciones de solución de problemas que se indican en[Solución de problemas de implementación del clúster](troubleshooting-v3-cluster-deployment.md).

Comprueba si tu situación está incluida en la sección [Problemas GitHub conocidos](https://github.com/aws/aws-parallelcluster/wiki), en la parte AWS ParallelCluster superior GitHub.