

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# クラスターの作成を試行する
<a name="troubleshooting-fc-v3-create-cluster"></a>

 AWS ParallelCluster バージョン 3.5.0 以降を使用してクラスターを作成し、 を `--rollback-on-failure`に設定してクラスターの作成が失敗した場合`false`、 [`pcluster describe-cluster`](pcluster.describe-cluster-v3.md) CLI コマンドを使用してステータスと障害情報を取得します。この場合、`pcluster describe-cluster` の `clusterStatus` の正常な出力は `CREATE_FAILED` です。出力の `failures` セクションを確認して、`failureCode` と `failureReason` を見つけます。次のセクションで一致する `failureCode` を探して、その他のトラブルシューティングについてのヘルプを見つけます。詳細については、「[`pcluster describe-cluster`](pcluster.describe-cluster-v3.md)」を参照してください。

次のセクションでは、`/var/log/cfn-init.log` や `/var/log/chef-client.log` ファイルなど、ヘッドノードのログを確認することをお勧めします。 AWS ParallelCluster ログとその表示方法の詳細については、[デバッグ用のキーログ](troubleshooting-v3-scaling-issues.md#troubleshooting-v3-key-logs)「」および「」を参照してください[ログの取得と保存](troubleshooting-v3-get-logs.md)。

がない場合は`failureCode`、 CloudFormation コンソールに移動してクラスタースタックを表示します。`HeadNodeWaitCondition` の `Status Reason`、または他のリソースの障害を確認して、失敗に関するその他の詳細を確認します。詳細については、「[で CloudFormation イベントを表示する `CREATE_FAILED`](troubleshooting-v3-cluster-deployment.md#troubleshooting-v3-cluster-deployment-events)」を参照してください。ヘッドノードの `/var/log/cfn-init.log` および `/var/log/chef-client.log` ファイルを確認します。ヘッドノードの作成に失敗したためにクラスターの作成に失敗し、クラスターログがクラスターロググループで利用できない場合は、クラスターを失敗時に保持し、`--rollback-on-failure`= を指定`True`して、ヘッドノード自体内からログを取得する必要があります。

## `failureCode` が `OnNodeConfiguredExecutionFailure`
<a name="create-cluster-on-node-configured-executed-failure-v3"></a>
+ **失敗した原因**

  クラスターを作成するために、設定のヘッドノードセクションの `OnNodeConfigured` にカスタムスクリプトを指定しました。しかし、カスタムスクリプトの実行に失敗しました。
+ **解決方法**

  `/var/log/cfn-init.log` ファイルを確認して、障害の詳細とカスタムスクリプトの問題の修正方法を確認します。このログの最後の方で、`Running command runpostinstall` メッセージの後に `OnNodeConfigured` スクリプトに関連する実行情報が表示される場合があります。

## `failureCode` が `OnNodeConfiguredDownloadFailure`
<a name="create-cluster-on-node-configured-download-failure-v3"></a>
+ **失敗した原因**

  クラスターを作成するために、設定のヘッドノードセクションの `OnNodeConfigured` にカスタムスクリプトを指定しました。しかし、カスタムスクリプトのダウンロードに失敗しました。
+ **解決方法**

  URL が有効で、アクセスが正しく設定されていることを確認します。カスタムブートストラップスクリプトの設定に関する詳細については、「[カスタムブートストラップアクション](custom-bootstrap-actions-v3.md)」を参照してください。

  `/var/log/cfn-init.log` ファイルを確認してください。このログの最後の方で、`Running command runpostinstall` メッセージの後に、ダウンロードを含め `OnNodeConfigured` スクリプトの処理に関連する実行情報が表示される場合があります。

## `failureCode` が `OnNodeConfiguredFailure`
<a name="create-cluster-on-node-configured-failure-v3"></a>
+ **失敗した原因**

  クラスターを作成するために、設定のヘッドノードセクションの `OnNodeConfigured` にカスタムスクリプトを指定しました。ただし、クラスターのデプロイにおいてカスタムスクリプトの使用に失敗しました。即時に原因を判断できないため、追加の調査が必要です。
+ **解決方法**

  `/var/log/cfn-init.log` ファイルを確認してください。このログの最後の方で、`Running command runpostinstall` メッセージの後に `OnNodeConfigured` スクリプトの処理に関連する実行情報が表示される場合があります。

## `failureCode` が `OnNodeStartExecutionFailure`
<a name="create-cluster-on-node-start-execution-failure-v3"></a>
+ **失敗した原因**

  クラスターを作成するために、設定のヘッドノードセクションの `OnNodeStart` にカスタムスクリプトを指定しました。しかし、カスタムスクリプトの実行に失敗しました。
+ **解決方法**

  `/var/log/cfn-init.log` ファイルを確認して、障害の詳細とカスタムスクリプトの問題の修正方法を確認します。このログの最後の方で、`Running command runpreinstall` メッセージの後に `OnNodeStart` スクリプトに関連する実行情報が表示される場合があります。

## `failureCode` が `OnNodeStartDownloadFailure`
<a name="create-cluster-on-node-start-download-failure-v3"></a>
+ **失敗した原因**

  クラスターを作成するために、設定のヘッドノードセクションの `OnNodeStart` にカスタムスクリプトを指定しました。しかし、カスタムスクリプトのダウンロードに失敗しました。
+ **解決方法**

  URL が有効で、アクセスが正しく設定されていることを確認します。カスタムブートストラップスクリプトの設定に関する詳細については、「[カスタムブートストラップアクション](custom-bootstrap-actions-v3.md)」を参照してください。

  `/var/log/cfn-init.log` ファイルを確認してください。このログの最後の方で、`Running command runpreinstall` メッセージの後に、ダウンロードを含め `OnNodeStart` スクリプトの処理に関連する実行情報が表示される場合があります。

## `failureCode` が `OnNodeStartFailure`
<a name="create-cluster-on-node-start-failure-v3"></a>
+ **失敗した原因**

  クラスターを作成するために、設定のヘッドノードセクションの `OnNodeStart` にカスタムスクリプトを指定しました。ただし、クラスターのデプロイにおいてカスタムスクリプトの使用に失敗しました。即時に原因を判断できないため、追加の調査が必要です。
+ **解決方法**

  `/var/log/cfn-init.log` ファイルを確認してください。このログの最後の方で、`Running command runpreinstall` メッセージの後に `OnNodeStart` スクリプトの処理に関連する実行情報が表示される場合があります。

## `failureCode` が `EbsMountFailure`
<a name="create-cluster-ebs-mount-failure-v3"></a>
+ **失敗した原因**

  クラスター設定で定義されている EBS ボリュームのマウントに失敗しました。
+ **解決方法**

  失敗の詳細について、`/var/log/chef-client.log` ファイルを確認します。

## `failureCode` が `EfsMountFailure`
<a name="create-cluster-efs-mount-failure-v3"></a>
+ **失敗した原因**

  クラスター設定で定義されている Amazon EFS ボリュームのマウントに失敗しました。
+ **解決方法**

  既存の Amazon EFS ファイルシステムを定義した場合は、クラスターとファイルシステムの間のトラフィックが許可されていることを確認します。詳細については、「[`SharedStorage`](SharedStorage-v3.md)」/「[`EfsSettings`](SharedStorage-v3.md#SharedStorage-v3-EfsSettings)」/「[`FileSystemId`](SharedStorage-v3.md#yaml-SharedStorage-EfsSettings-FileSystemId)」を参照してください。

  失敗の詳細について、`/var/log/chef-client.log` ファイルを確認します。

## `failureCode` が `FsxMountFailure`
<a name="create-cluster-fsx-mount-failure-v3"></a>
+ **失敗した原因**

  クラスター設定で定義されている Amazon FSx ファイルシステムのマウントに失敗しました。
+ **解決方法**

  既存の Amazon FSx ファイルシステムを定義した場合は、クラスターとファイルシステムの間のトラフィックが許可されていることを確認します。詳細については、「[`SharedStorage`](SharedStorage-v3.md)」/「[`FsxLustreSettings`](SharedStorage-v3.md#SharedStorage-v3-FsxLustreSettings)」/「[`FileSystemId`](SharedStorage-v3.md#yaml-SharedStorage-FsxLustreSettings-FileSystemId)」を参照してください。

  失敗の詳細について、`/var/log/chef-client.log` ファイルを確認します。

## `failureCode` が `RaidMountFailure`
<a name="create-cluster-raid-mount-failure-v3"></a>
+ **失敗した原因**

  クラスター設定で定義されている RAID ボリュームのマウントに失敗しました。
+ **解決方法**

  失敗の詳細について、`/var/log/chef-client.log` ファイルを確認します。

## `failureCode` が `AmiVersionMismatch`
<a name="create-cluster-ami-version-mismatch-v3"></a>
+ **失敗した原因**

  カスタム AMI の作成に使用される AWS ParallelCluster バージョンは、クラスターの設定に使用される AWS ParallelCluster バージョンとは異なります。CloudFormation コンソールで、クラスターの CloudFormation スタックの詳細を表示し、 `Status Reason`で AWS ParallelCluster バージョンと AMI `HeadNodeWaitCondition`の詳細を確認します。詳細については、「[で CloudFormation イベントを表示する `CREATE_FAILED`](troubleshooting-v3-cluster-deployment.md#troubleshooting-v3-cluster-deployment-events)」を参照してください。
+ **解決方法**

  カスタム AMI の作成に使用した AWS ParallelCluster バージョンが、クラスターの設定に使用した AWS ParallelCluster バージョンと同じであることを確認します。カスタム AMI のバージョン、または `pcluster` CLI のバージョンのいずれかを変更して同じにすることができます。

## `failureCode` が `InvalidAmi`
<a name="create-cluster-invalid-ami-v3"></a>
+ **失敗した原因**

  カスタム AMI は、 を使用して構築されていないため無効です AWS ParallelCluster。
+ **解決方法**

  `pcluster build-image` コマンドを使用し、独自の AMI を親イメージにして AMI を作成します。詳細については、「[`pcluster build-image`](pcluster.build-image-v3.md)」を参照してください。

## `failureCode` が `HeadNodeBootstrapFailure` と `failureReason` で、ヘッドノードの設定に失敗した。
<a name="create-cluster-head-node-bootstrap-setup-failure-v3"></a>
+ **失敗した原因**

  即時に原因を判断できないため、追加の調査が必要です。例えば、クラスターが保護ステータスにある場合や、静的コンピューティングフリートのプロビジョニングの失敗により発生した可能性があります。
+ **解決方法**

  失敗の詳細について、`/var/log/chef-client.log.` ファイルを確認します。
**注記**  
`RuntimeError` 例外 `Cluster state has been set to PROTECTED mode due to failures detected in static node provisioning` が表示された場合、クラスターは保護ステータスにあります。詳細については、「[保護モードをデバッグする方法](slurm-protected-mode-v3.md#slurm-protected-mode-debug-v3)」を参照してください。

## `failureCode` は `HeadNodeBootstrapFailure` で、`failureReason` クラスター作成がタイムアウトした。
<a name="create-cluster-head-node-bootstrap-timeout-failure-v3"></a>
+ **失敗した原因**

  デフォルトでは、クラスターの作成が完了するのに 30 分の時間制限があります。このタイムフレーム内でクラスターの作成が完了しない場合、クラスターの作成はタイムアウトエラーで失敗します。クラスターの作成は、さまざまな理由でタイムアウトになる可能性があります。例えば、タイムアウトによる失敗は、ヘッドノード作成の失敗、ネットワークの問題、ヘッドノードでの実行に時間がかかりすぎるカスタムスクリプト、コンピューティングノードで実行されるカスタムスクリプトのエラー、またはコンピューティングノードのプロビジョニングの待ち時間が長いことにより発生する可能性があります。即時に原因を判断できないため、追加の調査が必要です。
+ **解決方法**

  失敗の詳細について、`/var/log/cfn-init.log` と `/var/log/chef-client.log` ファイルを確認します。 AWS ParallelCluster ログとその取得方法に関する詳細については、「[デバッグ用のキーログ](troubleshooting-v3-scaling-issues.md#troubleshooting-v3-key-logs)」と「[ログの取得と保存](troubleshooting-v3-get-logs.md)」を参照してください。

  これらのログで、次のことが見つかることがあります。
  + **`chef-client.log` の最後の方にある `Waiting for static fleet capacity provisioning` が表示されている**

    これは、静的ノードの電源が入るのを待機しているときにクラスターの作成がタイムアウトしたことを示しています。詳細については、「[コンピューティンティングノードの初期化のエラーが表示されている](troubleshooting-fc-v3-compute-node-initialization-v3.md)」を参照してください。
  + **`OnNodeConfigured` または `OnNodeStart` ヘッドノードスクリプトが `cfn-init.log` の最後で終了していないことが表示されている**

    これは、`OnNodeConfigured` または `OnNodeStart` で、カスタムスクリプトの実行に時間がかかり、タイムアウトエラーが発生したことを示しています。カスタムスクリプトに、実行に長い時間がかかる問題がないか確認します。カスタムスクリプトの実行に長い時間が必要な場合は、次の例に示されているようにクラスター設定ファイルに `DevSettings` セクションを追加してタイムアウト制限を変更することを考慮してください。

    ```
    DevSettings:
      Timeouts:
        HeadNodeBootstrapTimeout: 1800 # default setting: 1800 seconds
    ```
  + **ログが見つからない、またはヘッドノードが正常に作成されない**

    ヘッドノードが正常に作成されず、ログが見つからない可能性があります。この場合、CloudFormation スタックイベントとヘッドノードコンソールログを確認することで、追加の障害の詳細を取得できます。ヘッドノードコンソールログを取得するには、Amazon EC2 コンソールを使用するか、次の Amazon EC2 CLI コマンドを実行します。

    ```
    aws ec2 get-console-output --instance-id {{HEAD_NODE_INSTANCE_ID}} --output text
    ```

## `failureCode` は `HeadNodeBootstrapFailure` で、`failureReason` はヘッドノードのブートストラップに失敗した。
<a name="create-cluster-head-node-bootstrap-failure-v3"></a>
+ **失敗した原因**

  即時に原因を判断できないため、追加の調査が必要です。
+ **解決方法**

  `/var/log/cfn-init.log` と `/var/log/chef-client.log` のファイルを確認します。

## `failureCode` が `ResourceCreationFailure`
<a name="create-cluster-resource-creation-failure-v3"></a>
+ **失敗した原因**

  クラスター作成プロセス中に、一部のリソースの作成に失敗しました。さまざまな理由で失敗が発生します。例えば、リソース作成の失敗は、容量の問題や IAM ポリシーが誤って設定されていることにより発生することがあります。
+ **解決方法**

  CloudFormation コンソールでクラスタースタックを表示して、リソース作成の失敗に関するその他の詳細を確認します。

## `failureCode` が `ClusterCreationFailure`
<a name="cluster-creation-failure-v3"></a>
+ **失敗した原因**

  即時に原因を判断できないため、追加の調査が必要です。
+ **解決方法**

  CloudFormation コンソールでクラスタースタックを表示し、`HeadNodeWaitCondition` の `Status Reason` を確認して、失敗に関するその他の詳細を見つけます。

  `/var/log/cfn-init.log` と `/var/log/chef-client.log` のファイルを確認します。

## CloudFormation スタックの `WaitCondition timed out...` が表示されている
<a name="create-cluster-wait-condition-timeout-v3"></a>

詳細については、「[`failureCode` は `HeadNodeBootstrapFailure` で、`failureReason` クラスター作成がタイムアウトした。](#create-cluster-head-node-bootstrap-timeout-failure-v3)」を参照してください。

## CloudFormation スタックの `Resource creation cancelled` が表示されている
<a name="create-cluster-resource-create-error-v3"></a>

詳細については、「[`failureCode` が `ResourceCreationFailure`](#create-cluster-resource-creation-failure-v3)」を参照してください。

## CloudFormation スタック内の表示`Failed to run cfn-init...`またはその他のエラー
<a name="create-cluster-cfn-init-fail-error-v3"></a>

失敗に関するその他の詳細について、`/var/log/cfn-init.log` と `/var/log/chef-client.log` を確認します。

## `INFO: Waiting for static fleet capacity provisioning` の最後に `chef-client.log` が表示されている
<a name="create-cluster-wait-on-fleet-capacity-v3"></a>

これは、静的ノードの電源が入るのを待機しているときにクラスターの作成がタイムアウトになることと関係しています。詳細については、「[コンピューティンティングノードの初期化のエラーが表示されている](troubleshooting-fc-v3-compute-node-initialization-v3.md)」を参照してください。

## `Failed to run preinstall or postinstall in cfn-init.log` が表示されている
<a name="create-cluster-pre-post-install-v3"></a>

クラスター設定 の `HeadNode` セクションに `OnNodeConfigured` または `OnNodeStart` スクリプトがあります。このスクリプトが正しく動作していません。カスタムスクリプトのエラーの詳細について、`/var/log/cfn-init.log` ファイルを確認します。

## CloudFormation スタックの `This AMI was created with xxx, but is trying to be used with xxx...` が表示されている
<a name="create-cluster-ami-mismatch-error-v3"></a>

詳細については、「[`failureCode` が `AmiVersionMismatch`](#create-cluster-ami-version-mismatch-v3)」を参照してください。

## CloudFormation スタックの `This AMI was not baked by AWS ParallelCluster...` が表示されている
<a name="create-cluster-ami-incomplete-error-v3"></a>

詳細については、「[`failureCode` が `InvalidAmi`](#create-cluster-invalid-ami-v3)」を参照してください。

## `pcluster create-cluster` コマンドがローカルで実行できないことが表示されている
<a name="create-cluster-pcluster-cli-error-v3"></a>

失敗の詳細について、ローカルファイルシステムの `~/.parallelcluster/pcluster-cli.log` を確認します。

## 追加のサポート
<a name="create-cluster-additional-support-v3"></a>

[クラスターデプロイの問題のトラブルシューティング](troubleshooting-v3-cluster-deployment.md) のトラブルシューティングガイダンスに従ってください。

シナリオが [GitHub の にある GitHub の既知の問題](https://github.com/aws/aws-parallelcluster/wiki) AWS ParallelCluster でカバーされているかどうかを確認します。 GitHub