

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# クラスターのアラーム
<a name="troubleshooting-v3-cluster-alarms"></a>

クラスターのヘルスモニタリングは、最適なパフォーマンスを確保するために不可欠です。 AWS ParallelCluster では、クラスターのヘッドノードで複数の CloudWatch ベースのアラームをモニタリングできます。

このセクションでは、命名規則、アラームをトリガーする特定の条件、推奨されるトラブルシューティング手順など、ヘッドノードにおけるクラスターのアラームについてタイプ別に詳しく説明します。

クラスターのアラームの命名規則は `CLUSTER_NAME-COMPONENT-METRIC` です (例: `mycluster-HeadNode-Cpu`)。
+ `CLUSTER_NAME-HeadNode`: ヘッドノードの全体的なステータスを示します。以下のアラームのうち少なくとも 1 つが該当する場合は、赤色になります。
+ `CLUSTER_NAME-HeadNode-Health`: Amazon EC2 ヘルスチェックエラーが少なくとも 1 つあると、赤色になります。アラームが発生した場合は、「[ステータスチェックに失敗したインスタンスをトラブルシューティングする](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/TroubleshootingInstances.html)」を参照することをお勧めします。
+ `CLUSTER_NAME-HeadNode-Cpu`: CPU 使用率が 90% を超えると、赤色になります。アラームが発生した場合は、`ps -aux --sort=-%cpu | head -n 10` を使用して CPU を最も多く消費しているプロセスを確認します。
+ `CLUSTER_NAME-HeadNode-Mem`: メモリ使用率が 90% を超えると、赤色になります。アラームが発生した場合は、`ps -aux --sort=-%mem | head -n 10` を使用してメモリを最も多く消費しているプロセスを確認します。
+ `CLUSTER_NAME-HeadNode-Disk`: 占有ディスク容量がパス / で 90% を超えると、赤色になります。アラームが発生した場合は、`du -h --max-depth=2 / 2> /dev/null | sort -hr` を使用してスペースの大部分を消費しているフォルダを確認します。