View a markdown version of this page

Amazon ECS コンテナインスタンスの正常性をモニタリングする - Amazon Elastic Container Service

Amazon ECS コンテナインスタンスの正常性をモニタリングする

Amazon ECS は、コンテナインスタンスのヘルスモニタリングを提供します。Amazon ECS が、コンテナインスタンスがコンテナの実行を妨げる可能性のある問題を検出したか否かについて、すばやく判断できます。Amazon ECS は、エージェントバージョン 1.57.0 以降を使用して実行中のすべてのコンテナインスタンスに対して自動チェックを実行し、問題を特定します。コンテナインスタンスのエージェントバージョンの検証に関する詳細については、Amazon ECS コンテナエージェントをアップデートする を参照してください。

AWS CLI バージョン 1.22.3 以降、または AWS CLI バージョン 2.3.6 以降を使用する必要があります。AWS CLI をアップデートする情報については、AWS Command Line Interface ユーザーガイドバージョン 2 の「AWS CLI の最新バージョンのインストールまたはアップデート」を参照してください。

コンテナインスタンスの正常性を表示するには、CONTAINER_INSTANCE_HEALTH オプションを使用して describe-container-instances を実行します。

overallStatus は、details 配列内の個々のヘルスチェックステータスによって決まります。最も重要度の高いステータスは、IMPAIREDINSUFFICIENT_DATAINITIALIZING および OK の順序で優先されます。

次に示すのは、overallStatus の有効な値です。

  • OK – すべてのヘルスチェックに合格しています。

  • IMPAIRED – 1 つ以上のヘルスチェックが失敗しました。

  • INSUFFICIENT_DATA – 1 つ以上のヘルスチェックのデータが使用できない状態です。

  • INITIALIZING – 1 つ以上のヘルスチェックが初期化されています。

ヘルスチェック type 値には以下が含まれます。

  • CONTAINER_RUNTIME – コンテナランタイム (Docker デーモンなど) のヘルスをモニタリングします。EC2 起動タイプで使用できます。

  • ACCELERATED_COMPUTE – GPUなどの高速コンピューティングデバイスのヘルスをモニタリングします。GPU に障害が発生した場合、statusReason には NVIDIA Xid エラーコードが XID_<number> 形式で含まれます。Amazon ECS マネージドインスタンス起動タイプで使用できます。

  • DAEMON – コンテナインスタンスで必須のデーモンタスクのヘルスをモニタリングします。Amazon ECS マネージドインスタンス起動タイプで使用できます。

イベントを通じてヘルスステータスの変化をモニタリングすることもできます。詳細については、「Amazon ECS コンテナインスタンスのヘルス変更イベント」を参照してください。

describe-container-instances の実行方法の例を次に示します。

aws ecs describe-container-instances \ --cluster cluster_name \ --container-instances 47279cd2cadb41cbaef2dcEXAMPLE \ --include CONTAINER_INSTANCE_HEALTH

以下は、出力されたヘルスステータスオブジェクトの例です。

"healthStatus": { "overallStatus": "OK", "details": [{ "type": "CONTAINER_RUNTIME", "status": "OK", "lastUpdated": "2021-11-10T03:30:26+00:00", "lastStatusChange": "2021-11-10T03:26:41+00:00" }] }

コンテナインスタンスの異常

overallStatusOK 以外のステータスの場合、以下を試してください。

  • 待機してから describe-container-instances を実行します。

  • EC2 コンソールまたは CLI を使用して、コンテナインスタンスの状態を表示します。

  • CloudWatch メトリクスを確認します。詳細については、CloudWatch を使用して Amazon ECS をモニタリングするを参照してください。

  • AWS Health Dashboard をチェックして、サービスに問題があるかどうかを確認してください。