アラーム評価 - Amazon CloudWatch

アラーム評価

メトリクスアラームの状態

メトリクスアラームには次の状態があります。

  • OK – メトリクスや式は、定義されているしきい値の範囲内です。

  • ALARM – メトリクスまたは式が、定義されているしきい値を超えています。

  • INSUFFICIENT_DATA – アラームが開始直後であるか、メトリクスが利用できないか、メトリクス用のデータが不足しているため、アラームの状態を判定できません。

アラーム評価状態

アラーム状態に加えて、各アラームには、アラーム評価プロセスに関する情報を提供する評価状態があります。次の状態が発生する可能性があります。

  • PARTIAL_DATA – クォータの制限により、使用可能なデータの一部を取得できなかったことを示します。詳細については、「部分的なデータの処理方法」を参照してください。

  • EVALUATION_ERROR – アラーム設定の設定エラーを示します。レビューと修正が必要です。詳細については、アラームの StateReason フィールドを参照してください。

  • EVALUATION_FAILURE – CloudWatch の一時的な問題を示します。問題が解決するまでは手動でモニタリングを行うことが推奨されます。

コンソールで、あるいは describe-alarms CLI コマンドまたは DescribeAlarms API を使用して、アラーム詳細で評価状態を表示できます。

アラーム評価設定

アラームを作成するときに、CloudWatch がアラームの状態を変更するタイミングを評価できるように 3 つの設定を指定します。

  • [期間] は、アラームの各データポイントを作成することを目的として、メトリクスや式を評価するために使用する期間です。これは秒単位で表されます。

  • [Evaluation Periods (評価期間)] は、アラームの状態を決定するまでに要する最新の期間またはデータポイントの数です。

  • [Datapoints to Alarm (アラームを実行するデータポイント)] は、アラームが ALARM 状態に移るためにしきい値を超過する必要がある評価期間内のデータポイントの数です。しきい値を超過したデータポイントは連続している必要はありません。しかしすべてが [Evaluation Period] (評価期間) に相当する直近のデータポイント数に含まれている必要があります。

期間が 1 分以上の場合、アラームは 1 分ごとに評価され、評価は [期間][評価期間] で定義されている時間枠に基づいて行われます。例えば、[期間] が 5 分 (300 秒) で、[評価期間] が 1 の場合、5 分終了時に、アラームは 1 分~5 分のデータに基づいて評価されます。続いて、6 分終了時に、2 分~6 分のデータに基づいてアラームが評価されます。

アラーム期間が 10 秒、20 秒、または 30 秒の場合、アラームは 10 秒ごとに評価されます。詳細については、「高解像度アラーム」を参照してください。

評価期間の数を各評価期間の長さで乗算した値が 1 日を超える場合、アラームは 1 時間ごとに評価されます。これらの複数日アラームの評価方法の詳細については、「複数日アラームの評価例」を参照してください。

次の図では、メトリクスアラームのアラームしきい値が 3 単位に設定されています。[Evaluation Periods (評価期間)] と [Datapoints to Alarm (アラームを実行するデータポイント)] はどちらも 3 です。つまり、連続する最新の 3 つの期間内の既存のデータポイントすべてがしきい値を上回わると、アラームは ALARM 状態になります。この図では、第 3 期間から第 5 期間にかけてこれが発生します。第 6 期間で値がしきい値を下回り、評価対象の期間の 1 つが超過していないため、アラームの状態は OK に変化します。第 9 期間中のしきい値に再度超過がありますが、1 つの期間のみです。そのため、アラームの状態は OK のままです。

アラームのしきい値によるアラームのトリガー

[Evaluation Periods (評価期間)] と [Datapoints to Alarm (アラームを実行するデータポイント)] に異なる値を設定する場合、「N 個中 M 個」のアラームを設定することになります。アラームへのデータポイントは (「M」) で、評価期間は (「N」) です。評価間隔は、評価期間の値に期間の長さを掛けたものです。たとえば、1 分の期間を持つ 5 個のデータポイントのうち 4 個を設定した場合、評価間隔は 5 分です。10 分の期間を持つ 3 個のデータポイントのうち 3 個を設定した場合、評価間隔は 30 分です。

注記

アラームの作成後すぐにデータポイントが欠落し、アラームの作成前にメトリクスが CloudWatch に報告されている場合、CloudWatch はアラームを評価する際にアラーム作成前の直近のデータポイントを取得します。

高解像度アラーム

高解像度メトリクスでアラームを設定する場合、10 秒間、20 秒間、または 30 秒間の高解像度アラームを指定できます。高解像度のアラームには高い料金が発生します。高解像度メトリクスの詳細については、「カスタムメトリクスをパブリッシュする」を参照してください。

複数日アラームの評価例

評価期間の数に各評価期間の長さを掛けた値が 1 日を超える場合、アラームは複数日アラームとなります。複数日アラームは 1 時間ごとに評価されます。複数日アラームが評価されると、CloudWatch は評価時に午前 0 時時点までのメトリクスのみを対象とします。

例えば、3 日ごとに実行されるジョブを 10:00 にモニタリングするアラームがあるとします。

  1. 10:02 にジョブが失敗します。

  2. 10:03 にアラームが評価され、OK 状態のままです。なぜなら、評価は 10:00 までのデータのみを考慮しているからです。

  3. 11:03 の時点で、アラームは 11:00 までのデータを対象とし、 ALARM 状態になります。

  4. 11:43 にエラーを修正し、ジョブを正常に実行できるようにしました。

  5. 12:03 にアラームが再度評価され、成功したジョブが表示され、 OK 状態に戻りました。