アラームのテスト (ゲームデー)
AWS Incident Detection and Response のオンボーディングプロセスの最後のステップは、新しいワークロードのゲームデーを実行することです。アラームの取り込みステップ後は、AWS Incident Detection and Response が、ゲームデーを開始するために選択した日時を確認します。
ゲームデーには主に次の 2 つの目的があります。
機能検証: AWS Incident Detection and Response がアラームイベントを正しく受信できることを確認します。また、機能検証では、アラームイベントが、自動のサポートケース作成など (アラームの取り込み中に選択した場合)、必要なアクションをトリガーすることを確認します。
シミュレーション: ゲームデーは、実際にインシデントが発生した場合に起きる可能性があることをエンドツーエンドでシミュレートします。AWS Incident Detection and Response は、実際のインシデントがどのように展開されるかに関するインサイトを提供します。ゲームデーは、エンゲージメントを向上させるために質問したり、指示を改良したりする機会です。
アラームテスト中、AWS Incident Detection and Response はお客様と協力して、特定された問題を修正します。
CloudWatch アラームのテスト
ゲームデー中に、Amazon CloudWatch アラームは、AWS Command Line Interface を使用してアラームをアラーム状態に手動で変更することでテストされます。AWS CLI は AWS CloudShell からアクセスできます。AWS Incident Detection and Response には、テスト中に使用できる AWS CLI コマンドのリストが用意されています。
アラームの状態を設定する AWS CLI コマンドの例:
aws cloudwatch set-alarm-state --alarm-name "ExampleAlarm" --state-value ALARM --state-reason "Testing AWS Incident Detection and Response" --regionus-east-1
注記
アラームテストに使用する AWS Identity and Access Management ユーザーまたはロールには cloudwatch:SetAlarmState の権限が必要です。
CloudWatch アラームの状態を手動で変更する方法の詳細については、「SetAlarmState」を参照してください。
CloudWatch API オペレーションに必要なアクセス許可の詳細については、「Amazon CloudWatch の許可リファレンス」を参照してください。
サードパーティーの APM アラームのテスト
Datadog、Splunk、New Relic、Dynatrace などのサードパーティのアプリケーションパフォーマンスモニタリング (APM) ツールを利用するワークロードでは、アラームをシミュレートするためのさまざまな手順が必要です。ゲームデーの開始時に、AWS Incident Detection and Response は、アラームのしきい値または比較演算子を一時的に変更して、アラームを [ALARM] ステータスに強制するようリクエストします。このステータスは、AWS Incident Detection and Response へのペイロードをトリガーします。
ゲームデーは次のポイントを検証します。
アラームの取り込みが成功し、アラームも正しく設定されています。
アラームは AWS Incident Detection and Response によって正常に作成され、受信されます。
サポートケースがインシデント用に作成され、所定のランブック連絡先に通知されます。
AWS Incident Detection and Response は、定義された会議ブリッジ方法でお客様と連携できます。