경보 테스트(게임데이)
AWS 사고 탐지 및 대응 온보딩 프로세스의 마지막 단계는 새 워크로드에 대한 게임데이를 수행하는 것입니다. 경보 수집 단계를 완료하면 AWS 사고 탐지 및 대응에서 사용자가 선택한 게임데이 시작 날짜와 시간을 확인합니다.
게임데이는 다음의 두 가지 주요 목적을 위한 것입니다.
기능 검증: AWS 사고 탐지 및 대응이 경보 이벤트를 올바르게 수신할 수 있는지 확인합니다. 또한 기능 검증을 통해 경보 이벤트가 원하는 작업(예: 경보 수집 시 선택한 경우 자동 지원 사례 생성)을 트리거하는지 확인할 수 있습니다.
시뮬레이션: 게임데이는 실제 인시던트 중에 발생할 수 있는 상황을 전체적으로 다루는 시뮬레이션입니다. AWS 사고 탐지 및 대응은 실제 사고가 어떻게 전개될 수 있는지에 대한 통찰력을 제공합니다. 게임데이는 질문을 하거나 지침을 구체화하여 참여도를 개선할 수 있는 기회입니다.
경보 테스트 중에 AWS 사고 탐지 및 대응은 사용자와 협력하여 식별된 문제를 해결합니다.
CloudWatch 경보 테스트
게임데이 중에는 AWS Command Line Interface를 사용하여 경보를 경보 상태로 수동으로 변경하여 Amazon CloudWatch 경보를 테스트합니다. AWS CloudShell에서 AWS CLI에 액세스할 수 있습니다. AWS 사고 탐지 및 대응은 테스트 중에 사용할 수 있는 AWS CLI 명령 목록을 제공합니다.
경보 상태를 설정하는 AWS CLI 명령의 예:
aws cloudwatch set-alarm-state --alarm-name "ExampleAlarm" --state-value ALARM --state-reason "Testing AWS Incident Detection and Response" --regionus-east-1
참고
경보 테스트에 사용하는 AWS Identity and Access Management 사용자 또는 역할에 cloudwatch:SetAlarmState 권한이 있어야 합니다.
CloudWatch 경보의 상태를 수동으로 변경하는 방법에 대한 자세한 내용은 SetAlarmState를 참조하세요.
CloudWatch API 작업에 필요한 권한에 대한 자세한 내용은 Amazon CloudWatch 권한 참조를 참조하세요.
타사 APM 경보 테스트
Datadog, Splunk, New Relic 또는 Dynatrace와 같은 타사 애플리케이션 성능 모니터링(APM) 도구를 사용하는 워크로드로 경보를 시뮬레이션하려면 다른 지침이 필요합니다. 게임데이가 시작될 때 AWS 사고 탐지 및 대응은 경보 임곗값 또는 비교 연산자를 일시적으로 변경하여 경보를 경보 상태로 강제 전환하도록 요청합니다. 이 상태는 AWS 사고 탐지 및 대응에 대한 페이로드를 트리거합니다.
게임데이는 다음 사항을 검증합니다.
경보 수집에 성공하고 경보 구성이 정확합니다.
경보가 AWS 사고 탐지 및 대응에서 성공적으로 생성 및 수신되었습니다.
해당 문제에 대한 지원 사례가 생성되고, 지정된 런북 연락처로 알림이 전송됩니다.
AWS 사고 탐지 및 대응은 사용자가 정의한 회의 브리지 방식을 통해 사용자와 소통할 수 있습니다.