

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# AWS Fault Injection Service 실험 실패/상태 확인
<a name="test-failures"></a>

AWS Resilience Hub 를 사용하면 시작한 실험의 상태를 추적할 수 있습니다. 자세한 내용은 [평가에서 권장 AWS FIS 실험을 보려면](view-fis-experiment.md#view-recommended-fis-experiments) 절차를 참조하세요.

**Topics**
+ [AWS Systems Manager를 사용하여 AWS FIS 실험 실행 분석](test-failures-ssm.md)
+ [AWS FIS Amazon Elastic Kubernetes Service 클러스터에서 실행 중인 Kubernetes 포드를 테스트하는 동안 실험 실패](test-failures-eks.md)

# AWS Systems Manager를 사용하여 AWS FIS 실험 실행 분석
<a name="test-failures-ssm"></a>

 AWS FIS 실험을 실행한 후 Systems Manager에서 실행 세부 정보를 볼 수 있습니다 AWS .

1. **CloudTrail** > **이벤트 기록(Event History)**으로 이동합니다.

1. 실험 ID를 사용하여 **사용자 이름을** 기준으로 이벤트를 필터링합니다.

1. 자동화 실행 시작(StartAutomationExecution) 항목을 확인합니다. **요청 ID**는 SSM 자동화 ID입니다.

1.  **AWS Systems Manager **> **자동화**로 이동합니다.

1. SSM 자동화 ID를 사용하여 **실행 ID(Execution ID)**별로 필터링하고 자동화 세부 정보를 확인합니다.

   모든 Systems Manager 자동화를 사용하여 실행을 분석할 수 있습니다. 자세한 내용은 [AWS Systems Manager Automation](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-automation.html) 사용 설명서를 참조하세요. 실행 입력 파라미터는 **실행 세부 정보의** **입력 파라미터** 섹션에 나타나며 AWS FIS 실험에 나타나지 않는 선택적 파라미터를 포함합니다.

   실행 단계 내의 특정 단계로 드릴다운하여 단계 상태 및 기타 단계 세부 정보에 대한 정보를 찾을 수 있습니다.

**일반적인 오류**

평가 보고를 실행하는 동안 발생하는 일반적인 오류는 다음과 같습니다.
+ 테스트/SOP 실험이 실행되기 전에 경보 템플릿이 배포되지 않았습니다. 이로 인해 자동화 단계에서 오류 메시지가 발생합니다.
  + **오류 메시지:** `The following parameters were not found: [/ResilienceHub/Alarm/3dee49a1-9877-452a-bb0c-a958479a8ef2/nat-gw-alarm-bytes-out-to-source-2020-09-21_nat-02ad9bc4fbd4e6135]. Make sure all the SSM parameters in automation document are created in SSM Parameter Store.`.
  + **해결 방법:** 결함 주입 실험을 다시 실행하기 전에 관련 경보를 렌더링하고 결과 템플릿을 배포해야 합니다.
+ 실행 역할의 권한이 누락되었습니다. 이 오류 메시지는 제공된 실행 역할에 권한이 없는 경우 발생하며 단계 세부 정보에 나타납니다.
  + **오류 메시지:** `An error occurred (Unauthorized Operation) when calling the DescribeInstanceStatus operation: You are not authorized to perform this operation. Please Refer to Automation Service Troubleshooting Guide for more diagnosis details`.
  + **해결 방법**: 올바른 실행 역할을 제공했는지 확인하세요. 이 작업을 완료했다면 필요한 권한을 추가하고 평가를 다시 실행하세요.
+ 실행에 성공했지만 예상한 결과를 얻지 못했습니다. 이는 잘못된 파라미터 또는 내부 자동화 문제로 인한 것입니다.
  + **오류 메시지:** 실행이 성공했으므로 오류 메시지가 표시되지 않습니다.
  + **해결 방법:** 개별 단계에서 예상 입력 및 출력을 검사하기 전에 AWS FIS 실험 실행 분석에 설명된 대로 입력 파라미터를 확인하고 실행된 단계를 살펴봅니다.

# AWS FIS Amazon Elastic Kubernetes Service 클러스터에서 실행 중인 Kubernetes 포드를 테스트하는 동안 실험 실패
<a name="test-failures-eks"></a>

Amazon EKS 클러스터에서 실행되는 Kubernetes 포드를 테스트하는 동안 발생하는 일반적인 Amazon Elastic Kubernetes Service (Amazon EKS) 오류는 다음과 같습니다.
+  AWS FIS 실험 또는 Kubernetes 서비스 계정에 대한 IAM 역할의 잘못된 구성입니다.
  + **오류 메시지:** 
    + `Error resolving targets. Kubernetes API returned ApiException with error code 401`. 
    + `Error resolving targets. Kubernetes API returned ApiException with error code 403`. 
    + `Unable to inject AWS FIS Pod: Kubernetes API returned status code 403. Check Amazon EKS logs for more details`. 
  + **해결 방법**: 다음을 확인하세요.
    + [AWS FIS`aws:eks:pod` 작업 사용](https://docs.aws.amazon.com/fis/latest/userguide/eks-pod-actions.html)의 지침을 따랐는지 확인하세요.
    + 필요한 RBAC 권한과 올바른 네임스페이스를 사용하여 Kubernetes 서비스 계정을 생성하고 구성했는지 확인하세요.
    + 제공된 IAM 역할(테스트 CloudFormation 스택의 출력 참조)을 Kubernetes 사용자에게 매핑했는지 확인합니다.
+  AWS FIS 포드를 시작할 수 없음: 최대 실패한 사이드카 컨테이너에 도달했습니다. 이는 일반적으로 메모리가 AWS FIS 사이드카 컨테이너를 실행하기에 충분하지 않을 때 발생합니다.
  + **오류 메시지:** `Unable to heartbeat FIS Pod: Max failed sidecar containers reached`.
  + **해결 방법:** 이 오류를 방지하는 한 가지 방법은 사용 가능한 메모리 또는 CPU에 맞춰 목표 부하 비율을 줄이는 것입니다.
+ 실험 시작 시 알람 어설션이 실패했습니다. 이 오류는 관련 경보에 데이터 포인트가 없기 때문에 발생합니다.
  + **오류 메시지:** `Assertion failed for the following alarms`. 어설션이 실패한 모든 경보를 나열합니다.
  + **해결 방법: **Container Insights가 경보에 맞게 올바르게 설치되어 있고 경보가 켜져 있지 않은지(`ALARM` 상태) 확인하세요.