

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 고급 다중 AZ 복원 패턴
<a name="advanced-multi-az-resilience-patterns"></a>

출판 날짜: **2023년 7월 11일**([문서 수정](document-revisions.md))

많은 고객이 가용성이 높은 다중 가용 영역(AZ) 구성에서 워크로드를 실행합니다. 이러한 아키텍처는 바이너리 장애 발생 시에도 잘 작동하지만 *회색* 장애 문제가 발생하는 경우가 많습니다. 이러한 유형의 장애는 미묘할 수 있으며 빠르고 확실하게 감지하기 어려울 수 있습니다. 이 백서는 워크로드를 계측하여 단일 가용 영역에 격리된 회색 장애로 인한 영향을 감지한 다음 가용 영역에서 그러한 영향을 완화하기 위한 조치를 취하는 방법에 대한 지침을 제공합니다.

## 소개
<a name="introduction"></a>

 이 문서의 목적은 복원력이 뛰어난 다중 AZ 아키텍처를 보다 효과적으로 구현하도록 돕는 것입니다. [Amazon Virtual Private Cloud](https://aws.amazon.com/vpc/)(VPC) 네트워크에서 복원력이 뛰어난 시스템을 구축하는 모범 사례 중 하나는 [각 워크로드를 여러 가용 영역에 배포](https://docs.aws.amazon.com/vpc/latest/userguide/vpc-security-best-practices.html)하는 것입니다.

 [가용 영역](https://aws.amazon.com/about-aws/global-infrastructure/regions_az/)은 중복 전원, 네트워킹 및 연결이 있는 하나 이상의 개별 데이터 센터입니다. 여러 가용 영역을 사용하면 단일 데이터 센터로 가능한 것보다 더 높은 가용성, 내결함성 및 확장성을 갖춘 워크로드를 운영할 수 있습니다.

 [Amazon Elastic Compute Cloud(EC2), Auto Scaling](https://aws.amazon.com/ec2/autoscaling/) 또는 [Amazon Relational Database Service(RDS)](https://aws.amazon.com/rds/)와 같은 많은 AWS 서비스가 다중 AZ 구성을 제공합니다. 이러한 서비스를 사용하면 관찰성 또는 장애 조치 도구를 추가로 구축할 필요가 없습니다. 단일 가용 영역에 영향을 미치는 [AWS 리전](https://aws.amazon.com/about-aws/global-infrastructure/regions_az/) 내에서 쉽게 감지할 수 있는 바이너리 장애 모드에서도 워크로드를 복원할 수 있습니다. 이는 완전한 물리적 하드웨어 장애, 전력 손실 또는 대다수 리소스에 영향을 미치는 잠재적 소프트웨어 버그일 수 있습니다.

 그러나 *회색 장애*라고 하는 또 다른 범주의 장애도 있는데, 이러한 장애 유형은 미묘하고 빠르고 확실하게 감지하기 어렵습니다. 결과적으로 고장으로 인한 영향을 완화하는 데 시간이 더 오래 걸립니다. 이 백서에서는 회색 장애가 다중 AZ 아키텍처에 미칠 수 있는 영향, 이를 감지하는 방법, 마지막으로 장애를 완화하는 방법을 중점적으로 다룹니다.

****  
이 백서에 제공된 지침은 대부분 다음과 같은 특정 워크로드 클래스에 적용됩니다.  
주로 영역 AWS 서비스를 사용
단일 지역 복원력 개선 필요
필요한 관찰성 및 복원력 패턴을 구축하기 위해 상당한 투자를 할 의향이 있음
이러한 워크로드는 [회색 장애 대응](gray-failures.md#responding-to-gray-failures)에서 제시한 장단점 중 일부 또는 전부를 고려하지 않을 수도 있고 여러 지역을 사용할 수 있는 옵션이 없을 수도 있습니다. 이러한 유형의 워크로드는 전체 포트폴리오의 일부에 불과할 가능성이 높으므로 플랫폼 수준과 워크로드 수준에서 이 지침을 고려해야 합니다.