Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Pola Ketahanan Multi-AZ Tingkat Lanjut
<a name="advanced-multi-az-resilience-patterns"></a>

Tanggal publikasi:**11 Juli 2023**([Revisi dokumen](document-revisions.md))

Banyak pelanggan menjalankan beban kerja mereka dalam konfigurasi Multi-Availability Zone (AZ) yang sangat tersedia. Arsitektur ini bekerja dengan baik selama kejadian kegagalan biner, tetapi sering mengalami masalah dengan*abu-abu*kegagalan. Manifestasi dari jenis kegagalan ini bisa halus, dan menentang deteksi cepat dan definitif. Tulisan ini memberikan panduan tentang cara instrumen beban kerja untuk mendeteksi dampak dari kegagalan abu-abu yang terisolasi ke Availability Zone tunggal, dan kemudian mengambil tindakan untuk mengurangi dampak tersebut di Availability Zone.

## Pengantar
<a name="introduction"></a>

 Tujuan dari dokumen ini adalah untuk membantu Anda menerapkan arsitektur Multi-AZ yang tangguh secara lebih efektif. Salah satu praktik terbaik untuk membangun sistem tangguh di[Cloud Pribadi Virtual Amazon](https://aws.amazon.com/vpc/)Jaringan (VPC) adalah untuk[menyebarkan setiap beban kerja ke beberapa Availability Zone](https://docs.aws.amazon.com/vpc/latest/userguide/vpc-security-best-practices.html). 

 Sebuah[Zona Ketersediaan](https://aws.amazon.com/about-aws/global-infrastructure/regions_az/)adalah satu atau lebih pusat data diskrit dengan daya, jaringan, dan konektivitas yang berlebihan. Menggunakan beberapa Availability Zone memungkinkan Anda mengoperasikan beban kerja yang lebih tersedia, toleran terhadap kesalahan, dan dapat diskalakan daripada yang mungkin dilakukan dari satu pusat data. 

 BanyakAWSlayanan, seperti[Penskalaan Otomatis Amazon Elastic Compute Cloud (EC2)](https://aws.amazon.com/ec2/autoscaling/)atau[Layanan Database Relasional Amazon](https://aws.amazon.com/rds/)(Amazon RDS), menyediakan konfigurasi Multi-AZ. Layanan ini tidak mengharuskan Anda untuk membangun observability tambahan atau tooling failover. Mereka membuat beban kerja tangguh untuk mode kegagalan biner yang mudah dideteksi dalam[AWS Region](https://aws.amazon.com/about-aws/global-infrastructure/regions_az/)yang memengaruhi Availability Zone tunggal. Ini bisa berupa kegagalan perangkat keras fisik lengkap, kehilangan daya, atau bug perangkat lunak laten yang memengaruhi sebagian besar sumber daya. 

 Tapi ada kategori kegagalan lain yang disebut*kegagalan abu-abu*, yang manifestasinya halus dan menentang deteksi cepat dan definitif. Hal ini pada gilirannya menghasilkan waktu yang lebih lama untuk mengurangi dampak yang disebabkan oleh kegagalan. Makalah ini berfokus pada dampak kegagalan abu-abu pada arsitektur Multi-AZ, cara mendeteksinya, dan, akhirnya, cara menguranginya. 

****  
Panduan yang disediakan dalam whitepaper ini sebagian besar berlaku untuk kelas beban kerja tertentu yang:  
Terutama menggunakan zonalAWSjasa
Perlu meningkatkan ketahanan Wilayah tunggal
Bersedia melakukan investasi yang signifikan untuk membangun pola observabilitas dan ketahanan yang diperlukan
Dalam beban kerja ini, Anda mungkin tidak mau membuat beberapa, atau semua, dari pengorbanan yang disajikan[Menanggapi kegagalan abu-abu](gray-failures.md#responding-to-gray-failures), atau tidak memiliki opsi untuk menggunakan beberapa Wilayah. Jenis beban kerja ini cenderung mewakili sebagian kecil dari keseluruhan portofolio Anda dan karenanya panduan ini harus dipertimbangkan pada tingkat beban kerja versus pada tingkat platform.