

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 可用性和超越：了解和提高分佈式系統的彈性 AWS
<a name="availability-and-beyond-improving-resilience"></a>

出版日期：**二零二一年十一月十二**[文件歷史紀錄](document-revisions.md)日

 如今，企業在雲端和內部部署中運作複雜的分散式系統。他們希望這些工作負載具有彈性，以便為客戶提供服務並實現其業務成果。本白皮書概述了可用性的共同理解，作為恢復性的衡量方法，建立了建立高可用性工作負載的規則，並提供有關如何提高工作負載可用性的指導。

## 簡介
<a name="introduction"></a>

 建置高可用性工作負載意味著什麼？ 您如何衡量可用性？ 我該怎麼做才能提高工作負載的可用性？ 本文件將幫助您回答這些類型的問題。它分為三個主要部分。第一節，*了解可用性*在很大程度上是理論上的。它建立了可用性的定義和影響它的因素的共同理解。第二節「*測量可用性*」提供有關以實證方式衡量工作負載可用性的指導。第三部分，在*上設計高可用性的分散式系統AWS*是第一節中介紹的想法的實際應用。此外，在這些章節中，本白皮書將識別用於建置彈性工作負載的規則。本文件旨在支援「[AWS架構良好的可靠性](https://docs.aws.amazon.com/wellarchitected/latest/reliability-pillar/welcome.html)支柱」中提供的指導和最佳實務。

 在本論文中，您將遇到很多代數數學。關鍵要點是這個數學支持的概念，而不是數學本身。也就是說，這也是本文提出挑戰的意圖。當您操作高可用性工作負載時，您需要能夠在數學上證明您建置的內容正在實現您的預期。即使是建立在良好意圖上的最佳設計，也可能無法始終達到預期的結果。這意味著您需要測量解決方案有效性的機制，因此在構建和操作具有彈性且高可用性的分佈式系統時，需要某種程度的數學。