

# SUS 5 如何選取雲端硬體和服務並在您的架構中使用，以支持您的永續性目標？
<a name="sus-05"></a>

透過變更硬體管理實務，尋求降低工作負載永續性影響的機會。將佈建和部署所需的硬體量降至最低，並為個別工作負載選取最高效率的硬體和服務。 

**Topics**
+ [SUS05-BP01 使用最低數量的硬體來滿足需求](sus_sus_hardware_a2.md)
+ [SUS05-BP02 使用影響最小的執行個體類型](sus_sus_hardware_a3.md)
+ [SUS05-BP03 使用受管服務](sus_sus_hardware_a4.md)
+ [SUS05-BP04 將硬體型運算加速器的使用方式最佳化](sus_sus_hardware_a5.md)

# SUS05-BP01 使用最低數量的硬體來滿足需求
<a name="sus_sus_hardware_a2"></a>

使用最低數量的硬體讓您的工作負載有效達成商業需求。

 **常見的反模式：** 
+  您未監控資源使用率。 
+  您的架構中有資源處於低使用率水準。 
+  您未審查靜態硬體的使用率以判斷是否應調整其大小。 
+  您未根據業務 KPI 設定運算基礎設施的硬體使用率目標。 

 **建立此最佳實務的優勢：**適當調整雲端資源大小有助於降低工作負載的環境影響、節省金錢並維護效能基準。 

 **未建立此最佳實務時的風險暴露等級：**中 

## 實作指引
<a name="implementation-guidance"></a>

 建議選取您的工作負載所需的硬體總數，以改善其整體效率。AWS 雲端 提供的彈性可透過各種機制 (例如 [AWS Auto Scaling](https://aws.amazon.com/autoscaling/)) 動態擴充或減少資源數量，以因應需求的變化。此外也提供 [API 和 SDK](https://aws.amazon.com/developer/tools/)，讓修改資源變得非常輕鬆。使用這些功能可以頻繁變更工作負載實作。此外，使用 AWS 工具提供的適當調整大小指導方針可讓您有效操作雲端資源，而達到您的商業需求。 

 **實作步驟** 
+  選擇最符合您的需求的執行個體類型。 
  + [如何為工作負載選擇適當的 Amazon EC2 執行個體類型？](https://aws.amazon.com/premiumsupport/knowledge-center/ec2-instance-choose-type-for-workload/)
  + [Amazon EC2 機群的屬性型執行個體類型選取。](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ec2-fleet-attribute-based-instance-type-selection.html)
  + [使用屬性型執行個體類型選取建立 Auto Scaling 群組。](https://docs.aws.amazon.com/autoscaling/ec2/userguide/create-asg-instance-type-requirements.html)
+  針對變動工作負載，以較小的增量進行擴展。 
+  使用多種運算購買選項，以在執行個體的彈性、可擴展性和成本節省之間取得平衡。 
  +  [隨需執行個體](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ec2-on-demand-instances.html)最適用於新的有狀態尖峰工作負載 (其執行個體類型、位置或時間不具彈性)。 
  +  [Spot 執行個體](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/using-spot-instances.html)很適合用來補強具有容錯能力和彈性的應用程式適用的其他選項。 
  +  對於狀態穩定、允許隨著您的需求變更保有彈性 (例如 AZ、區域、執行個體系列或執行個體類型) 的工作負載，請使用 [Compute Savings Plans](https://aws.amazon.com/savingsplans/compute-pricing/)。 
+  利用執行個體和可用區域的多樣化達到最大的應用程式可用性，並在情況允許時充分運用過剩容量。 
+  使用 AWS 工具提供的適當調整大小建議，調整您的工作負載。 
  + [AWS Compute Optimizer](https://aws.amazon.com/compute-optimizer/)
  + [AWS Trusted Advisor](https://aws.amazon.com/premiumsupport/technology/trusted-advisor/)
+  協商服務水準協議 (SLA)，允許暫時減少容量，同時自動化部署替換資源。 

## 資源
<a name="resources"></a>

 **相關文件：** 
+ [優化您的 AWS 永續性基礎設施，第 I 部分：運算](https://aws.amazon.com/blogs/architecture/optimizing-your-aws-infrastructure-for-sustainability-part-i-compute/)
+ [Amazon EC2 機群的 Auto Scaling 屬性型執行個體類型選取](https://aws.amazon.com/blogs/aws/new-attribute-based-instance-type-selection-for-ec2-auto-scaling-and-ec2-fleet/)
+ [AWS Compute Optimizer 文件](https://docs.aws.amazon.com/compute-optimizer/index.html)
+  [操作 Lambda：效能優化](https://aws.amazon.com/blogs/compute/operating-lambda-performance-optimization-part-2/) 
+  [Auto Scaling 文件](https://docs.aws.amazon.com/autoscaling/index.html) 

 **相關影片：** 
+ [打造兼具成本、能源和資源優勢的運算環境](https://www.youtube.com/watch?v=8zsC5e1eLCg)

 **相關範例：** 
+ [Well-Architected 實驗室 - 在 AWS Compute Optimizer 和記憶體使用率已啟用的情況下適當調整大小 (Level 200)](https://www.wellarchitectedlabs.com/cost/200_labs/200_aws_resource_optimization/5_ec2_computer_opt/)

# SUS05-BP02 使用影響最小的執行個體類型
<a name="sus_sus_hardware_a3"></a>

持續監控並使用新的執行個體類型，讓能源效率方面的改進充分發揮效用。

 **常見的反模式：** 
+  您僅使用一個執行個體系列。 
+  您僅使用 x86 執行個體。 
+  您在 Amazon EC2 Auto Scaling 組態中指定了一個執行個體類型。 
+  您以不符合設計宗旨的方式使用 AWS 執行個體 (例如，您將運算優化的執行個體用於記憶體密集型工作負載)。 
+  您未定期評估新的執行個體類型。 
+  您未查看 AWS 適當調整大小的工具 (例如 [AWS Compute Optimizer) 提供的建議。](https://aws.amazon.com/compute-optimizer/) 

 **建立此最佳實務的優勢：** 藉由使用節能且適當調整大小的執行個體，將可大幅降低環境受到的影響以及工作負載成本。 

 **未建立此最佳實務時的曝險等級：** 中 

## 實作指引
<a name="implementation-guidance"></a>

 在雲端工作負載中使用高效執行個體，是降低資源用量和提高成本效益的關鍵。持續關注新執行個體類型的發佈，並運用能源效率改進，包括旨在支援特定工作負載 (例如機器學習訓練和推論以及影片轉碼) 的執行個體類型。 

## 實作步驟
<a name="implementation-steps"></a>
+  了解並探索可降低工作負載環境影響的執行個體類型。 
  +  訂閱 [AWS 最新消息](https://aws.amazon.com/new/) ，隨時掌握最新的 AWS 技術和執行個體。 
  +  了解不同的 AWS 執行個體類型。 
  +  觀看下列資源，了解 AWS Graviton 型執行個體如何在 Amazon EC2 中的能源使用提供最佳效能功耗比。 [re:Invent 2020 - 深入探討搭載 AWS Graviton2 處理器的 Amazon EC2 執行個體](https://www.youtube.com/watch?v=NLysl0QvqXU) 和 [深入探討 AWS Graviton3 和 Amazon EC2 C7g 執行個體](https://www.youtube.com/watch?v=WDKwwFQKfSI&ab_channel=AWSEvents)。 
+  進行相關規劃，將工作負載轉移至影響程度最低的執行個體類型。 
  +  定義一個程序來評估工作負載的新功能和執行個體。利用雲端的靈活性快速測試新功能類型對您的工作負載環境永續性有何改善。使用代理指標，測量您需要多少資源才能完成一個工作單位。 
  +  如果可行，請修改工作負載，以使用不同數量的 CPU 和不同數量的記憶體，從而最大化您選擇執行個體類型的空間。 
  +  考慮將您的工作負載轉移至 Graviton 型執行個體，以改善工作負載的效能效率。 
    +  [AWS Graviton Fast Start](https://aws.amazon.com/ec2/graviton/fast-start/) 
    +  [將工作負載轉移至 AWS Graviton 型 Amazon Elastic Compute Cloud 執行個體時所需考量的事項](https://github.com/aws/aws-graviton-getting-started/blob/main/transition-guide.md) 
    +  [AWS Graviton2 for ISVs](https://docs.aws.amazon.com/whitepapers/latest/aws-graviton2-for-isv/welcome.html) 
  +  請考慮選取 AWS Graviton 選項 (在您要使用的 [AWS 受管服務中)。](https://github.com/aws/aws-graviton-getting-started/blob/main/managed_services.md) 
  +  將工作負載遷移至有執行個體對永續性影響最小，且仍符合業務要求的區域。 
  +  針對機器學習工作負載，請利用專供工作負載使用的專用硬體，例如 [AWS Trainium](https://aws.amazon.com/machine-learning/trainium/)、 [AWS Inferentia](https://aws.amazon.com/machine-learning/inferentia/)，和 [Amazon EC2 DL1。](https://aws.amazon.com/ec2/instance-types/dl1/) AWS Inferentia 執行個體 (例如 Inf2 執行個體) 所提供的效能功耗比最多會比同類 Amazon EC2 執行個體高出 50%。 
  +  使用 [Amazon SageMaker AI Inference Recommender](https://docs.aws.amazon.com/sagemaker/latest/dg/inference-recommender.html) 適當調整 ML 推論端點的大小。 
  +  對於激增的工作負載 (不常需要額外容量的工作負載)，請使用 [高載效能執行個體。](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/burstable-performance-instances.html) 
  +  對於無狀態和容錯工作負載，請使用 [Amazon EC2 Spot 執行個體](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/using-spot-instances.html) 提高雲端整體使用率，並減少未使用資源的永續性影響。 
+  操作並優化您的工作負載執行個體。 
  +  對於暫時性工作負載，請評估 [執行個體 Amazon CloudWatch 指標](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/viewing_metrics_with_cloudwatch.html#ec2-cloudwatch-metrics) (例如 `CPUUtilization` )，以確認執行個體是否閒置或未充分利用。 
  +  對於穩定的工作負載，請定期檢查 AWS 適當調整大小的工具 (例如 [AWS Compute Optimizer](https://aws.amazon.com/compute-optimizer/) )，以找出對執行個體進行優化和適當調整大小的機會。 
    + [ Well-Architected 實驗室 - 適當調整大小的建議 ](https://wellarchitectedlabs.com/cost/100_labs/100_aws_resource_optimization/)
    + [ Well-Architected 實驗室 - 使用 Compute Optimizer 適當調整大小 ](https://wellarchitectedlabs.com/cost/200_labs/200_aws_resource_optimization/)
    + [ Well-Architected 實驗室 - 優化硬體模式和觀察永續性 KPI ](https://wellarchitectedlabs.com/sustainability/200_labs/200_optimize_hardware_patterns_observe_sustainability_kpis/)

## 資源
<a name="resources"></a>

 **相關文件：** 
+  [優化您的 AWS 永續性基礎架構，第 I 部分：運算](https://aws.amazon.com/blogs/architecture/optimizing-your-aws-infrastructure-for-sustainability-part-i-compute/) 
+  [AWS Graviton](https://aws.amazon.com/ec2/graviton/) 
+  [Amazon EC2 DL1](https://aws.amazon.com/ec2/instance-types/dl1/) 
+  [Amazon EC2 容量保留機群](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/cr-fleets.html) 
+  [Amazon EC2 Spot 機群](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/spot-fleet.html) 
+  [函數：Lambda 函數組態](https://docs.aws.amazon.com/lambda/latest/dg/best-practices.html#function-configuration) 
+ [ Amazon EC2 機群的屬性型執行個體類型選取 ](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ec2-fleet-attribute-based-instance-type-selection.html)
+ [在 AWS 上建置永續性、高效且成本優化的應用程式](https://aws.amazon.com/blogs/compute/building-sustainable-efficient-and-cost-optimized-applications-on-aws/)
+ [ Contino 永續性儀表板如何協助客戶優化其碳足跡 ](https://aws.amazon.com/blogs/apn/how-the-contino-sustainability-dashboard-helps-customers-optimize-their-carbon-footprint/)

 **相關影片：** 
+  [深入探討搭載 AWS Graviton2 處理器的 Amazon EC2 執行個體](https://www.youtube.com/watch?v=NLysl0QvqXU) 
+  [深入探討 AWS Graviton3 和 Amazon EC2 C7g 執行個體](https://www.youtube.com/watch?v=WDKwwFQKfSI&ab_channel=AWSEvents) 
+ [ 打造兼具成本、能源和資源優勢的運算環境 ](https://www.youtube.com/watch?v=8zsC5e1eLCg)

 **相關範例：** 
+ [ 解決方案：在 AWS 上優化深度學習工作負載以維持永續性的指引 ](https://aws.amazon.com/solutions/guidance/optimizing-deep-learning-workloads-for-sustainability-on-aws/)
+  [Well-Architected 實驗室 - 適當調整大小的建議](https://wellarchitectedlabs.com/cost/100_labs/100_aws_resource_optimization/) 
+  [Well-Architected 實驗室 - 使用 Compute Optimizer 適當調整大小](https://wellarchitectedlabs.com/cost/200_labs/200_aws_resource_optimization/) 
+  [Well-Architected 實驗室 - 優化硬體模式和觀察永續性 KPI](https://wellarchitectedlabs.com/sustainability/200_labs/200_optimize_hardware_patterns_observe_sustainability_kpis/) 
+ [ Well-Architected 實驗室 - 將服務遷移至 Graviton ](https://www.wellarchitectedlabs.com/sustainability/100_labs/100_migrate_services_to_graviton/)

# SUS05-BP03 使用受管服務
<a name="sus_sus_hardware_a4"></a>

使用受管服務以提高雲端中的操作效率。

 **常見的反模式：** 
+  您使用具有低使用率的 Amazon EC2 執行個體來執行應用程式。 
+  您的內部團隊僅管理工作負載，而沒有時間專注於創新或簡化。 
+  您為在受管服務上可更高效執行的任務部署及維護技術。 

 **建立此最佳實務的優勢：** 
+  使用受管服務可將責任轉移給 AWS，他們擁有從數百萬客戶積累而成的洞察，可帶來新的創新和效率動能。 
+  基於多租用戶控制平面，受管服務將服務產生的環境影響分散到眾多使用者。 

 **未建立此最佳實務時的風險暴露等級：**中 

## 實作指引
<a name="implementation-guidance"></a>

 受管服務可將維持已部署硬體的高使用率和永續性優化的責任轉移給 AWS。受管服務也免除了維護服務的營運和管理重擔，讓您的團隊有更多時間可專注於創新。 

 審查您的工作負載，以識別可能被 AWS 受管服務取代的元件。例如，[Amazon RDS](https://aws.amazon.com/rds/)、[Amazon Redshift](https://aws.amazon.com/redshift/) 和 [Amazon ElastiCache](https://aws.amazon.com/elasticache/) 提供受管分析服務。[Amazon Athena](https://aws.amazon.com/athena/)、[Amazon EMR](https://aws.amazon.com/emr/) 和 [Amazon OpenSearch Service](https://aws.amazon.com/opensearch-service/) 提供受管分析服務。 

 **實作步驟** 

1.  清查工作負載中的服務和元件。 

1.  評估並識別可能被受管服務取代的元件。以下舉例說明您可能會考慮使用受管服務的時機：     
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_tw/wellarchitected/2023-04-10/framework/sus_sus_hardware_a4.html)

1.  識別相依性並建立遷移計劃。據以更新執行手冊和程序手冊。 
   +  [AWS Application Discovery Service](https://aws.amazon.com/application-discovery/) 會自動收集並提供有關應用程式相依性和利用率的詳細資訊，協助您在計劃遷移時做出更明智的決定。 

1.  在遷移至受管服務之前先測試服務。 

1.  使用遷移計劃將自我託管服務取代為受管服務。 

1.  在遷移完成後繼續監控服務，以便在必要時進行調整及優化服務。 

## 資源
<a name="resources"></a>

 **相關文件：** 
+ [AWS 雲端 產品](https://aws.amazon.com/products/)
+ [AWS 總體擁有成本 (TCO) 計算器](https://calculator.aws/#/)
+  [Amazon DocumentDB](https://aws.amazon.com/documentdb/) 
+  [Amazon Elastic Kubernetes Service (EKS)](https://aws.amazon.com/eks/) 
+  [Amazon Managed Streaming for Apache Kafka (Amazon MSK)](https://aws.amazon.com/msk/) 

 **相關影片：** 
+ [使用 AWS Managed Services 大規模進行雲端操作](https://www.youtube.com/watch?v=OCK8GCImWZw)

# SUS05-BP04 將硬體型運算加速器的使用方式最佳化
<a name="sus_sus_hardware_a5"></a>

將加速運算執行個體的使用方式最佳化，以降低工作負載的實體基礎設施需求。

 **常見的反模式：** 
+  未監控 GPU 使用率。 
+  針對工作負載使用一般用途的執行個體，但專用執行個體可以提供更高的效能、較低的成本，以及更優異的效能功耗比。 
+  您使用硬體型運算加速器來執行任務，但使用 CPU 型運算加速器來執行時會更有效率。 

 **建立此最佳實務的優勢：** 將硬體型加速器的使用方式優化，可以降低工作負載的實體基礎設施需求。 

 **未建立此最佳實務時的曝險等級：** 中 

## 實作指引
<a name="implementation-guidance"></a>

 如果需要高處理能力，使用加速運算執行個體可讓您獲得好處，因為其可讓您存取硬體型運算加速器，例如圖形處理單元 (GPU) 和現場可程式化邏輯閘陣列 (FPGA)。這些硬體加速器在執行某些功能 (例如圖形處理或資料模式比對) 時，會比 CPU 型加速器更有效率。許多加速工作負載 (例如轉譯、轉碼和機器學習) 在資源用量方面極為變化不定。只在需要時執行此硬體，不需要時便將其自動除役，以將資源消耗降至最低。 

## 實作步驟
<a name="implementation-steps"></a>
+  識別哪些 [加速運算執行個體](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/accelerated-computing-instances.html) 可以滿足您的要求。 
+  針對機器學習工作負載，請利用專供工作負載使用的專用硬體，例如 [AWS Trainium](https://aws.amazon.com/machine-learning/trainium/)、 [AWS Inferentia](https://aws.amazon.com/machine-learning/inferentia/)，和 [Amazon EC2 DL1](https://aws.amazon.com/ec2/instance-types/dl1/)。AWS Inferentia 執行個體 (例如 Inf2 執行個體) 最多可提供 [比同類 Amazon EC2 執行個體高出 50% 的效能功耗比](https://aws.amazon.com/machine-learning/inferentia/)。 
+  請收集加速運算執行個體的用量指標。例如，您可以使用 CloudWatch 代理程式來收集指標，像是 `utilization_gpu` 和 `utilization_memory` ，並將其用於您的 GPU，相關說明請見 [使用 Amazon CloudWatch 收集 NVIDIA GPU 指標](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-Agent-NVIDIA-GPU.html)。 
+  優化硬體加速器的程式碼、網路運作和設定，以確保系統會充分利用基礎硬體。 
  +  [優化 GPU 設定](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/optimize_gpu.html) 
  +  [Deep Learning AMI 中的 GPU 監控和優化](https://docs.aws.amazon.com/dlami/latest/devguide/tutorial-gpu.html) 
  +  [將 I/O 優化以針對 Amazon SageMaker AI 中的深度學習訓練進行 GPU 效能調校](https://aws.amazon.com/blogs/machine-learning/optimizing-i-o-for-gpu-performance-tuning-of-deep-learning-training-in-amazon-sagemaker/) 
+  使用最新的高效能程式庫和 GPU 驅動程式。 
+  使用自動化來釋出不使用的 GPU 執行個體。 

## 資源
<a name="resources"></a>

 **相關文件：** 
+  [加速運算](https://aws.amazon.com/ec2/instance-types/#Accelerated_Computing) 
+ [ 開始建構吧！ 使用自訂晶片和加速器來進行建構 ](https://aws.amazon.com/blogs/architecture/lets-architect-custom-chips-and-accelerators/)
+ [ 如何為工作負載選擇適當的 Amazon EC2 執行個體類型？ ](https://aws.amazon.com/premiumsupport/knowledge-center/ec2-instance-choose-type-for-workload/)
+  [Amazon EC2 VT1 執行個體](https://aws.amazon.com/ec2/instance-types/vt1/) 
+  [Amazon Elastic Graphics](https://docs.aws.amazon.com/AWSEC2/latest/WindowsGuide/elastic-graphics.html) 
+ [ 選擇最佳的 AI 加速器和模型編譯以 Amazon SageMaker AI 推斷電腦視覺 ](https://aws.amazon.com/blogs/machine-learning/choose-the-best-ai-accelerator-and-model-compilation-for-computer-vision-inference-with-amazon-sagemaker/)

 **相關影片：** 
+ [ 如何為深度學習選取 Amazon EC2 GPU 執行個體 ](https://www.youtube.com/watch?v=4bVrIbgGWEA)
+  [深入探討 Amazon EC2 Elastic GPU](https://www.youtube.com/watch?v=HbJ2xxgrcCE) 
+  [部署經濟實惠的深度學習推斷](https://www.youtube.com/watch?v=WiCougIDRsw) 