

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# Amazon EVS 主機維護
<a name="evs-host-maintenance"></a>

由於 Amazon EVS 是自我管理的服務，因此您必須負責維護在主機上執行的 VMware Cloud Foundation (VCF) 軟體、監控主機運作狀態，以及修復主機問題，包括主機故障時的主機替換。如需在 VMware Cloud Foundation (VCF) 中管理 ESX 主機的詳細資訊，請參閱 VMware Cloud Foundation 文件中的[主機管理](https://techdocs.broadcom.com/us/en/vmware-cis/vcf/vcf-5-2-and-earlier/5-2/map-for-administering-vcf-5-2/host-management-admin.html)。

## 檢查基礎 EC2 執行個體的運作狀態
<a name="evs-host-ec2-instance-health"></a>

Amazon EC2 會在每一次執行 EC2 執行個體時執行自動化檢查，以識別硬體和軟體問題。您可以在 EC2 主控台中檢視這些狀態檢查的結果 AWS CLI ，或識別特定且可偵測的問題。如需詳細資訊，請參閱《[Amazon EC2 使用者指南》中的檢視 Amazon EC2 執行個體的狀態檢查](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/viewing_status.html)，以及《 * AWS CLI 命令列參考*》中的 [describe-instance-status](https://docs.aws.amazon.com/cli/latest/reference/ec2/describe-instance-status.html)。 *Amazon EC2 * 

您可以建立 CloudWatch 警示，在特定執行個體上的狀態檢查失敗時提醒您。如需詳細資訊，請參閱《tje [Amazon EC2 使用者指南》中的為狀態檢查失敗的 Amazon EC2 執行個體建立 CloudWatch 警示](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/creating_status_check_alarms.html)。 *Amazon EC2 *

## 關於 EC2 執行個體的 AWS 排程維護
<a name="evs-host-maintenance-about"></a>

 AWS 會對基礎 EC2 執行個體執行排程維護，以確保可靠性、可用性和效能。EC2 裸機執行個體的排程事件類型與其他 EC2 執行個體相同。 AWS 可以排程事件以重新啟動、停止和淘汰您的執行個體，因為基礎硬體問題或排程維護。這些事件不會頻繁發生。如需詳細資訊，請參閱《*Amazon EC2 使用者指南*》中的[排程事件類型](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/monitoring-instances-status-check_sched.html#types-of-scheduled-events)。

**注意**  
在任何排定的重新啟動事件之前，您應該將主機置於 vSphere 用戶端中的維護模式。

如果您的其中一個執行個體將受到排程事件的影響， 會使用與您相關聯的電子郵件地址，透過電子郵件提前 AWS 通知您 AWS 帳戶。 AWS 也會傳送 AWS 運作狀態事件，您可以使用 Amazon EventBridge 來監控和管理該事件。如需詳細資訊，請參閱《[Amazon EC2 使用者指南》中的使用 Amazon EventBridge 監控 AWS 運作狀態中的事件](https://docs.aws.amazon.com/health/latest/ug/cloudwatch-events-health.html)和 Amazon EC2 執行個體的排程事件。 [ Amazon EC2 ](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/monitoring-instances-status-check_sched.html) *Amazon EC2 *

您可以隨時重新排程事件，使其在適合您的特定日期和時間發生。事件最晚可以重新排程到事件截止日期。如需詳細資訊，請參閱《Amazon [ EC2 使用者指南》中的重新排程 EC2 執行個體的排程事件](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/reschedule-event.html)。 *Amazon EC2 *

## 使用 EC2 隨需容量預留
<a name="evs-host-maintenance-odcr"></a>

您可以使用 EC2 隨需容量預留，以確保您的叢集在維護期間有足夠的容量。您可以保留特定可用區域中任何持續時間的容量。如需詳細資訊，請參閱《Amazon [ EC2 使用者指南》中的使用 EC2 隨需容量保留保留運算容量](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ec2-capacity-reservations.html)。 *Amazon EC2 *

如需建立容量保留的步驟，請參閱《*Amazon EC2 使用者指南*》中的[建立容量保留](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/capacity-reservations-create.html)。

**注意**  
如果您使用 EC2 隨需容量預留或 EC2 專用主機，我們建議您為關鍵任務工作負載保留備用主機。雖然容量保留可確保您可以在指定的可用區域中存取特定數量的 EC2 執行個體容量，但讓備用主機提供額外的備援層，這對於關鍵任務工作負載至關重要。對於專用主機，擁有備用主機可確保您維護關鍵任務工作負載的環境，即使主要主機需要維護或遇到問題。

## 準備 AWS 排程 `system-maintenance`和 `instance-retirement`事件
<a name="evs-host-preparing-aws-scheduled-maintenance"></a>

 AWS 會排程兩種類型的`system-maintenance`事件：網路維護和電源維護。
+ 在網路維護期間，排程執行個體會暫時遺失網路連線能力。維護完成後，便會還原您執行個體的一般網路連線能力。
+ 在電源維護期間，排程執行個體會暫時離線，然後重新開機。在 EC2 裸機執行個體上執行重新啟動時，不會保留執行個體存放磁碟區資料。

 AWS 當偵測到託管 EC2 執行個體的基礎硬體降級時， 會排程 EC2 `instance-retirement`事件。

若要修復 `system-maintenance`和 `instance-retirement`事件，請在發生維護事件之前，使用 Amazon EVS 主控台或 AWS CLI 和 SDDC Manager 將失敗的主機取代為新主機。如果您等待發生維護事件，且需要重新啟動 EC2 執行個體，則會遺失存放在執行個體存放區磁碟區中的 vSAN 資料。如需詳細步驟，請參閱[取代 Amazon EVS 主機](#evs-replace-host)。

**重要**  
EC2 主控台不應用於管理 Amazon EVS 主機的狀態，包括停止、啟動和終止。請勿嘗試啟動、停止或終止 Amazon EVS 部署的 EC2 執行個體。此動作會導致 vSAN 資料遺失。

### 取代 Amazon EVS 主機
<a name="evs-replace-host"></a>

依照此程序來取代 Amazon EVS 主機。

**警告**  
Amazon EVS 主機使用自訂廠商附加元件來提供重要的主機功能。當您將主機新增至您的環境時，將會有最新版本的 Amazon EVS 自訂附加元件。如果您的環境使用具有較舊附加元件版本的主機，將主機新增至 vSphere 叢集會導致叢集映像修復失敗。如需疑難排解此問題的步驟，請參閱 [故障診斷由於不相容的叢集映像而新增主機失敗](evs-env-ami-maintenance.md#troubleshoot-add-host-failure-cluster-image)。

**警告**  
如果您已在部署後更新 ESX 版本，SDDC 管理員可能會在委託主機步驟中的 VCF 主機驗證期間失敗。如需疑難排解此問題的步驟，請參閱 [SDDC Manager 在主機測試期間未通過 VCF 主機驗證](troubleshooting.md#troubleshoot-sddc-failure-host-commission)。

**注意**  
請確定每個 EVS 環境配額的 Amazon EVS 主機計數已正確設定，以確保成功建立主機。如果此配額值少於您嘗試在單一 Amazon EVS 環境中佈建的主機數量，則主機建立會失敗。您可能需要為需要主機替換的維護操作請求提高配額。如需詳細資訊，請參閱[Amazon EVS 服務配額](service-quotas-evs.md)。

**Example**  

1. 前往 [Amazon EVS 主控台](https://console.aws.amazon.com/evs)。

1. 在導覽窗格中，選擇**環境**。

1. 選取包含要取代之主機的環境。

1. 選取**主機**索引標籤。

1. 選擇 **Create host (建立主機)**。

1. 指定主機詳細資訊，然後選擇**建立主機**。

1. 若要驗證完成，請檢查**主機狀態**是否已變更為**已建立**。

1. 從 AWS Secrets Manager 擷取 ESX 根密碼的憑證。如需擷取秘密的詳細資訊，請參閱[《 AWS Secrets Manager 使用者指南》中的從 Secrets Manager 取得](https://docs.aws.amazon.com/secretsmanager/latest/userguide/retrieving-secrets.html)* AWS 秘密*。

1. 移至 SDDC Manager。

1. 使用您在上一個步驟中擷取的 ESX 根登入資料，在 SDDC Manager 中委任新主機。如需詳細資訊，請參閱 VMware Cloud Foundation 文件中的 [Commission Hosts](https://techdocs.broadcom.com/us/en/vmware-cis/vcf/vcf-5-2-and-earlier/5-2/map-for-administering-vcf-5-2/host-management-admin/commission-hosts-admin.html)。

1. 將新主機新增至叢集。如需詳細資訊，請參閱 [ vSphere 文件中的如何使用快速入門工作流程將 ESX 主機新增至 vSphere 叢集](https://techdocs.broadcom.com/us/en/vmware-cis/vsphere/vsphere/8-0/use-quickstart-to-add---host-to-a-cluster.html)。 vSphere 

1. 停用 SDDC Manager 中您要從 SDDC Manager 移除的舊主機。如需詳細資訊，請參閱 VMware Cloud Foundation 文件中的[停用主機](https://techdocs.broadcom.com/us/en/vmware-cis/vcf/vcf-5-2-and-earlier/5-2/map-for-administering-vcf-5-2/host-management-admin/decommission-hosts-admin.html)。

1. 返回 Amazon EVS 主控台。

1. 在**主機**索引標籤下，選取失敗的主機，然後選擇**刪除** > **刪除主機**。

1. 開啟新的終端機工作階段。

1. 建立新的主機。如需參考，請參閱以下命令範例。

   ```
   aws evs create-environment-host \
       --environment-id "env-abcde12345" \
       --host '{ \
           "hostName": "esxi-host-05", \
           "keyName": "your-ec2-keypair-name", \
           "instanceType": "i4i.metal" \
           "esxVersion": "ESXi-8.0U3g-24859861"\
       }'
   ```

1. 從 AWS Secrets Manager 擷取 ESX 根密碼的憑證。如需擷取秘密的詳細資訊，請參閱[《 AWS Secrets Manager 使用者指南》中的從 Secrets Manager 取得](https://docs.aws.amazon.com/secretsmanager/latest/userguide/retrieving-secrets.html)* AWS 秘密*。

1. 移至 SDDC Manager。

1. 使用您在上一個步驟中擷取的 ESX 根登入資料，在 SDDC Manager 中委任新主機。如需詳細資訊，請參閱 VMware Cloud Foundation 文件中的 [Commission Hosts](https://techdocs.broadcom.com/us/en/vmware-cis/vcf/vcf-5-2-and-earlier/5-2/map-for-administering-vcf-5-2/host-management-admin/commission-hosts-admin.html)。

1. 將新主機新增至包含受損主機的叢集。

1. 在 SDDC Manager 中停用受損的主機。如需詳細資訊，請參閱 VMware Cloud Foundation 文件中的[停用主機](https://techdocs.broadcom.com/us/en/vmware-cis/vcf/vcf-5-2-and-earlier/5-2/map-for-administering-vcf-5-2/host-management-admin/decommission-hosts-admin.html)。

1. 返回終端機。

1. 刪除失敗的主機。如需參考，請參閱以下命令範例。

   ```
   aws evs delete-environment-host --environment-id "env-abcde12345" --host-name "esxi-host-05"
   ```

### 疑難排解
<a name="evs-maintenance-troubleshooting"></a>

#### Broadcom 和 AWS 支援指引
<a name="broadcom_and_shared_aws_support_guidance"></a>

 AWS 支援 Amazon EVS 及其相關聯的基礎設施服務，包括 VMware Cloud Foundation (VCF)。如需 VCF 特定的組態指導，或與 Aria Suite、HCX 或 NSX 等其他 VMware 產品相關的問題，您也可以直接使用 Broadcom 支援權利來聯絡 Broadcom。如需詳細資訊，請參閱 [Broadcom 支援入口網站](https://support.broadcom.com/)。

如需疑難排解指引，請參閱 [疑難排解](troubleshooting.md)。如果您在檢閱疑難排解指引後仍遇到問題，請聯絡 AWS Support 以取得進一步協助。