

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 對 Amazon FSx for NetApp ONTAP 進行故障診斷
<a name="troubleshooting"></a>

使用下列各節來協助針對 FSx for ONTAP 檔案系統進行故障診斷。

**Topics**
+ [您的檔案系統處於 `MISCONFIGURED` 狀態](file-system-in-misconfigured-state.md)
+ [您無法存取您的檔案系統](unable-to-access.md)
+ [您的儲存虛擬機器 (SVM) 處於 `MISCONFIGURED` 狀態](misconfigured-svm.md)
+ [故障診斷 SSD 可減少操作問題](ssd-decrease-troubleshooting.md)
+ [您無法將儲存虛擬機器 (SVM) 加入 Active Directory](cannot-join-svm-to-ad.md)
+ [您無法刪除儲存虛擬機器或磁碟區](cannot-delete-svm.md)
+ [您的磁碟區處於 `MISCONFIGURED` 狀態](misconfigured-volume.md)
+ [您的磁碟區儲存容量不足](low-volume-capacity.md)
+ [由於磁碟區容量不足，您的備份失敗](backups-failing.md)
+ [復原已刪除的 FSx for ONTAP 磁碟區](recovering-deleted-volumes.md)
+ [故障診斷網路問題](network-issues.md)
+ [對 I/O 錯誤和 NFS 鎖定回收失敗進行故障診斷](nfs-failover-issues.md)

# 您的檔案系統處於 `MISCONFIGURED` 狀態
<a name="file-system-in-misconfigured-state"></a>

檔案系統處於 `MISCONFIGURED` 狀態有許多潛在原因，每個系統都有自己的解析度，如下所示。

**Topics**
+ [VPC 擁有者帳戶已停用異地同步備份 VPC 共用](#maz-file-system)
+ [您無法在多可用區域檔案系統上建立新的 SVM](#unable-to-create-svm-on-maz)
+ [檔案系統的 SSD 儲存層已滿 90%](#ssd-tier-gt-90-percent)

## VPC 擁有者帳戶已停用異地同步備份 VPC 共用
<a name="maz-file-system"></a>

由於下列其中一個原因，在共用 VPC 子網路 AWS 帳戶 中由參與者建立的異地同步備份檔案系統將進入 `MISCONFIGURED` 狀態：
+ 共用 VPC 子網路的擁有者帳戶已停用 FSx for ONTAP 檔案系統的多可用區域 VPC 共用支援。
+ 擁有者帳戶已停止共用 VPC 子網路。

如果擁有者帳戶已停止共用 VPC 子網路，您會在該檔案系統的 主控台中看到下列訊息：

```
The vpc ID vpc-012345abcde does not exist
```

若要解決此問題，您必須聯絡與您共用 VPC 子網路的擁有者帳戶。如需詳細資訊，請參閱 [在共用子網路中建立 FSx for ONTAP 檔案系統](creating-file-systems.md#fsxn-vpc-shared-subnets) 以取得詳細資訊。

## 您無法在多可用區域檔案系統上建立新的 SVM
<a name="unable-to-create-svm-on-maz"></a>

對於共用 VPC AWS 帳戶 中參與者建立的異地同步備份檔案系統，由於下列其中一個原因，您將無法建立新的 SVM：
+ 共用 VPC 子網路的擁有者帳戶已停用 FSx for ONTAP 檔案系統的多可用區域 VPC 共用支援。
+ 擁有者帳戶已停止共用 VPC 子網路。

若要解決此問題，您必須聯絡與您共用 VPC 子網路的擁有者帳戶。如需詳細資訊，請參閱 [在共用子網路中建立 FSx for ONTAP 檔案系統](creating-file-systems.md#fsxn-vpc-shared-subnets) 以取得詳細資訊。

## 檔案系統的 SSD 儲存層已滿 90%
<a name="ssd-tier-gt-90-percent"></a>

您的單一可用區或多可用區檔案系統的 SSD 儲存層目前已滿 90%。我們建議您持續不超過 SSD 儲存層的 80% 使用率。如果您在檔案系統下一個維護時段之前未釋放 SSD 儲存層中的空間，FSx for ONTAP 會在修補操作期間暫時降低檔案系統的輸送量。這是為了確保背景維護程序可以在合理的期間內完成。若要避免這種情況，請將 SSD 儲存層的使用率降低到 90% 以下。您可以透過多種方式降低 SSD 使用率，包括：
+ 增加檔案系統的 SSD 儲存容量。
+ 透過刪除不需要的資料。
+ 透過刪除不需要的磁碟區快照。

如需詳細資訊，請參閱[管理儲存容量](managing-storage-capacity.md)。

# 您無法存取您的檔案系統
<a name="unable-to-access"></a>

本節說明與無法存取您的檔案系統相關的問題和解決方案。

**Topics**
+ [您的多可用區檔案系統缺少路由表標籤](#no-route-table-tags)
+ [您的檔案系統有超過 50 個路由](#more-than-50-routes)
+ [您的檔案系統缺少一或多個檔案伺服器的路由](#missing-routes-to-servers)
+ [檔案系統的彈性網路界面已修改或刪除](#eni-deleted)
+ [已刪除連接至檔案系統彈性網路界面的彈性 IP 地址](#eni-epi-removed)
+ [檔案系統的 VPC 安全群組缺少必要的傳入規則](#sg-lacks-inbound-rules)
+ [運算執行個體的 VPC 安全群組缺少必要的傳出規則](#compute-instance-lacks-inbound-rules)
+ [運算執行個體的子網路不會使用任何與檔案系統相關聯的路由表](#subnet-route-tables)
+ [Amazon FSx 無法更新使用 建立的多可用區域檔案系統的路由表 CloudFormation](#vpc-route-tables-not-tagged)
+ [無法從另一個 VPC 中的用戶端透過 iSCSI 存取檔案系統](#file-system-iscsi)
+ [擁有的帳戶已停止共用 VPC 子網路](#unshared-vpc-subnet)
+ [無法透過 NFS、SMB、ONTAP CLI 或 ONTAP REST API 從另一個 VPC 或內部部署中的用戶端存取檔案系統](#unable-to-access-over-network)

## 您的多可用區檔案系統缺少路由表標籤
<a name="no-route-table-tags"></a>

Amazon FSx 會使用標籤型身分驗證來管理多可用區域檔案系統的 VPC 路由表。與您的檔案系統相關聯的一或多個路由表目前缺少這些路由表標籤。這些路由表會以 標記`Key: AmazonFSx; Value: ManagedByAmazonFSx`。如果您在下一個維護時段之前未手動新增這些標籤，則與缺少標籤的路由表相關聯的子網路中的任何用戶端都會在修補操作期間暫時無法存取檔案系統。若要避免這種情況，請手動新增缺少的路由表標籤。

如需詳細資訊，請參閱[更新檔案系統](updating-file-system.md)。

## 您的檔案系統有超過 50 個路由
<a name="more-than-50-routes"></a>

您的檔案系統目前有超過 50 個與其相關聯的路由。如果您在檔案系統下一個排定的維護時段之前未移除其中一些路由，容錯移轉程序可能需要比平常更長的時間。若要避免這種情況，請將路由數量減少到 50 以下。以下是您可以採取的步驟，以減少與檔案系統相關聯的路由數量：
+ 刪除任何多餘的路由
+ 減少與檔案系統相關聯的 SVMs 數量
+ 減少與檔案系統相關聯的路由表數量

如需詳細資訊，請參閱[更新檔案系統](updating-file-system.md)及[刪除儲存虛擬機器 (SVM)](deleting-svms.md)。

## 您的檔案系統缺少一或多個檔案伺服器的路由
<a name="missing-routes-to-servers"></a>

您的檔案系統目前缺少一或多個檔案伺服器的路由，而現有的路由表沒有足夠的空間來新增路由表項目。如果您在檔案系統下一個排定的維護時段之前未新增缺少的路由，任何連線的用戶端都會在修補操作期間中斷連線。若要避免這種情況，請新增缺少的路由。

如需詳細資訊，請參閱[更新檔案系統](updating-file-system.md)及[配額](limits.md)。

## 檔案系統的彈性網路界面已修改或刪除
<a name="eni-deleted"></a>

您不得修改或刪除任何檔案系統的彈性網路界面。修改或刪除網路界面可能會導致虛擬私有雲端 (VPC) 與檔案系統之間的連線永久中斷。建立新的檔案系統，請勿修改或刪除 Amazon FSx 網路介面。如需詳細資訊，請參閱[使用 Amazon VPC 的檔案系統存取控制](limit-access-security-groups.md)。

## 已刪除連接至檔案系統彈性網路界面的彈性 IP 地址
<a name="eni-epi-removed"></a>

Amazon FSx 不支援從公有網際網路存取檔案系統。Amazon FSx 會自動分離任何彈性 IP 地址，這是可從網際網路連線的公有 IP 地址，連接到檔案系統的彈性網路界面。如需詳細資訊，請參閱[支援的用戶端](supported-fsx-clients.md#supported-clients-fsx)。

## 檔案系統的 VPC 安全群組缺少必要的傳入規則
<a name="sg-lacks-inbound-rules"></a>

檢閱 中指定的傳入規則[Amazon VPC 安全群組](limit-access-security-groups.md#fsx-vpc-security-groups)，並確認與您檔案系統相關聯的安全群組具有對應的傳入規則。

## 運算執行個體的 VPC 安全群組缺少必要的傳出規則
<a name="compute-instance-lacks-inbound-rules"></a>

檢閱 中指定的傳出規則[Amazon VPC 安全群組](limit-access-security-groups.md#fsx-vpc-security-groups)，並確認與運算執行個體相關聯的安全群組具有對應的傳出規則。

## 運算執行個體的子網路不會使用任何與檔案系統相關聯的路由表
<a name="subnet-route-tables"></a>

FSx for ONTAP 會建立端點來存取 VPC 路由表中的檔案系統。建議您將檔案系統設定為使用與用戶端所在子網路相關聯的所有 VPC 路由表。根據預設，Amazon FSx 會使用 VPC 的主要路由表。您可以選擇性地為 Amazon FSx 指定一或多個路由表，以便在建立檔案系統時使用。

如果您可以 ping 檔案系統的叢集間端點，但無法 ping 檔案系統的管理端點 （如需[檔案系統資源](managing-file-systems.md#fsx-ontap-fs-resources)詳細資訊，請參閱 )，您的用戶端可能不會位於與您檔案系統路由表之一相關聯的子網路中。若要存取您的檔案系統，請將其中一個檔案系統的路由表與用戶端的子網路建立關聯。如需更新檔案系統 Amazon VPC 路由表的詳細資訊，請參閱 [更新檔案系統](updating-file-system.md)。

## Amazon FSx 無法更新使用 建立的多可用區域檔案系統的路由表 CloudFormation
<a name="vpc-route-tables-not-tagged"></a>

Amazon FSx 會使用標籤型身分驗證來管理多可用區域檔案系統的 VPC 路由表。這些路由表會以 標記`Key: AmazonFSx; Value: ManagedByAmazonFSx`。使用 建立或更新 FSx for ONTAP 多可用區檔案系統時， CloudFormation 建議您手動新增`Key: AmazonFSx; Value: ManagedByAmazonFSx`標籤。

如果您無法連線到多可用區檔案系統，請檢查與檔案系統相關聯的 VPC 路由表是否已標記 `Key: AmazonFSx; Value: ManagedByAmazonFSx`。如果不是，則 Amazon FSx 無法更新這些路由表，以在發生容錯移轉事件時，將管理和資料連接埠的浮動 IP 地址路由到作用中的檔案伺服器。如需更新檔案系統 Amazon VPC 路由表的詳細資訊，請參閱 [更新檔案系統](updating-file-system.md)。

## 無法從另一個 VPC 中的用戶端透過 iSCSI 存取檔案系統
<a name="file-system-iscsi"></a>

若要從另一個 VPC 中的用戶端透過網際網路小型電腦系統介面 (iSCSI) 通訊協定存取檔案系統，您可以設定 Amazon VPC 對等互連，或在 AWS Transit Gateway 與您的檔案系統相關聯的 VPC 與用戶端所在的 VPC 之間進行設定。如需詳細資訊，請參閱《*Amazon Virtual Private Cloud* 指南》中的[建立和接受 VPC 互連連線](https://docs.aws.amazon.com/vpc/latest/peering/create-vpc-peering-connection.html)。

## 擁有的帳戶已停止共用 VPC 子網路
<a name="unshared-vpc-subnet"></a>

如果您在已與您共用的 VPC 子網路中建立檔案系統，擁有的帳戶可能已停止共用 VPC 子網路。

如果擁有者帳戶已停止共用 VPC 子網路，您會在該檔案系統的 主控台中看到下列訊息：

```
The vpc ID vpc-012345abcde does not exist
```

您需要聯絡擁有的帳戶，讓他們可以與您重新共用子網路。

## 無法透過 NFS、SMB、ONTAP CLI 或 ONTAP REST API 從另一個 VPC 或內部部署中的用戶端存取檔案系統
<a name="unable-to-access-over-network"></a>

若要從另一個 VPC 或內部部署的用戶端透過網路檔案系統 (NFS)、伺服器訊息區塊 (SMB) 或 NetApp ONTAP CLI 和 REST API 存取檔案系統，您必須使用與檔案系統相關聯的 VPC 與用戶端所在的網路 AWS Transit Gateway 之間設定路由。如需詳細資訊，請參閱[存取 FSx for ONTAP 資料](supported-fsx-clients.md)。

# 您的儲存虛擬機器 (SVM) 處於 `MISCONFIGURED` 狀態
<a name="misconfigured-svm"></a>

儲存虛擬機器進入 `MISCONFIGURED` 狀態有許多潛在原因，每個都具有自己的解析度，如下所示。

## 您的 SVM 具有離線磁碟區
<a name="svm-offline-volume"></a>

您的檔案系統包含處於離線狀態的磁碟區。我們建議您持續讓磁碟區保持線上狀態。如果您在檔案系統下一個維護時段之前未上線此磁碟區，Amazon FSx 會在修補操作期間暫時上線此磁碟區。若要避免這種情況，請線上或刪除磁碟區。

若要讓離線磁碟區恢復上線，請使用 [https://docs.netapp.com/us-en/ontap-cli-9141/volume-online.html](https://docs.netapp.com/us-en/ontap-cli-9141/volume-online.html) ONTAP CLI 命令，如下列範例所示。如果只有一個 SVM (Vserver)，則不需要指定 `-vserver` 參數。

```
FsxID-abcdef123456::> volume online -volume volume_name -vserver svm_name
   
Volume 'vs1:vol1' is now online.
```

## 您的 SVM 具有具有 iSCSI LUN 或 NVMe/TCP 命名空間的離線磁碟區
<a name="svm-offline-volume-iscsi-nvme"></a>

您的檔案系統包含處於受限狀態的磁碟區。我們建議您持續讓磁碟區保持線上狀態。如果您在檔案系統下一個維護時段之前未上線此磁碟區，Amazon FSx 會在修補操作期間暫時上線此磁碟區。若要避免這種情況，請線上或刪除磁碟區。

若要讓離線磁碟區恢復上線，請使用 [https://docs.netapp.com/us-en/ontap-cli-9141/volume-online.html](https://docs.netapp.com/us-en/ontap-cli-9141/volume-online.html) ONTAP CLI 命令，如下列範例所示。如果只有一個 SVM (Vserver)，則不需要指定 `-vserver` 參數。

```
FsxID-abcdef123456::> volume online -volume volume_name -vserver svm_name
   
Volume 'vs1:vol1' is now online.
```

## 未正確設定 AWS Secrets Manager 秘密或 KMS 金鑰
<a name="svm-offline-secret-key-misconfigured"></a>

Amazon FSx 無法與您的 Microsoft Active Directory 網域控制站或控制站建立連線。這是因為您的 AWS Secrets Manager 秘密 AWS KMS key 或未正確設定。如需詳細資訊，請參閱[使用 存放 Active Directory 登入資料 AWS Secrets Manager](self-managed-AD-best-practices.md#bp-store-ad-creds-using-secret-manager)。

若要解決組態錯誤，請執行下列動作：
+ 驗證秘密 ARN 是否正確，並遵循正確的格式：`arn:aws:secretsmanager:region:account-id:secret:secret-name-6chars`。
+ 確認秘密包含具有非空白值的兩個必要欄位：
  + `CUSTOMER_MANAGED_ACTIVE_DIRECTORY_USERNAME` – 您的 AD 服務帳戶使用者名稱。
  + `CUSTOMER_MANAGED_ACTIVE_DIRECTORY_PASSWORD` – 您的 AD 服務帳戶密碼。
+ 確認秘密和金鑰具有以資源為基礎的政策，授予 Amazon FSx 服務主體擷取秘密值的`fsx.amazonaws.com`許可。

# 故障診斷 SSD 可減少操作問題
<a name="ssd-decrease-troubleshooting"></a>

本節說明與 SSD 容量減少操作相關的常見問題和解決方案。

**Topics**
+ [由於高 SSD 使用率，您的 SSD 減少操作已暫停](#ssd-decrease-paused-high-utilization)
+ [您的 SSD 減少操作因FlexClone關係而暫停](#ssd-decrease-flexclone-relationship)
+ [在 SSD 減少期間重新導向 volume(s) 的用戶端存取失敗](#ssd-decrease-redirect-client-access-failed)
+ [您的 SSD 減少操作耗時超過預期](#ssd-decrease-operation-duration)

## 由於高 SSD 使用率，您的 SSD 減少操作已暫停
<a name="ssd-decrease-paused-high-utilization"></a>

如果您的 SSD 儲存層在減少操作期間使用率超過 80%，Amazon FSx 會自動暫停操作。您可能會看到類似以下的管理動作訊息：

```
Your file system has insufficient free space in aggr_1. Please free up space or increase your file system's storage capacity.
```

一旦使用率低於 80%，操作將會繼續。若要解決此問題，您可以執行下列動作：
+ 從已移至新磁碟的磁碟區中刪除不必要的資料。
+ 透過修改磁碟區分層政策，將更多資料分層至容量集區。
+ [https://docs.aws.amazon.com/cli/latest/reference/fsx/update-file-system.html](https://docs.aws.amazon.com/cli/latest/reference/fsx/update-file-system.html) 使用新的目標值呼叫 來提交請求以增加 SSD 容量。

您應該更新檔案系統的 SSD 儲存容量，讓檔案系統產生的 SSD 容量在減少操作後不會超過 80% 的使用率。如需詳細資訊，請參閱[更新檔案系統 SSD 儲存體和 IOPS](storage-capacity-and-IOPS.md#increase-primary-storage)。

您可以透過檢查`STORAGE_OPTIMIZATION`管理動作中的 `Message` 欄位來識別哪些磁碟區已移至新磁碟。

[https://docs.aws.amazon.com/cli/latest/reference/fsx/describe-volumes.html](https://docs.aws.amazon.com/cli/latest/reference/fsx/describe-volumes.html) 如果彙總為 `aggr1`或 ，您也可以呼叫 `aggr1_old`。

## 您的 SSD 減少操作因FlexClone關係而暫停
<a name="ssd-decrease-flexclone-relationship"></a>

如果在啟動 SSD 減少操作後建立磁碟FlexClone區，Amazon FSx 會暫停操作，直到刪除複製為止。這是因為 會在移動磁碟區時ONTAP分割複製關係，這會導致新磁碟上的儲存空間重複。若要解決此問題，您可以識別和刪除在減少操作開始後建立的任何FlexClone磁碟區。

刪除所有FlexClone磁碟區後，減少操作會自動繼續。

## 在 SSD 減少期間重新導向 volume(s) 的用戶端存取失敗
<a name="ssd-decrease-redirect-client-access-failed"></a>

在 SSD 減少操作期間，Amazon FSx 需要將用戶端存取權從舊磁碟重新導向至每個磁碟的新磁碟。如果此程序失敗，您可能會看到類似以下的管理動作訊息：

```
Redirecting client access for volume(s) fsvol-123 has failed due to insufficient SSD IOPS, throughput capacity, or because the volume is full.
```

若要解決此問題，您可以執行下列動作：
+ 在 Amazon CloudWatch 中檢查檔案系統的資源使用率指標，以確保您的工作負載不會耗用超過下列資源的 50%：
  + `NetworkThroughputUtilization`
  + `FileServerDiskThroughputUtilization`
  + `FileServerDiskIopsUtilization`
  + `CPUUtilization`
  + `DiskIopsUtilization`
+ 如果磁碟區已滿，請增加磁碟區的儲存容量。
+ 在減少操作期間減少檔案系統上的工作負載。

解決這些問題後，Amazon FSx 會自動重試每小時重新導向一次用戶端存取。

## 您的 SSD 減少操作耗時超過預期
<a name="ssd-decrease-operation-duration"></a>

完成 SSD 減少操作所需的時間取決於幾個因素，包括存放在檔案系統上的資料量、持續的工作負載活動，以及可用的系統資源。如果您的操作耗時超過預期，您可以執行下列動作：
+ 確認您的檔案系統有足夠的可用資源 （低於 50% 的 CPU、磁碟輸送量和 SSD IOPS 使用率）。
+ 在操作期間減少大量寫入的工作負載，將資源爭用降到最低。

您可以在`STORAGE_OPTIMIZATION`管理動作中檢查 `ProgressPercent` 屬性，以追蹤操作的進度。

# 您無法將儲存虛擬機器 (SVM) 加入 Active Directory
<a name="cannot-join-svm-to-ad"></a>

如果您無法將 SVM 加入 Active Directory (AD)，請先檢閱 [將 SVMs加入 Microsoft Active Directory 的運作方式](self-managed-AD-join.md)。下列各節列出防止 SVM 加入 Active Directory 的常見問題，包括針對每個情況產生的錯誤訊息。

**Topics**
+ [SVM NetBIOS 名稱與主網域的 NetBIOS 名稱相同。](#join-svm-ad-fails-netbios-name-home-domain)
+ [SVM 已加入另一個 Active Directory](#join-svm-ad-fails-already-joined)
+ [Amazon FSx 無法連線至 Active Directory 網域控制站，因為 SVM 的 NetBIOS 名稱已在使用中](#join-svm-ad-fails-netbios-name-in-use)
+ [Amazon FSx 無法存取 中的 Active Directory 服務帳戶登入資料 AWS Secrets Manager](#join-svm-ad-service-account-creds-inaccessible)
+ [Amazon FSx 無法與您的 Active Directory 網域控制站通訊](#join-svm-ad-fails-no-port-traffic)
+ [由於連接埠需求或服務帳戶許可未滿足，Amazon FSx 無法連線至您的 Active Directory](#join-svm-ad-fails-ports-or-permissions)
+ [Amazon FSx 無法連線至 Active Directory 網域控制站，因為服務帳戶登入資料無效](#join-svm-ad-fails-invalid-service-credentials)
+ [由於服務帳戶登入資料不足，Amazon FSx 無法連線至您的 Active Directory 網域控制站](#join-svm-ad-fails-insufficient-service-credentials)
+ [Amazon FSx 無法與您的 Active Directory DNS 伺服器或網域控制站通訊](#join-svm-ad-fails-dns-servers)
+ [由於 Active Directory 網域名稱無效，Amazon FSx 無法與您的 Active Directory 通訊。](#join-svm-ad-fails-fqdn)
+ [服務帳戶無法存取 SVM Active Directory 組態中指定的管理員群組](#join-svm-ad-fails-no-admin-group)
+ [Amazon FSx 無法連線至 Active Directory 網域控制站，因為指定的組織單位不存在或無法存取](#bad-org-unit-service-credentials)

## SVM NetBIOS 名稱與主網域的 NetBIOS 名稱相同。
<a name="join-svm-ad-fails-netbios-name-home-domain"></a>

將 SVM 加入自我管理 Active Directory 失敗，並顯示下列錯誤訊息：

 Amazon FSx 無法與您的 Active Directory 建立連線。這是因為您指定的伺服器名稱是主網域的 NetBIOS 名稱。若要修正此問題，請為您的 SVM 選擇與主網域的 NetBIOS 名稱不同的 NetBIOS 名稱。然後重新嘗試將 SVM 加入 Active Directory。

若要解決此問題，請遵循中所述的程序[使用 AWS 管理主控台 AWS CLI 和 API 將 SVMs 加入 Active Directory](join-svm-to-ad.md)，重新嘗試將 SVM 加入 Active Directory。請確定您的 SVM 使用NetBIOS Active Directory 主網域的 NetBIOS 名稱不同的 NetBIOS 名稱。

## SVM 已加入另一個 Active Directory
<a name="join-svm-ad-fails-already-joined"></a>

將 SVM 加入 Active Directory 失敗，並顯示下列錯誤訊息：

 Amazon FSx 無法建立與 Active Directory 的連線。這是因為 SVM 已加入網域。若要將此 SVM 加入不同的網域，您可以使用 ONTAP CLI 或 REST API 從 Active Directory 取消加入此 SVM。然後重新嘗試將 SVM 加入不同的 Active Directory。

若要解決問題，請執行下列動作：

1. 使用 NetApp ONTAP CLI 從目前的 Active Directory 中取消加入 SVM。如需詳細資訊，請參閱[使用 NetApp ONTAP CLI 從 SVM 取消加入 Active Directory](manage-svm-ad-config-ontap-cli.md#using-ontap-cli-to-unjoin-ad)。

1. 請遵循中所述的程序[使用 AWS 管理主控台 AWS CLI 和 API 將 SVMs 加入 Active Directory](join-svm-to-ad.md)，重新嘗試將 SVM 加入新的 Active Directory。

## Amazon FSx 無法連線至 Active Directory 網域控制站，因為 SVM 的 NetBIOS 名稱已在使用中
<a name="join-svm-ad-fails-netbios-name-in-use"></a>

建立加入自我管理 Active Directory 的 SVM 失敗，並顯示下列錯誤訊息：

 Amazon FSx 無法與您的 Active Directory 建立連線。這是因為您指定的 NetBIOS （電腦） 名稱已在 Active Directory 中使用。若要修正此問題，請為不在 Active Directory 中使用的 SVM 選擇 NetBIOS 名稱。請指定 NetBIOS （電腦），然後重新嘗試將 SVM 加入 Active Directory。

若要解決此問題，請遵循中所述的程序[使用 AWS 管理主控台 AWS CLI 和 API 將 SVMs 加入 Active Directory](join-svm-to-ad.md)，重新嘗試將 SVM 加入 AD。確保您為 SVM 使用唯一且尚未在 Active Directory 中使用的 NetBIOS 名稱。

## Amazon FSx 無法存取 中的 Active Directory 服務帳戶登入資料 AWS Secrets Manager
<a name="join-svm-ad-service-account-creds-inaccessible"></a>

下列各節說明常見問題以及如何解決這些問題。

**將 SVM 加入自我管理 Active Directory 失敗，並顯示下列錯誤訊息：**

 `You can't provide both username/password and a domain join service account secret to connect to your Active Directory. Provide only one set of credentials.` 

**解決此問題**

1. 選擇您要提供存放在 Secrets Manager 秘密還是純文字中的登入資料。

1. 加入 Active Directory 時，僅提供其中一個參數，不提供兩者。

**將 SVM 加入自我管理 Active Directory 失敗，並顯示下列錯誤訊息：**

 `The domain join service account secret ARN format you entered isn't valid. Use the format: arn:partition:secretsmanager:region:account-id:secret:secret-name-6chars` 

**解決此問題**

1. 檢閱 [使用 存放 Active Directory 登入資料 AWS Secrets Manager](self-managed-AD-best-practices.md#bp-store-ad-creds-using-secret-manager)。

1. 確認您輸入的 ARN 格式正確。正確的格式範例為 `arn:aws:secretsmanager:us-east-1:123456789012:secret:MyDatabaseSecret-Ab3d5f`。

**將 SVM 加入自我管理 Active Directory 失敗，並顯示下列錯誤訊息：**

 `Amazon FSx can't access the domain join service account secret [ARN]. Add a resource permission to the secret that grants the FSx service principal (fsx.amazonaws.com) permission to access it.` 

**解決此問題**

1. 檢閱 [使用 存放 Active Directory 登入資料 AWS Secrets Manager](self-managed-AD-best-practices.md#bp-store-ad-creds-using-secret-manager)。

1. 確認您提供的 Secrets Manager 秘密具有允許 Amazon FSx 使用秘密的正確政策。

**將 SVM 加入自我管理 Active Directory 失敗，並顯示下列錯誤訊息：**

 `You don't have permission to access the domain join service account secret [ARN]. A resource permission needs to be added to the secret to grant you access.` 

**解決此問題**
+ Secrets Manager 秘密擁有者或管理員需要授予您的帳戶使用此秘密的存取權。如需詳細資訊，請參閱[身分型政策](https://docs.aws.amazon.com/secretsmanager/latest/userguide/auth-and-access_iam-policies.html)。

**將 SVM 加入自我管理 Active Directory 失敗，並顯示下列錯誤訊息：**

 `The domain join service account secret format or content isn't valid. Make sure the secret includes both CUSTOMER_MANAGED_ACTIVE_DIRECTORY_USERNAME and CUSTOMER_MANAGED_ACTIVE_DIRECTORY_PASSWORD fields with non-empty values.`

**解決此問題**

1. 檢閱 [使用 存放 Active Directory 登入資料 AWS Secrets Manager](self-managed-AD-best-practices.md#bp-store-ad-creds-using-secret-manager)。

1. 確認您提供的 Secrets Manager 秘密具有兩個必要欄位。

## Amazon FSx 無法與您的 Active Directory 網域控制站通訊
<a name="join-svm-ad-fails-no-port-traffic"></a>

將 SVM 加入自我管理 Active Directory 失敗，並顯示下列錯誤訊息：

 Amazon FSx 無法與您的 Active Directory 通訊。若要修正此問題，請確定 Amazon FSx 與您的網域控制站之間允許網路流量。然後重新嘗試將 SVM 加入 Active Directory。

要解決此問題，請依照下列步驟：

1. 檢閱中所述的需求[網路組態需求](self-manage-prereqs.md#ontap-ad-network-configs)，並進行必要的變更，以啟用 Amazon FSx 和 AD 之間的網路通訊。

1. 一旦 Amazon FSx 能夠與您的 AD 通訊，請遵循中所述的程序[使用 AWS 管理主控台 AWS CLI 和 API 將 SVMs 加入 Active Directory](join-svm-to-ad.md)，並再次嘗試將 SVM 加入您的 AD。

## 由於連接埠需求或服務帳戶許可未滿足，Amazon FSx 無法連線至您的 Active Directory
<a name="join-svm-ad-fails-ports-or-permissions"></a>

將 SVM 加入自我管理 Active Directory 失敗，並顯示下列錯誤訊息：

 Amazon FSx 無法與您的 Active Directory 建立連線。這是因為不符合 Active Directory 的連接埠需求，或是所提供的服務帳戶沒有使用指定組織單位將儲存虛擬機器加入網域的許可。若要修正此問題，請在解決連接埠和服務帳戶的任何許可問題後更新儲存虛擬機器的 Active Directory 組態，如 Amazon FSx 使用者指南中所述。

要解決此問題，請依照下列步驟：

1. 檢閱中所述的需求[網路組態需求](self-manage-prereqs.md#ontap-ad-network-configs)，並進行必要的變更以符合聯網需求，並確保在必要的連接埠上啟用通訊

1. 檢閱 中所述的服務帳戶需求[Active Directory 服務帳戶需求](self-manage-prereqs.md#ontap-ad-service-account-prereqs)。確保服務帳戶具有使用指定組織單位將 SVM 加入 Active Directory 網域所需的委派許可。

1. 變更連接埠許可或服務帳戶後，請遵循中所述的程序[使用 AWS 管理主控台 AWS CLI 和 API 將 SVMs 加入 Active Directory](join-svm-to-ad.md)，並再次嘗試將 SVM 加入 AD。

## Amazon FSx 無法連線至 Active Directory 網域控制站，因為服務帳戶登入資料無效
<a name="join-svm-ad-fails-invalid-service-credentials"></a>

將 SVM 加入自我管理 Active Directory 失敗，並顯示下列錯誤訊息：

 Amazon FSx 無法與您的 Active Directory 網域控制站建立連線，因為提供的服務帳戶登入資料無效。若要修正此問題，請使用有效的服務帳戶更新儲存虛擬機器的 Active Directory 組態。

若要解決此問題，請使用中所述的程序[使用 AWS 管理主控台 AWS CLI、 和 API 更新現有的 SVM Active Directory 組態](update-svm-ad-config.md)來更新 SVM 的服務帳戶登入資料。輸入服務帳戶使用者名稱時，請務必只包含使用者名稱 （例如 `ServiceAcct`)，且不要包含任何網域字首 （例如 `corp.com\ServiceAcct`) 或網域尾碼 （例如 )`ServiceAcct@corp.com`。輸入服務帳戶使用者名稱時，請勿使用辨別名稱 (DN) （例如 `CN=ServiceAcct,OU=example,DC=corp,DC=com`)。

## 由於服務帳戶登入資料不足，Amazon FSx 無法連線至您的 Active Directory 網域控制站
<a name="join-svm-ad-fails-insufficient-service-credentials"></a>

將 SVM 加入自我管理 Active Directory 失敗，並顯示下列錯誤訊息：

 Amazon FSx 無法與您的 Active Directory 網域控制站 (Active Directory) 建立連線。這是因為 Active Directory 的連接埠需求未滿足，或提供的服務帳戶沒有將儲存虛擬機器加入具有指定組織單位之網域的許可。

若要解決此問題，請確定您已將所需的許可委派給您提供的服務帳戶。服務帳戶必須能夠在您加入檔案系統的網域中建立和刪除 OU 中的電腦物件。服務帳戶至少也需要具有執行下列動作的許可：
+ 重設密碼
+ 限制帳戶讀取和寫入資料
+ 驗證寫入 DNS 主機名稱的能力
+ 已驗證能夠寫入服務主體名稱
+ 能夠建立和刪除電腦物件
+ 驗證讀取和寫入帳戶限制的能力

如需建立具有正確許可之服務帳戶的詳細資訊，請參閱 [Active Directory 服務帳戶需求](self-manage-prereqs.md#ontap-ad-service-account-prereqs)和 [將許可委派給您的 Amazon FSx 服務帳戶](self-managed-AD-best-practices.md#connect_delegate_privileges)。

## Amazon FSx 無法與您的 Active Directory DNS 伺服器或網域控制站通訊
<a name="join-svm-ad-fails-dns-servers"></a>

將 SVM 加入自我管理 Active Directory 失敗，並顯示下列錯誤訊息：

 Amazon FSx 無法與您的 Active Directory 通訊。這是因為 Amazon FSx 無法連線到您網域提供的 DNS 伺服器或網域控制站。若要修正此問題，請使用有效的 DNS 伺服器更新儲存虛擬機器的 Active Directory 組態，以及允許流量從儲存虛擬機器流向網域控制器的聯網組態。

若要解決此問題，請使用下列程序：

1. 如果只有 Active Directory 中的某些網域控制站可以連線，例如由於地理限制或防火牆，您可以新增偏好的網域控制站。使用此選項，Amazon FSx 會嘗試聯絡偏好的網域控制站。使用 [https://docs.netapp.com/us-en/ontap/smb-admin/add-preferred-domain-controllers-task.html](https://docs.netapp.com/us-en/ontap/smb-admin/add-preferred-domain-controllers-task.html) NetApp ONTAP CLI 命令新增偏好的網域控制站，如下所示：

   1. 若要存取 ONTAP CLI，請執行下列命令，在 Amazon FSx for NetApp ONTAP 檔案系統或 SVM 的管理連接埠上建立 SSH 工作階段。`management_endpoint_ip` 將 取代為檔案系統管理連接埠的 IP 地址。

      ```
      [~]$ ssh fsxadmin@management_endpoint_ip
      ```

      如需詳細資訊，請參閱[使用 CLI ONTAP 管理檔案系統](managing-resources-ontap-apps.md#fsxadmin-ontap-cli)。

   1. 輸入下列命令，其中：
      + `-vserver vserver_name` 指定儲存虛擬機器 (SVM) 名稱。
      + `-domain domain_name` 指定指定網域控制站所屬網域的完整 Active Directory 名稱 (FQDN)。
      + `-preferred-dc IP_address,…​` 會依偏好順序，指定偏好網域控制站的一或多個 IP 地址，做為逗號分隔清單。

      ```
      FsxId123456789::> vserver cifs domain preferred-dc add -vserver vserver_name -domain domain_name -preferred-dc IP_address, …​+
      ```

      下列命令會將網域控制站 172.17.102.25 和 172.17.102.24 新增至 SVM vs1 上 SMB 伺服器用來管理 cifs.lab.example.com 網域外部存取的偏好網域控制站清單。

      ```
      FsxId123456789::> vserver cifs domain preferred-dc add -vserver vs1 -domain cifs.lab.example.com -preferred-dc 172.17.102.25,172.17.102.24
      ```

1. 檢查您的網域控制器是否可以使用 DNS 解決。使用 [https://docs.netapp.com/us-en/ontap-cli-9121/vserver-services-access-check-dns-forward-lookup.html](https://docs.netapp.com/us-en/ontap-cli-9121/vserver-services-access-check-dns-forward-lookup.html) NetApp ONTAP CLI 命令，根據指定的 DNS 伺服器或 vserver 的 DNS 組態查詢，傳回主機名稱的 IP 地址。

   1. 若要存取 ONTAP CLI，請執行下列命令，在 Amazon FSx for NetApp ONTAP 檔案系統或 SVM 的管理連接埠上建立 SSH 工作階段。`management_endpoint_ip` 將 取代為檔案系統管理連接埠的 IP 地址。

      ```
      [~]$ ssh fsxadmin@management_endpoint_ip
      ```

      如需詳細資訊，請參閱[使用 CLI ONTAP 管理檔案系統](managing-resources-ontap-apps.md#fsxadmin-ontap-cli)。

   1. 使用下列命令進入 ONTAP CLI 進階模式。

      ```
      FsxId123456789::> set adv
      ```

   1. 輸入下列命令，其中：
      + `-vserver vserver_name` 指定儲存虛擬機器 (SVM) 名稱。
      + `-hostname host_name` 指定要在 DNS 伺服器上查詢的主機名稱。
      + `-node node_name​` 指定執行命令的節點名稱。
      + `-lookup-type` 指定要在 DNS 伺服器上查詢的 IP 地址類型，預設值為 `all`。

      ```
      FsxId123456789::> vserver services access-check dns forward-lookup \
      -vserver vserver_name -node node_name \
      -domains domain_name -name-servers dns_server_ip_address \
      -hostname host_name
      ```

1. 檢閱將 SVM 加入 AD 時[所需的資訊](self-managed-AD-join.md#ad-info-for-svm-join)。

1. 將 SVM 加入 AD 時，請檢閱[聯網需求](self-manage-prereqs.md#ontap-ad-network-configs)。

1. 使用中所述的程序[網路組態需求](self-manage-prereqs.md#ontap-ad-network-configs)，使用 Active Directory DNS 伺服器的正確 IP 地址來更新 SVM 的 Active Directory 組態。

## 由於 Active Directory 網域名稱無效，Amazon FSx 無法與您的 Active Directory 通訊。
<a name="join-svm-ad-fails-fqdn"></a>

將 SVM 加入自我管理 Active Directory 失敗，並顯示下列錯誤訊息：

 Amazon FSx 偵測到提供的 FQDN 無效。若要修正此問題，請使用符合組態需求的 FQDN 更新儲存虛擬機器的 Active Directory 組態。

若要解決此問題，請使用下列程序：

1. 檢閱 中描述的內部部署 Active Directory [將 SVM 加入 Active Directory 時所需的資訊](self-managed-AD-join.md#ad-info-for-svm-join) 網域名稱需求 確定您嘗試加入的 Active Directory 符合該需求。

1. 使用中所述的程序[使用 AWS 管理主控台 AWS CLI 和 API 將 SVMs 加入 Active Directory](join-svm-to-ad.md)，然後重新嘗試將 SVM 加入 Active Directory。請務必使用 Active Directory 網域 FQDN 的正確格式。

## 服務帳戶無法存取 SVM Active Directory 組態中指定的管理員群組
<a name="join-svm-ad-fails-no-admin-group"></a>

將 SVM 加入自我管理 Active Directory 失敗，並顯示下列錯誤訊息：

 Amazon FSx 無法套用您的 Active Directory 組態。這是因為您提供的管理員群組不存在或無法存取您提供的服務帳戶。若要修正此問題，請確定您的聯網組態允許從 SVM 到 Active Directory 網域控制站 (DNS) 和 DNS 伺服器的流量。然後，更新 SVM 的 Active Directory 組態，提供 Active Directory 的 DNS 伺服器，並在網域中指定管理員群組，供提供的服務帳戶存取。

要解決此問題，請依照下列步驟：

1. 檢閱[提供網域群組](self-managed-AD-join.md#ad-info-for-svm-join)以在 SVM 上執行管理動作的相關資訊。請確定您使用的是 Active Directory 網域管理員群組的正確名稱。

1. 使用中所述的程序[使用 AWS 管理主控台 AWS CLI 和 API 將 SVMs 加入 Active Directory](join-svm-to-ad.md)，然後重新嘗試將 SVM 加入 AD。

## Amazon FSx 無法連線至 Active Directory 網域控制站，因為指定的組織單位不存在或無法存取
<a name="bad-org-unit-service-credentials"></a>

將 SVM 加入自我管理 Active Directory 失敗，並顯示下列錯誤訊息：

 Amazon FSx 無法與您的 Active Directory 建立連線。這是因為您指定的組織單位不存在或無法存取提供的服務帳戶。若要修正此問題，請更新儲存虛擬機器的 Active Directory 組態，指定服務帳戶有權加入的組織單位。

要解決此問題，請依照下列步驟：

1. 檢閱將 [SVM 加入 AD 的先決條件](self-manage-prereqs.md)。

1. 檢閱將 SVM 加入 AD 時[所需的資訊](self-managed-AD-join.md#ad-info-for-svm-join)。

1. 使用[此程序](join-svm-to-ad.md)搭配正確的組織單位，重新嘗試將 SVM 加入 Active Directory。

# 您無法刪除儲存虛擬機器或磁碟區
<a name="cannot-delete-svm"></a>

每個 FSx for ONTAP 檔案系統可以包含一或多個儲存虛擬機器 (SVMs)，而每個 SVM 可以包含一或多個磁碟區。刪除資源時，您必須先確保已刪除其所有子項。例如，在刪除 SVM 之前，您必須先刪除 SVM 中的所有非根磁碟區。

**重要**  
 您只能使用 Amazon FSx 主控台、API 和 CLI 刪除儲存虛擬機器。如果磁碟區已啟用 Amazon FSx 備份，您只能使用 Amazon FSx 主控台、API 或 CLI 刪除磁碟區。

為了協助保護您的資料和組態，Amazon FSx 在某些情況下會防止刪除 SVMs 和磁碟區。如果您嘗試刪除 SVM 或磁碟區，但您的刪除請求未成功，Amazon FSx 會在 AWS 主控台 AWS Command Line Interface (AWS CLI) 和 API 中提供資源未刪除原因的相關資訊。解決刪除失敗的原因之後，您可以重試刪除請求。

**Topics**
+ [識別刪除失敗](#identify-failed-deletions)
+ [SVM 刪除：無法存取路由表](#deletion-route-tables)
+ [SVM 刪除：對等關係](#deletion-peer-relationship)
+ [SVM 或磁碟區刪除：SnapMirror](#deletion-snapmirror)
+ [SVM 刪除：啟用 Kerberos 的 LIF](#deletion-kerberos-lif)
+ [SVM 刪除：其他原因](#deletion-ad-connectivity)
+ [磁碟區刪除：FlexCache 關係](#deletion-flexcache)

## 識別刪除失敗
<a name="identify-failed-deletions"></a>

當您刪除 Amazon FSx SVM 或磁碟區時，通常會在資源從 Amazon FSx 主控台、CLI 和 API 消失之前，看到資源`Lifecycle`的狀態轉換為 `DELETING`長達幾分鐘。

如果您嘗試刪除資源，且其`Lifecycle`狀態從 轉換為 `DELETING` ，然後轉返 `CREATED`，則此行為表示資源未成功刪除。在此情況下，Amazon FSx 會在`CREATED`生命週期狀態旁的主控台中報告提醒圖示。選擇提醒圖示會顯示刪除失敗的原因。

下列各節提供 Amazon FSx 防止 SVM 和磁碟區刪除的最常見原因，並提供如何解決這些問題的step-by-step說明。

## SVM 刪除：無法存取路由表
<a name="deletion-route-tables"></a>

每個 FSx for ONTAP 檔案系統都會建立一或多個路由表項目，以提供自動容錯移轉和跨可用區域容錯。根據預設，這些路由表項目會在 VPC 的預設路由表中建立。您可以選擇指定一或多個可建立 FSx for ONTAP 介面的非預設路由表。Amazon FSx 會使用 標籤標記與檔案系統相關聯的每個路由表`AmazonFSx`，如果移除此標籤，可能會阻止 Amazon FSx 刪除資源。如果發生這種情況，您會看到下列 `LifecycleTransitionReason`：

`Amazon FSx is unable to complete the requested storage virtual machine operation because of an inability to access one or more of the route tables associated with your file system. Please contact 支援.`

您可以在 Amazon FSx 主控台中找到檔案系統的路由表，方法是導覽至**網路與安全**索引標籤下的檔案系統的摘要頁面。

選擇路由表連結會帶您前往路由表。接著，確認與您檔案系統相關聯的每個路由表都已標記此鍵/值對：

```
Key: AmazonFSx
Value: ManagedByAmazonFSx
```

如果此標籤不存在，請重新建立，然後再次嘗試刪除 SVM。

## SVM 刪除：對等關係
<a name="deletion-peer-relationship"></a>

如果您嘗試刪除屬於對等關係的 SVM 或磁碟區，您必須先刪除對等關係，才能刪除 SVM 或磁碟區。此要求可防止對等 SVMs 運作狀態不佳。如果您的 SVM 因為對等關係而無法刪除，您會看到以下 `LifecycleTransitionReason`：

Amazon FSx 無法刪除儲存虛擬機器，因為它是 SVM 對等關係或轉換對等關係的一部分。請刪除關係並重試。

您可以透過 ONTAP CLI 刪除 SVM 對等關係。若要存取 ONTAP CLI，請遵循中的步驟[使用 CLI ONTAP 管理檔案系統](managing-resources-ontap-apps.md#fsxadmin-ontap-cli)。使用 ONTAP CLI，採取下列步驟。

1. 使用以下命令檢查 SVM 對等關係。`svm_name` 將 取代為 SVM 的名稱。

   ```
   FsxId123456789::> vserver peer show -vserver svm_name
   ```

   如果此命令成功，您會看到類似以下的輸出：

   ```
               Peer        Peer                           Peering        Remote
   Vserver     Vserver     State        Peer Cluster      Applications   Vserver
   ----------- ----------- ------------ ----------------- -------------- ---------
   svm_name    test2       peered       FsxId02d81fef0d84734b6
                                                          snapmirror     fsxDest
   svm_name    test3       peered       FsxId02d81fef0d84734b6
                                                          snapmirror     fsxDest
   2 entries were displayed.
   ```

1. 使用以下命令刪除每個 SVM 對等關係。將 `svm_name`、 和 取代`remote_svm_name`為您的實際值。

   ```
   FsxId123456789abcdef::> vserver peer delete -vserver svm_name -peer-vserver remote_svm_name
   ```

   如果此命令成功，您會看到下列輸出：

   ```
   Info: 'vserver peer delete' command is successful.
   ```

## SVM 或磁碟區刪除：SnapMirror
<a name="deletion-snapmirror"></a>

如同在未先刪除對等關係的情況下，無法刪除具有對等關係的 SVM （請參閱[SVM 刪除：對等關係](#deletion-peer-relationship))，在未先刪除 SnapMirror 關係的情況下，無法刪除具有 SnapMirror 關係的 SVM。若要刪除 SnapMirror 關係，請使用 ONTAP CLI 在 SnapMirror 關係的目的地檔案系統上採取下列步驟。若要存取 ONTAP CLI，請遵循中的步驟[使用 CLI ONTAP 管理檔案系統](managing-resources-ontap-apps.md#fsxadmin-ontap-cli)。

**注意**  
Amazon FSx 備份使用 SnapMirror 來建立檔案系統磁碟區的point-in-time增量備份。您無法在 ONTAP CLI 中刪除備份的此 SnapMirror 關係。不過，當您透過 AWS CLI、API 或主控台刪除磁碟區時，此關係會自動刪除。

1. 使用下列命令，在目的地檔案系統上列出您的 SnapMirror 關係。`svm_name` 將 取代為 SVM 的名稱。

   ```
   FsxId123456789abcdef::> snapmirror show -vserver svm_name
   ```

   如果此命令成功，您會看到類似以下的輸出：

   ```
   Source            Destination    Mirror  Relationship   Total             Last
   Path        Type  Path           State   Status         Progress  Healthy Updated
   ----------- ---- ------------    ------- -------------- --------- ------- --------
   sourceSvm:sourceVol
               XDP  destSvm:destVol Snapmirrored 
                                             Idle           -         true    -
   ```

1. 在目的地檔案系統上執行下列命令，以刪除您的 SnapMirror 關係。

   ```
   FsxId123456789abcdef::> snapmirror release -destination-path destSvm:destVol -source-path sourceSvm:sourceVol -force true
   ```

## SVM 刪除：啟用 Kerberos 的 LIF
<a name="deletion-kerberos-lif"></a>

如果您嘗試刪除已啟用 Kerberos 的邏輯界面 (LIF) 的 SVM，您必須先在該 LIF 上停用 Kerberos，然後再刪除 SVM。

您可以透過 ONTAP CLI 在 LIF 上停用 Kerberos。若要存取 ONTAP CLI，請遵循中的步驟[使用 CLI ONTAP 管理檔案系統](managing-resources-ontap-apps.md#fsxadmin-ontap-cli)。

1. 使用下列命令，在 ONTAP CLI 中進入診斷模式。

   ```
   FsxId123456789abcdef::> set diag
   ```

   提示繼續時，輸入 **y**。

   ```
   Warning: These diagnostic commands are for use by NetApp personnel only.
   Do you want to continue? {y|n}: y
   ```

1. 檢查哪些界面已啟用 Kerberos。`svm_name` 將 取代為 SVM 的名稱。

   ```
   FsxId123456789abcdef::> kerberos interface show -vserver svm_name
   ```

   如果此命令成功，您會看到類似以下的輸出：

   ```
   (vserver nfs kerberos interface show)
                  Logical
   Vserver        Interface     Address         Kerberos SPN
   -------------- ------------- --------------- -------- -----------------------
   svm_name       nfs_smb_management_1
                                10.19.153.48    enabled  
   5 entries were displayed.
   ```

1. 使用以下命令停用 Kerberos LIF。`svm_name` 將 取代為 SVM 的名稱。您需要提供用來將此 SVM 加入 Active Directory 的 Active Directory 使用者名稱和密碼。

   ```
   FsxId123456789abcdef::> kerberos interface disable -vserver svm_name -lif nfs_smb_management_1
   ```

   如果此命令成功，您會看到下列輸出。提供您用來將此 SVM 加入 Active Directory 的 Active Directory 使用者名稱和密碼。提示繼續時，輸入 **y**。

   ```
   (vserver nfs kerberos interface disable)
   Username: admin
   Password: *************
   
   Warning: This command deletes the service principal name from the machine account on the KDC.
   Do you want to continue? {y|n}: y
        
   Disabled Kerberos on LIF "nfs_smb_management_1" in Vserver "svm_name".
   ```

1. 使用以下命令，確認 SVM 上的 Kerberos 已停用。`svm_name` 將 取代為 SVM 的名稱。

   ```
   FsxId123456789abcdef::> kerberos interface show -vserver svm_name
   ```

   如果此命令成功，您會看到類似以下的輸出：

   ```
   (vserver nfs kerberos interface show)
                  Logical
   Vserver        Interface     Address         Kerberos SPN
   -------------- ------------- --------------- -------- -----------------------
   svm_name       nfs_smb_management_1
                                10.19.153.48    disabled  
   5 entries were displayed.
   ```

1. 如果介面顯示為 `disabled`，請嘗試透過 CLI、API AWS 或主控台再次刪除 SVM。

   如果您無法使用上述命令刪除 LIF，您可以使用下列命令強制刪除 Kerberos LIF。`svm_name` 將 取代為 SVM 的名稱。
**重要**  
下列命令可以在 Active Directory 上綁定 SVM 的電腦物件。

   ```
   FsxId123456789abcdef::> kerberos interface disable -vserver svm_name -lif nfs_smb_management_1 -force true
   ```

   如果此命令成功，您會看到類似以下的輸出。當系統提示您繼續時，請輸入 **y**。

   ```
   (vserver nfs kerberos interface disable)
    
   Warning: Kerberos configuration for LIF "nfs_smb_management_1" in Vserver "svm_name" will be deleted.
   The corresponding account on the KDC will not be deleted. Do you want to continue? {y|n}: y
   ```

## SVM 刪除：其他原因
<a name="deletion-ad-connectivity"></a>

FSx for ONTAP SVMs 在加入 Active Directory 時，會在 Active Directory 中建立電腦物件。在某些情況下，您可能想要使用 ONTAP CLI 手動從 Active Directory 退出 SVM。若要存取 ONTAP CLI，請遵循中的步驟[使用 CLI ONTAP 管理檔案系統](managing-resources-ontap-apps.md#fsxadmin-ontap-cli)，使用`fsxadmin`登入資料在檔案系統層級登入 ONTAP CLI。使用 ONTAP CLI，採取下列步驟從 Active Directory 中退出 SVM。

**重要**  
此程序可以在 Active Directory 上綁定 SVM 的電腦物件。

1. 使用下列命令，在 ONTAP CLI 中輸入進階模式。

   ```
   FsxId123456789abcdef::> set adv
   ```

   執行此命令後，您會看到此輸出。輸入 **y**以繼續。

   ```
   Warning: These advanced commands are potentially dangerous; use them only when
         directed to do so by NetApp personnel.
         Do you want to continue? {y|n}: y
   ```

1. 使用以下命令刪除 Active Directory 的 DNS。`svm_name` 將 取代為 SVM 的名稱。

   ```
   FsxId123456789abcdef::> vserver services name-service dns dynamic-update record delete -vserver svm_name -lif nfs_smb_management_1
   ```
**注意**  
如果 DNS 記錄已刪除或 DNS 伺服器無法連線，則此命令會失敗。如果發生這種情況，請繼續下一個步驟。

1. 使用以下命令停用 DNS。`svm_name` 將 取代為 SVM 的名稱。

   ```
   FsxId123456789abcdef::> vserver services name-service dns dynamic-update modify -vserver svm_name -is-enabled false -use-secure false
   ```

   如果此命令成功，您會看到下列輸出：

   ```
   Warning: DNS updates for Vserver "svm_name" are now disabled.
        Any LIFs that are subsequently modified or deleted
        can result in a stale DNS entry on the DNS server,
        even when DNS updates are enabled again.
   ```

1. 從 Active Directory 取消加入裝置。`svm_name` 將 取代為 SVM 的名稱。

   ```
   FsxId123456789abcdef::> vserver cifs delete -vserver svm_name
   ```

   執行此命令後，您會看到下列輸出，其中 `CORP.EXAMPLE.COM` 會取代為您的網域名稱。出現提示時，輸入您的使用者名稱和密碼。當系統詢問您是否要刪除伺服器時，請輸入 **y**。

   ```
   In order to delete an Active Directory machine account for the CIFS server,
   you must supply the name and password of a Windows account with sufficient
   privileges to remove computers from the "CORP.EXAMPLE.COM" domain.
   Enter the user name: admin
   Enter the password:
   Warning: There are one or more shares associated with this CIFS server
        Do you really want to delete this CIFS server and all its shares? {y|n}: y
   Warning: Unable to delete the Active Directory computer account for this CIFS server.
        Do you want to continue with CIFS server deletion anyway? {y|n}: y
   ```

## 磁碟區刪除：FlexCache 關係
<a name="deletion-flexcache"></a>

除非您先刪除快取關係，否則無法刪除屬於 FlexCache 關係原始磁碟區的磁碟區。若要判斷哪些磁碟區具有 FlexCache 關係，您可以使用 ONTAP CLI。若要存取 ONTAP CLI，請遵循中的步驟[使用 CLI ONTAP 管理檔案系統](managing-resources-ontap-apps.md#fsxadmin-ontap-cli)。

1. 使用以下命令檢查 FlexCache 關係。

   ```
   FsxId123456789abcdef::> volume flexcache origin show-caches
   ```

1. 使用以下命令刪除任何快取關係。將 `dest_svm_name`、 和 取代`dest_vol_name`為您的實際值。

   ```
   FsxId123456789abcdef::> volume flexcache delete -vserver dest_svm_name -volume dest_vol_name
   ```

1. 刪除快取關係之後，請嘗試再次透過 AWS CLI、API 或主控台刪除 SVM。

# 您的磁碟區處於 `MISCONFIGURED` 狀態
<a name="misconfigured-volume"></a>

ONTAP 磁碟區進入 `MISCONFIGURED` 狀態有許多潛在原因，如下列主題所述。

## 您的磁碟區已滿 98%
<a name="volume-gt-98percent-full"></a>

您的檔案系統目前包含超過 98% 已滿的磁碟區。我們建議您持續不超過 95% 的磁碟區使用率。如果您在檔案系統下一個維護時段之前沒有釋放磁碟區中的空間，Amazon FSx 會停用磁碟區上的機會鎖定，中斷任何現有的「封鎖」。修補程序完成後，Amazon FSx 會重新啟用磁碟區的封鎖。若要避免這種情況，請將磁碟區的儲存容量使用率降低至低於 98%。達成此目標的一些方法包括：
+ 增加磁碟區的大小。
+ 刪除不需要的資料。
+ 刪除不需要的快照。

如需詳細資訊，請參閱 [更新儲存容量](manage-volume-capacity.md) 和 [刪除快照](manually-delete-snapshots.md)。

## 您的離線磁碟區具有 iSCSI LUN 或 NVMe/TCP 命名空間
<a name="offline-vol-iscsi-nvme"></a>

您的檔案系統目前託管處於離線狀態的磁碟區，且該磁碟區包含 iSCSI LUN 或 NVMe/TCP 命名空間，或兩者。我們建議您持續將磁碟區保持在線上。如果您在檔案系統下一個維護時段之前未上線此磁碟區，Amazon FSx 會在修補操作期間暫時上線此磁碟區。若要避免這種情況，請線上或刪除磁碟區。

若要讓離線磁碟區恢復上線，請使用 [https://docs.netapp.com/us-en/ontap-cli-9141/volume-online.html](https://docs.netapp.com/us-en/ontap-cli-9141/volume-online.html) ONTAP CLI 命令，如下列範例所示。如果只有一個 SVM (Vserver)，則不需要指定 `-vserver` 參數。

```
FsxID-abcdef123456::> volume online -volume volume_name -vserver svm_name
   
Volume 'vs1:vol1' is now online.
```

## 離線磁碟區是FlexCache原始伺服器
<a name="flexcache-origin-volume"></a>

您的檔案系統包含處於離線狀態的 FlexCache 原始磁碟區。我們建議您持續將磁碟區保持在線上。如果您在檔案系統下一個維護時段之前未上線此磁碟區，Amazon FSx 會在修補操作期間暫時上線此磁碟區。在此期間，資料可能會與快取磁碟區中的資料一起寫回 FlexCache 原始磁碟區。若要避免這種情況，請線上或刪除磁碟區。

若要讓離線磁碟區恢復上線，請使用 [https://docs.netapp.com/us-en/ontap-cli-9131/volume-online.html](https://docs.netapp.com/us-en/ontap-cli-9131/volume-online.html) ONTAP CLI 命令，如下列範例所示。如果只有一個 SVM (Vserver)，則不需要指定 `-vserver` 參數。

```
FsxID-abcdef123456::> volume online -volume volume_name -vserver svm_name
   
Volume 'vs1:vol1' is now online.
```

## 離線磁碟區是SnapMirror關係的一部分
<a name="offline-snapmirror-vol"></a>

您的檔案系統目前託管處於離線狀態的磁碟區，且該磁碟區是SnapMirror來源或目的地。我們建議您持續將磁碟區保持在線上。如果您在檔案系統下一個維護時段之前未上線此磁碟區，Amazon FSx 會在修補操作期間暫時上線此磁碟區，並暫停SnapMirror關係。在此期間，資料可能會與來源磁碟區中的資料一起寫入SnapMirror目的地SnapMirror磁碟區。若要避免這種情況，請線上或刪除磁碟區。

若要讓離線磁碟區恢復上線，請使用 [https://docs.netapp.com/us-en/ontap-cli-9131/volume-online.html](https://docs.netapp.com/us-en/ontap-cli-9131/volume-online.html) ONTAP CLI 命令，如下列範例所示。如果只有一個 SVM (Vserver)，則不需要指定 `-vserver` 參數。

```
FsxID-abcdef123456::> volume online -volume volume_name -vserver svm_name
   
Volume 'vs1:vol1' is now online.
```

## 您的受限磁碟區包含 iSCSI LUN 或 NVMe/TCP 命名空間
<a name="restricted-vol-iscsi-nvme"></a>

您的檔案系統目前託管處於受限狀態的磁碟區，且該磁碟區包含 iSCSI LUN、NVMe/TCP 命名空間或兩者。我們建議您持續將磁碟區保持在線上。如果您在檔案系統下一個維護時段之前未上線此磁碟區，Amazon FSx 會在修補操作期間暫時上線此磁碟區。若要避免這種情況，請線上或刪除磁碟區。

若要讓離線磁碟區恢復上線，請使用 [https://docs.netapp.com/us-en/ontap-cli-9141/volume-online.html](https://docs.netapp.com/us-en/ontap-cli-9141/volume-online.html) ONTAP CLI 命令，如下列範例所示。如果只有一個 SVM (Vserver)，則不需要指定 `-vserver` 參數。

```
FsxID-abcdef123456::> volume online -volume volume_name -vserver svm_name
   
Volume 'vs1:vol1' is now online.
```

## 您的限制磁碟區是 FlexCache 原始伺服器
<a name="restricted-flexcache-origin-volume"></a>

您的檔案系統包含處於受限狀態的 FlexCache 原始磁碟區。我們建議您持續將磁碟區保持在線上。如果您在檔案系統下一個維護時段之前未上線此磁碟區，Amazon FSx 會在修補操作期間暫時上線此磁碟區。在此期間，資料可能會與快取磁碟區中的資料一起寫回 FlexCache 原始磁碟區。若要避免這種情況，請線上或刪除磁碟區。

若要讓離線磁碟區恢復上線，請使用 [https://docs.netapp.com/us-en/ontap-cli-9131/volume-online.html](https://docs.netapp.com/us-en/ontap-cli-9131/volume-online.html) ONTAP CLI 命令，如下列範例所示。如果只有一個 SVM (Vserver)，則不需要指定 `-vserver` 參數。

```
FsxID-abcdef123456::> volume online -volume volume_name -vserver svm_name
   
Volume 'vs1:vol1' is now online.
```

## 您的受限磁碟區是SnapMirror關係的一部分
<a name="restricted-snapmirror-vol"></a>

您的檔案系統目前託管處於受限狀態的磁碟區，且該磁碟區是SnapMirror來源或目的地。我們建議您持續將磁碟區保持在線上。如果您在檔案系統下一個維護時段之前未上線此磁碟區，Amazon FSx 會在修補操作期間暫時上線此磁碟區，並暫停SnapMirror關係。在此期間，資料可能會與來源磁碟區中的資料一起寫入SnapMirror目的地SnapMirror磁碟區。若要避免這種情況，請線上或刪除磁碟區。

若要讓離線磁碟區恢復上線，請使用 [https://docs.netapp.com/us-en/ontap-cli-9131/volume-online.html](https://docs.netapp.com/us-en/ontap-cli-9131/volume-online.html) ONTAP CLI 命令，如下列範例所示。如果只有一個 SVM (Vserver)，則不需要指定 `-vserver` 參數。

```
FsxID-abcdef123456::> volume online -volume volume_name -vserver svm_name
   
Volume 'vs1:vol1' is now online.
```

# 您的磁碟區儲存容量不足
<a name="low-volume-capacity"></a>

如果您磁碟區的空間不足，您可以使用此處顯示的程序來診斷和解決這種情況。

**Topics**
+ [判斷磁碟區儲存容量的使用方式](#volume-storage-usage)
+ [增加磁碟區的儲存容量](#increase-volume-capacity)
+ [使用磁碟區自動調整大小](#volume-autosizing)
+ [檔案系統的主要儲存體已滿](#file-system-primary-capacity)
+ [刪除快照](#ts-deleting-snapshots)
+ [增加磁碟區的檔案容量上限](#max-file-capacity)

## 判斷磁碟區儲存容量的使用方式
<a name="volume-storage-usage"></a>

您可以使用 `volume show-space` NetApp ONTAP CLI 命令，查看磁碟區的儲存容量使用情形。此資訊可協助您決定如何回收或節省磁碟區儲存容量。如需詳細資訊，請參閱[監控磁碟區的儲存容量 （主控台）](monitor-volume-storage-console.md#volume-capacity-usage)。

## 增加磁碟區的儲存容量
<a name="increase-volume-capacity"></a>

您可以使用 Amazon FSx 主控台 AWS CLI和 Amazon FSx API 來增加磁碟區的儲存容量。如需使用增加的容量更新磁碟區的詳細資訊，請參閱 [更新磁碟區](updating-volumes.md)。

或者，您可以使用 [https://docs.netapp.com/ontap-9/topic/com.netapp.doc.dot-cm-cmpr-9101/volume__modify.html](https://docs.netapp.com/ontap-9/topic/com.netapp.doc.dot-cm-cmpr-9101/volume__modify.html) NetApp ONTAP CLI 命令來增加磁碟區的儲存容量。如需詳細資訊，請參閱[變更磁碟區的儲存容量 （主控台）](manage-volume-capacity.md#increase-volume-size)。

## 使用磁碟區自動調整大小
<a name="volume-autosizing"></a>

您可以使用磁碟區自動調整大小，讓磁碟區在達到使用的空間閾值時自動成長至指定的大小。您可以針對 FlexVol 磁碟區類型執行此操作，這是 FSx for ONTAP 的預設磁碟區類型，請使用 [https://docs.netapp.com/ontap-9/topic/com.netapp.doc.dot-cm-cmpr-9101/volume__autosize.html](https://docs.netapp.com/ontap-9/topic/com.netapp.doc.dot-cm-cmpr-9101/volume__autosize.html) NetApp ONTAP CLI 命令。如需詳細資訊，請參閱[啟用自動調整大小](enable-volume-autosizing.md)。

## 檔案系統的主要儲存體已滿
<a name="file-system-primary-capacity"></a>

如果您的 FSx for ONTAP 檔案系統的主要儲存已滿，即使磁碟區顯示有足夠的可用儲存容量，您也無法將任何其他資料新增至檔案系統中的磁碟區。您可以在 Amazon FSx 主控台的檔案系統詳細資訊頁面上的**監控與效能**索引標籤中，檢視可用的主要儲存容量。如需詳細資訊，請參閱[監控 SSD 儲存體使用率](monitor-fs-storage-console.md)

若要解決此問題，您可以增加檔案系統主要儲存層的大小。如需詳細資訊，請參閱[更新檔案系統 SSD 儲存體和 IOPS](storage-capacity-and-IOPS.md#increase-primary-storage)。

## 刪除快照
<a name="ts-deleting-snapshots"></a>

您的磁碟區預設會使用預設快照政策來啟用快照。快照會存放在磁碟區根目錄的 `.snapshot` 目錄中。您可以透過下列方式管理與快照相關的磁碟區儲存容量：
+ [手動刪除快照](manually-delete-snapshots.md) – 透過手動刪除快照來回收儲存容量。
+ [建立快照自動刪除政策](snapshot-autodelete-policy.md) – 建立比預設快照政策更積極刪除快照的政策。
+ [關閉自動快照](disable-snapshots.md) – 關閉自動快照以節省儲存容量。

當您刪除快照時，不會回收與您要刪除之快照大小相等的儲存量。您可以使用磁碟[區快照運算可回收的 -vserver CLI](https://docs.netapp.com/us-en/ontap-cli-9141/volume-snapshot-compute-reclaimable.html) ONTAP 命令，使用資料取代 *svm\$1name*、*vol\$1name* 和 *snapshot\$1name*，來查看刪除快照時可回收的儲存量。

```
fsid8970abc52::> volume snapshot compute-reclaimable -vserver svm_name -volume vol_name -snapshot snapshot_name 
A total of 667648 bytes can be reclaimed.
```

如需刪除快照和管理快照政策以節省儲存容量的詳細資訊，請參閱 [刪除快照](snapshots-ontap.md#delete-snapshots)。

## 增加磁碟區的檔案容量上限
<a name="max-file-capacity"></a>

FSx for ONTAP 磁碟區在用盡可用節點或檔案指標的數量時，可能會耗盡檔案容量。根據預設，磁碟區上每 32KiB 磁碟區大小的可用節點數量為 1。如需詳細資訊，請參閱[磁碟區檔案容量](volume-storage-capacity.md#managing-volume-file-capacity)。

磁碟區中的 Inode 數量會隨著磁碟區的儲存容量而增加，最高可達到 648 GiB 的閾值。根據預設，儲存容量為 648 GiB 或更多的磁碟區都有相同數量的 Inode，即 21，251，126。若要檢視磁碟區的最大檔案容量，請參閱 [監控磁碟區的檔案容量](view-volume-file-capacity.md)。

如果您建立大於 648 GiB 的磁碟區，並且想要擁有超過 21，251，126 個索引，則必須手動增加磁碟區上的檔案數量上限。如果您的磁碟區沒有足夠的儲存容量，您可以檢查其最大檔案容量。如果接近其檔案容量，您可以手動增加容量。如需詳細資訊，請參閱[若要增加磁碟區上的檔案數量上限 (ONTAP CLI)](increase-volume-max-files.md#increase-max-files)。

# 由於磁碟區容量不足，您的備份失敗
<a name="backups-failing"></a>

磁碟區的自動每日備份失敗，並顯示下列訊息：

```
Amazon FSx could not create a backup of your volume because the backup snapshot was deleted.
```

由於磁碟區上的可用儲存容量不足，因此自動每日備份會失敗。若要緩解此條件，您需要釋放磁碟區的儲存容量。您可以根據您的情況，使用下列一或多個選項來完成此操作：
+ [增加磁碟區的儲存容量](manage-volume-capacity.md#increase-volume-size)
+ [增加磁碟區的快照保留](snapshots-ontap.md#snapshot-reserve)
+ [停用快照自動刪除](snapshot-autodelete-policy.md)
+ [請勿使用 ONTAP CLI 刪除備份快照](common-snapshot.md) 

# 復原已刪除的 FSx for ONTAP 磁碟區
<a name="recovering-deleted-volumes"></a>

刪除 FSx for ONTAP 磁碟區時，會放置在ONTAP's復原佇列中。雖然您可以使用 ONTAPCLI 直接從此佇列復原磁碟區，但復原的磁碟區不會重新出現在 AWS 主控台或 Amazon FSx API 中，而且先前套用至磁碟區的任何 AWS 標籤都將永久遺失。若要在保留 AWS 整合和標籤型安全政策時正確復原 FSx for ONTAP 磁碟區，您可以將[備份還原至新的磁碟區，](to-restore-backups.md)或使用 [將磁碟區的資料複寫至新的磁碟區SnapMirror](scheduled-replication.md)。如需ONTAP's復原佇列的詳細資訊，請參閱 [NetApp's 文件。](https://docs.netapp.com/us-en/ontap-cli/volume-recovery-queue-show.html)

# 故障診斷網路問題
<a name="network-issues"></a>

如果您遇到網路問題，您可以使用此處顯示的程序來診斷問題。

## 您想要擷取封包追蹤
<a name="capture-packet-trace"></a>

封包追蹤是驗證封包透過層到達其目的地的路徑的程序。您可以使用下列 CLI NetApp ONTAP 命令控制封包追蹤程序：
+ **network tcpdump start** – 開始封包追蹤
+ **network tcpdump show** – 顯示目前正在執行的封包追蹤
+ **network tcpdump stop** – 停止執行中的封包追蹤

這些命令可供在檔案系統上具有 `fsxadmin`角色的使用者使用。

**從檔案系統擷取封包追蹤**

1. 若要在檔案系統的 NetApp ONTAP CLI 中 SSH，請遵循 *Amazon FSx for NetApp ONTAP 使用者指南*中 [使用 NetApp ONTAP CLI](managing-resources-ontap-apps.md#netapp-ontap-cli) 一節所述的步驟。

   ```
   ssh fsxadmin@file-system-management-endpoint-ip-address
   ```

1. 使用下列命令，在 ONTAP CLI 中輸入診斷權限層級。

   ```
   ::> set diag
   ```

   當系統提示您繼續時，請輸入 `y`。

   ```
   Warning: These diagnostic commands are for use by NetApp personnel only.
   Do you want to continue? {y|n}: y
   ```

1. 識別檔案系統上您要儲存封包追蹤的位置。磁碟區必須上線，且必須掛載在具有有效連接路徑的命名空間中。使用下列命令來檢查符合這些條件的磁碟區：

   ```
   ::*> volume show -junction-path !- -fields junction-path
   vserver volume    junction-path 
   ------- --------- ------------- 
   fsx     test_vol1 /test_vol1    
   fsx     test_vol2 /test_vol2
   fsx     test_vol2 /test_vol3
   ```

1. 使用最低必要引數啟動追蹤。取代以下項目：
   + 將 *node\$1name* 取代為節點的名稱 （例如，`FsxId01234567890abcdef-01`)。
   + 將 *svm\$1name* 取代為儲存虛擬機器的名稱 （例如 `fsx`)。
   + 將 *junction\$1path\$1name* 取代為磁碟區的名稱 （例如 `test-vol1`)。

   ```
   ::*> debug network tcpdump start -node node_name -ipspace Default -pass-through "-i e0e -w /clus/svm_name/junction_path_name"
   Info: Started network trace on interface "e0e"
   Warning: Snapshots should be disabled on the tcpdump destination volume while packet traces are occurring. Use the
   "volume modify -snapshot-policy none -vserver fsx -volume test_vol1" command to disable Snapshots on the
   tcpdump destination volume.
   ```
**重要**  
封包追蹤只能在`e0e`介面和 `Default` IP 空間中擷取。在 FSx for ONTAP 中，所有網路流量都會使用 `e0e` 介面。

   使用封包追蹤時，請記住下列事項：
   + 啟動封包追蹤時，您必須包含要存放追蹤檔案的路徑，格式為：/clus/*svm\$1name*/*junction-path-name*
   + 或者，提供封包追蹤的檔案名稱。如果未指定 filter\$1name，則會以 *node-name*\$1*port-name*\$1*yyyymmdd\$1hhmmss*.trc 格式自動產生 
   + 如果指定滾動追蹤，則 filter\$1name 的尾碼會加上數字，指出輪換序列中的位置。
   + ONTAP CLI 也接受下列選用引**-pass-through**數：

     ```
     -B, --buffer-size=<KiB>
     -c <number_of_packets>
     -C <file_size-mB>
     -F <filter_expression_filename>
     -G <rotate_seconds>
     --time-stamp-precision {micro|nano}
     -Q, --direction {in|out|inout}
     -s, --snapshot-length=<bytes>
     -U, --packet-buffered
     -W <rotate_file_count>
     <filter-expression>
     ```
   + 如需篩選條件表達式的資訊，請參閱 [pcap-filter(7) man 頁面](https://www.tcpdump.org/manpages/pcap-filter.7.html)。

1. 檢視進行中追蹤：

   ```
   ::*> debug network tcpdump show
   Node                     IPspace  Port     Filename
   -----------------------  -------- -------- --------
   FsxId123456789abcdef-01  Default  e0e      /clus/fsx/test_vol1/FsxId123456789abcdef-01_e0e_20230605_181451.trc
   ```

1. 停止追蹤：

   ```
   ::*> debug network tcpdump stop -node FsxId123456789abcdef-01 -ipspace Default -port e0e
   Info: Stopped network trace on interface "e0e"
   ```

1. 返回管理員權限層級：

   ```
   ::*> set -priv admin
   ::>
   ```

1. 存取封包追蹤。

   您的封包追蹤會存放在您使用 **debug network tcpdump start**命令指定的磁碟區中，並且可以透過 NFS 匯出或與該磁碟區對應的 SMB 共用存取。

如需擷取封包追蹤的詳細資訊，請參閱《[》中的如何使用 ONTAP 9.10\$1 中的偵錯網路傾印。](https://kb.netapp.com/onprem/ontap/hardware/How_to_use_debug_tcpdump_in_ONTAP_9.10) NetApp Knowledge Base

# 對 I/O 錯誤和 NFS 鎖定回收失敗進行故障診斷
<a name="nfs-failover-issues"></a>

本節說明 FSx for ONTAP 檔案系統容錯移轉事件期間與 I/O 錯誤和 NFS 鎖定回收失敗相關的問題，以及每個系統的解決方案。

## 您在容錯移轉事件期間遇到 I/O 錯誤
<a name="io-errors-during-failover"></a>

在 FSx for ONTAP 單一可用區檔案系統的容錯移轉期間，NFS 用戶端可能會遇到暫時性 I/O 錯誤或延長暫停。對於 NFSv4\$1 用戶端，您可能會看到核心日誌訊息，例如：

```
NFS: __nfs4_reclaim_open_state: Lock reclaim failed!
```

這些訊息表示用戶端無法在容錯移轉時段成功回收 NFS 鎖定。

**減少容錯移轉事件期間的 I/O 錯誤**  
在 Linux 上，您可以在用戶端上設定網路設定，將容錯移轉偵測時間從 55-60 秒縮短為 15-20 秒。

**重要**  
一律先在非生產環境中測試這些組態。這些設定會增加位址解析通訊協定 (ARP) 流量，用於將 IP 地址映射至本機網路上的實體 (MAC) 地址，可能不適用於網路受限的環境。

**設定 NFS 用戶端的最佳化網路設定**

1. 在每個 NFS 用戶端上建立 sysctl 組態檔案。下列範例使用 `default`將設定套用至所有網路介面。如果您的執行個體有多個網路介面，您可以將 取代`default`為用來連線至 FSx for ONTAP Single-AZ 檔案系統的特定介面名稱 （例如 `eth0`或 `ens5`)：

   ```
   $ sudo tee /etc/sysctl.d/99-fsx-failover.conf > /dev/null << 'EOF'
   # NFS client optimizations for faster failover detection
   # Replace 'default' with your interface name (e.g., eth0, ens5) to target a specific interface
   net.ipv4.neigh.default.base_reachable_time_ms=5000
   net.ipv4.neigh.default.delay_first_probe_time=1
   net.ipv4.neigh.default.ucast_solicit=0
   net.ipv4.tcp_syn_retries=3
   EOF
   ```

1. 立即套用設定：

   ```
   $ sudo sysctl -p /etc/sysctl.d/99-fsx-failover.conf
   ```

1. 驗證組態是否作用中。如果您使用 `default`，您可以使用下列命令來驗證 。如果您指定了特定的界面，請將 取代`default`為您的界面名稱 （例如， `eth0`或 `ens5`)：

   ```
   $ sysctl net.ipv4.neigh.default.base_reachable_time_ms
   $ sysctl net.ipv4.neigh.default.delay_first_probe_time
   $ sysctl net.ipv4.neigh.default.ucast_solicit
   $ sysctl net.ipv4.tcp_syn_retries
   ```

確保這些設定一致地套用到相同可用區域內連線至 FSx for ONTAP 檔案系統的所有 NFS 用戶端。使用這些網路最佳化時，請記住下列事項：
+ **base\$1reachable\$1time\$1ms=5000** – 將 ARP 快取項目有效性從 30 秒縮短為 5 秒，讓用戶端在容錯移轉事件期間更快速地偵測 IP 擁有權變更。
+ **delay\$1first\$1probe\$1time=1** – 將探查過時網路項目之前的延遲從 5 秒縮短為 1 秒。
+ **ucast\$1solicit=0** – 略過單播鄰近探查並立即發出廣播 ARP 請求，加速重新探索作用中檔案伺服器。
+ **tcp\$1syn\$1retries=3** – 將 TCP 連線重試持續時間從 127 秒縮短為 15 秒。

網路設定就緒後，您應該監控您的環境以驗證變更。您可以修改檔案系統的輸送量容量來測試容錯移轉事件。如需詳細資訊，請參閱[在檔案系統上測試容錯移轉](high-availability-AZ.md#testing-failover)。

**套用變更後監控您的環境**  

+ **監控系統日誌是否有 NFS 錯誤**，以檢視 NFS 相關的核心日誌訊息。

  ```
  $ sudo journalctl -f | grep -i nfs
  ```

  確認訊息的出現次數較少，例如 `Lock reclaim failed`。
+ **監控應用程式日誌**，以確認容錯移轉事件期間較少的 I/O 逾時、連線錯誤和重試相關失敗。
+ **驗證網路影響**，以確保增加的 ARP 流量不會對您環境中的網路效能造成負面影響。

## NFSv4 環境的替代方法
<a name="nfsv4-alternative-approaches"></a>

在無法修改用戶端組態的 NFSv4 環境中，請考慮下列替代方案：
+ **延長 NFSv4 租用逾時。**與您的儲存管理員合作，以增加 NFSv4 租用逾時。延長這些逾時可讓用戶端在容錯移轉事件期間有更多時間回收鎖定。如需詳細資訊，請參閱 NetApp ONTAP 文件中的[指定 NFSv4 鎖定寬限期](https://docs.netapp.com/us-en/ontap/nfs-admin/specify-nfsv4-locking-grace-period-task.html)。