

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 在 Amazon FSx 中啟用重複資料刪除
<a name="storage-fsx-deduplication"></a>

## 概觀
<a name="storage-fsx-deduplication-overview"></a>

重複資料刪除是一項功能，可讓您更有效率地存放資料，並減少容量需求。它涉及在資料中尋找和移除重複項目，而不會影響其真實性或完整性。重複資料刪除使用子檔案可變大小區塊和壓縮，為一般檔案伺服器提供 2：1 的最佳化比率，為虛擬化資料提供高達 20：1 的最佳化比率。重複資料刪除比 NTFS 壓縮更有效。重複資料刪除架構中固有的彈性是硬體故障期間的彈性，具有資料和中繼資料的完整檢查總和驗證，包括中繼資料的備援和最常存取的資料區塊。

FSx for Windows File Server 完全支援重複資料刪除。使用它可平均節省 50–60% 的一般用途檔案共享。在共用中，使用者文件的節省範圍為 30–50%，軟體開發資料集節省範圍為 70–80%。請務必了解，透過重複資料刪除可以實現的儲存節省取決於資料集的性質，包括檔案之間存在多少重複。如果儲存的資料本質上為動態，則重複資料刪除不是不錯的選擇。

## 成本影響
<a name="storage-fsx-deduplication-cost"></a>

為了因應企業中的資料儲存成長，管理員合併伺服器，並制定容量擴展和資料最佳化關鍵目標。重複資料刪除的預設設定可以立即節省成本，或者管理員可以微調設定以查看額外的收益。例如，您可以將重複資料刪除設定為僅在特定檔案類型上執行，也可以建立自訂任務排程。

在高階，重複資料刪除有三種類型的任務：最佳化、垃圾回收和清理。請注意，除非您在最佳化後執行垃圾回收任務，否則不會釋放空間。您可以排程任務，也可以手動執行任務。當您手動啟動任務時，也可以使用排程重複資料刪除任務時可用的所有設定 （排程特定的設定除外）。

即使僅從重複資料刪除節省 25% 的有效成本，FSx for Windows File Server 仍大幅節省成本。這些預計節省的成本是以 中的[預估](https://calculator.aws/#/estimate?id=b25b166595553e055c594e89e3c13610df570bc9)值為基礎 AWS 定價計算工具。

## 成本最佳化建議
<a name="storage-fsx-deduplication-rec"></a>

FSx for Windows File Server 檔案系統上的重複資料刪除預設為未啟用。若要在 [ PowerShell 上使用遠端管理](https://docs.aws.amazon.com/fsx/latest/WindowsGuide/administering-file-systems.html#remote-pwrshell)來啟用重複資料刪除，您必須執行 `Enable-FSxDedup`命令，然後使用 `Set-FSxDedupConfiguration`命令來設定組態。如需詳細資訊，請參閱 FSx for Windows File Server 文件中的[管理檔案系統](https://docs.aws.amazon.com/fsx/latest/WindowsGuide/administering-file-systems.html)。

若要啟用重複資料刪除，請執行下列命令：

```
PS C:\Users\Admin> Invoke-Command -ComputerName amznfsxzzzzzzzz.corp.example.com -ConfigurationName FSxRemoteAdmin -ScriptBlock {Enable-FsxDedup }
```

若要驗證重複資料刪除組態，請執行下列命令：

```
Invoke-Command -ComputerName amznfsxzzzzzzzz.corp.example.com -ConfigurationName FSxRemoteAdmin -ScriptBlock {
Set-FSxDedupSchedule -Name "CustomOptimization" -Type Optimization -Days Mon,Tues,Wed,Sat -Start 09:00 -DurationHours 7
}
```

透過執行 PowerShell `Measure-DedupFileMetadata` cmdlet，您可以判斷如果您刪除一組資料夾、單一資料夾或單一檔案，然後執行垃圾回收任務，可以回收多少潛在的磁碟空間。具體而言， `DedupDistinctSize`值會告訴您，如果您刪除這些檔案，會得到多少空間。檔案通常具有跨其他資料夾共用的區塊，因此重複資料刪除引擎會計算哪些區塊是唯一的，並在垃圾收集任務之後刪除。

預設[的重複資料刪除任務排程](https://docs.aws.amazon.com/fsx/latest/WindowsGuide/managing-storage-configuration.html#using-data-dedup)設計為適用於建議的工作負載，並且盡可能地非侵入性 （不包括針對備份用量類型啟用的優先順序最佳化任務）。如果工作負載有大量的資源需求，建議您排程只在閒置時間執行任務，或減少或增加允許重複資料刪除任務使用的系統資源量。

根據預設，重複資料刪除會使用 25% 的可用記憶體。不過，這可以透過使用 來增加`-memory switch`。對於最佳化任務，我們建議您將範圍設定為 15 到 50。對於排程任務，您可以使用更高的記憶體耗用量。例如，對於垃圾收集和清理任務 （您通常排程在非上班時間執行），您可以設定更高的記憶體耗用量 （例如 50)。

如需有關重複資料刪除設定的其他資訊，請參閱 FSx for Windows File Server 文件中的[使用重複資料刪除降低儲存成本](https://docs.aws.amazon.com/fsx/latest/WindowsGuide/managing-storage-configuration.html#using-data-dedup)。

## 其他資源
<a name="storage-fsx-deduplication-resources"></a>
+ [了解重複資料刪除 ](https://learn.microsoft.com/en-gb/windows-server/storage/data-deduplication/understand)(Microsoft 文件）
+ [使用重複資料刪除來降低儲存成本](https://docs.aws.amazon.com/fsx/latest/WindowsGuide/managing-storage-configuration.html#using-data-dedup) (FSx for Windows File Server 文件）