

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 收集遷移的需求
<a name="gathering-migration-requirements"></a>

大型資料遷移的第一步需要在整個組織中收集各種資訊。

此資訊可協助您建立遷移[程序](https://docs.aws.amazon.com/prescriptive-guidance/latest/strategy-large-scale-migrations/process.html)，其中對於大型遷移，可以包含多個傳輸和程序，以將操作 （在[批次](https://docs.aws.amazon.com/prescriptive-guidance/latest/application-portfolio-assessment-guide/wave-planning.html)中完成） 從來源縮減至目的地儲存體。

## 了解您要遷移的原因
<a name="define-migration-goals-why"></a>

在開始遷移至 之前 AWS，您需要清楚地了解遷移資料的原因。這有助於解決常見的遷移挑戰，例如滿足截止日期、管理資源以及跨團隊協調。

如果您需要協助判斷遷移的動機，請回答下列問題：
+ 您要釋放內部部署儲存空間嗎？
+ 您是否符合硬體支援合約截止日期？
+ 這是用於資料中心退出嗎？
+ 您的遷移時間表為何？
+ 您是否從其他雲端儲存傳輸資料？
+ 您要遷移部分或完整的資料集？
+ 這是用於資料封存嗎？
+ 應用程式或使用者是否需要定期存取此資料？

## 找出物流
<a name="define-migration-goals-logistics"></a>

解決儲存環境、遷移和組織的一些基本物流：

1. 了解您目前的資料儲存基礎設施。

1. 確認是否需要 [DataSync 代理程式](do-i-need-datasync-agent.md)。例如，如果您要從內部部署儲存體傳輸，則需要 代理程式。

1. 如果您需要客服人員，請確定您了解[客服人員的需求](agent-requirements.md)：
   + 代理程式可以做為虛擬機器 (VM) 在 VMware ESXi、Linux 核心型虛擬機器 (KVM) 和 Microsoft Hyper-V Hypervisor 上執行。您也可以將代理程式部署為其中的 Amazon EC2 執行個體 AWS。
   + 大型遷移通常需要大量記憶體。請確定您的代理程式有足夠的 RAM。

1. 從您的領導層、聯網、儲存和 IT 部門識別需要參與遷移的關鍵利益相關者。其中包括：
   + 尋找專用於專案及其結果的[單一執行緒領導者](https://docs.aws.amazon.com/prescriptive-guidance/latest/strategy-large-scale-migrations/people.html)。
   + 決定您要遷移的資料所有權和分類的負責人。
   + 識別誰管理您的來源，以及誰最終將管理您要遷移的 AWS 儲存服務。
   + 了解資料進入後，誰將為您的資料建立和管理任何其他程序 AWS。

1. 建立跨部門通訊管道。

1. 建立應變的復原計畫。

1. 記錄完整的遷移程序，包括波浪、驗證和切換程序。將此做為整個遷移的 Runbook。您將在規劃和實作遷移時更新此程序。

## 檢閱您要遷移的資料
<a name="review-migration-data"></a>

與您的儲存和應用程式團隊合作，分析您要遷移的資料特性。此資訊可協助您判斷可使用 DataSync 執行的遷移策略。

**Contents**
+ [判斷資料用量模式](#review-migration-data-usage)
+ [識別資料結構和配置](#review-migration-data-structure)
+ [記錄共用和資料夾](#review-migration-data-document-shares)
+ [分析檔案大小](#review-migration-data-file-sizes)

### 判斷資料用量模式
<a name="review-migration-data-usage"></a>
+ 對於經常修改的主動使用資料，請規劃多個增量傳輸波，以避免中斷業務營運。
+ 對於可能被視為封存的唯讀資料，您可能不需要規劃波浪。
+ 如果您有混用的資料用量模式，請規劃分別遷移這些不同資料集的波紋。例如，您可能有一個用於封存資料的波，其餘波則專用於遷移作用中的資料。

### 識別資料結構和配置
<a name="review-migration-data-structure"></a>
+ 判斷資料是依時段 （年、月、日） 或其他模式進行組織。
+ 使用此組織結構來規劃遷移波紋。例如，您可以在一波期間遷移一年的封存資料。

### 記錄共用和資料夾
<a name="review-migration-data-document-shares"></a>
+ 建立共享和資料夾的庫存 （包括每個 的檔案或物件計數）。
+ 識別具有作用中資料集的共用和資料夾。這些可能需要在遷移期間進行增量傳輸。
+ 檢閱 [DataSync 配額](datasync-limits.md)。這可協助您規劃如何在設定 DataSync 時分割資料集。

### 分析檔案大小
<a name="review-migration-data-file-sizes"></a>
+ 與較小檔案 (KB) 相比，使用較大檔案 (MB 或 GB) 傳輸的資料輸送量預期更高。
+ 如果您使用的是許多較小的檔案， 預期您的儲存系統會有更多的中繼資料操作，並降低資料輸送量。DataSync 會在比較和驗證來源和目的地位置時執行這些操作。

## 識別儲存需求
<a name="determine-storage-requirements"></a>

若要選擇相容的 AWS 儲存服務來遷移資料，您需要評估來源儲存系統的特性和效能。

此資訊也可以協助您[排程傳輸](task-scheduling.md)，將遷移期間對業務營運的影響降至最低。

**Contents**
+ [判斷來源儲存支援](#determine-storage-requirements-protocols)
+ [檢閱中繼資料保留需求](#determine-storage-requirements-metadata)
+ [從來源儲存體收集效能指標](#determine-storage-requirements-performance)
+ [選擇目的地 AWS 儲存服務](#determine-storage-requirements-destination)

### 判斷來源儲存支援
<a name="determine-storage-requirements-protocols"></a>

DataSync 可以使用各種儲存系統，允許透過 NFS、SMB、HDFS 和 S3 相容物件儲存用戶端進行存取。

如果您要從其他雲端儲存體遷移，請確認 DataSync 可以與該提供者搭配使用。如需支援的來源位置清單，請參閱 [我可以將資料傳輸到哪裡 AWS DataSync？](working-with-locations.md)

### 檢閱中繼資料保留需求
<a name="determine-storage-requirements-metadata"></a>

DataSync 可以在傳輸期間保留您的檔案或物件中繼資料。中繼資料的保留方式取決於您的傳輸位置，以及這些位置是否使用類似的中繼資料類型。

在某些情況下，DataSync 需要額外的許可來保留檔案中繼資料，例如 NTFS 選擇性存取清單 DACLs)。

如需詳細資訊，請參閱[了解 DataSync 如何處理檔案和物件中繼資料](metadata-copied.md)。

### 從來源儲存體收集效能指標
<a name="determine-storage-requirements-performance"></a>

在來源儲存體的平均和尖峰工作負載期間測量基準 IOPS 和磁碟輸送量。傳輸資料會將 I/O 額外負荷新增至來源和目的地儲存系統。

將此效能資料與儲存系統的規格進行比較，以判斷可用的效能資源。

### 選擇目的地 AWS 儲存服務
<a name="determine-storage-requirements-destination"></a>

此時，您可能知道 AWS 儲存服務對資料有何意義。如果沒有，資料使用模式和儲存效能是決定時需要考慮的幾個領域。例如，如果您有封存資料和作用中資料的 Amazon FSx 或 Amazon EFS，您可能會考慮 Amazon S3。

為了協助您為資料決定正確的物件或檔案型儲存，請參閱[選擇 AWS 儲存服務](https://docs.aws.amazon.com/decision-guides/latest/storage-on-aws-how-to-choose/choosing-aws-storage-service.html)。

## 判斷網路需求
<a name="datasync-migration-network-requirements"></a>

若要使用 DataSync 遷移資料，您必須在來源儲存體、代理程式和 之間建立網路連線 AWS。您也需要規劃足夠的網路頻寬和基礎設施。

與您的網路工程師和儲存管理員合作，收集下列網路需求。

**Contents**
+ [評估可用的網路頻寬](#datasync-migration-network-bandwidth)
+ [考慮將網路連線至 的選項 AWS](#datasync-migration-network-connection-options)
+ [選擇客服人員通訊的服務端點](#datasync-migration-network-service-endpoint)
+ [規劃足夠的網路基礎設施](#datasync-migration-network-interfaces)

### 評估可用的網路頻寬
<a name="datasync-migration-network-bandwidth"></a>

您的可用網路頻寬會考慮傳輸速度和整體遷移時間。如果您要從內部部署儲存系統傳輸，請執行下列動作：
+ 與您的網路團隊合作，判斷平均和尖峰頻寬使用率。
+ 識別您何時可以傳輸資料並避免中斷日常操作的時段。這將通知遷移波紋和切換何時發生。

您可以控制 DataSync 使用的頻寬。如需詳細資訊，請參閱[設定 AWS DataSync 任務的頻寬限制](configure-bandwidth.md)。

由於來自其他雲端儲存體的傳輸通常透過公有網際網路進行，因此這些傳輸的頻寬限制和考量通常較少。

### 考慮將網路連線至 的選項 AWS
<a name="datasync-migration-network-connection-options"></a>

請考慮下列選項，為您的 DataSync 傳輸建立網路連線：
+ **Direct Connect** - 檢閱搭配 DataSync 使用 Direct Connect 的[架構和路由範例](direct-connect-architecture.md)。您可以使用 [Amazon CloudWatch](https://docs.aws.amazon.com/directconnect/latest/UserGuide/monitoring-cloudwatch.html) 監控 Direct Connect 活動。
+ **VPN** - 每個通道[AWS Site-to-Site VPN](https://docs.aws.amazon.com/vpn/latest/s2svpn/VPC_VPN.html)提供高達 1.25 Gbps 的輸送量。
+ **公有網際網路** - 請聯絡您的網際網路服務供應商以取得網路用量資料。

### 選擇客服人員通訊的服務端點
<a name="datasync-migration-network-service-endpoint"></a>

DataSync 代理程式使用[服務端點](choose-service-endpoint.md)與 DataSync 服務通訊。您使用的端點類型取決於您為網路連線到 的方式 AWS。

### 規劃足夠的網路基礎設施
<a name="datasync-migration-network-interfaces"></a>

對於您建立的每個傳輸任務，DataSync 會自動產生和管理資料傳輸的網路基礎設施。此基礎設施稱為*網路界面*或*彈性網路界面*，這些界面是 Amazon Virtual Private Cloud (VPC) 中代表虛擬網路卡的邏輯聯網元件。如需詳細資訊，請參閱 [https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/using-eni.html](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/using-eni.html)。

每個網路界面都會在您的目的地 VPC 子網路中使用單一 IP 地址。為了確保您有足夠的網路基礎設施進行遷移，請執行下列動作：
+ 請注意DataSync 將為 DataSync 目的地位置建立[的網路介面](required-network-interfaces.md)數量。
+ 請確定子網路有足夠的 IP 地址可供 DataSync 任務使用。例如，使用 代理程式的任務需要四個 IP 地址。如果您為遷移建立四個任務，這表示您需要子網路中 16 個可用的 IP 地址。