

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 將資料取得至 Amazon EMR 的不同方式
<a name="emr-plan-get-data-in"></a>

Amazon EMR 提供多種將資料載入到叢集的方式。最常見的方式是將資料上傳至 Amazon S3，並使用 Amazon EMR 內建功能，以將資料載入到您的叢集。您也可以使用 Hadoop DistributedCache 功能，將檔案從分散式檔案系統傳輸到本機檔案系統。Amazon EMR 提供的 Hive 實作 (Hive 版本 0.7.1.1 和更高版本) 包含可用於匯入和匯出 DynamoDB 和 Amazon EMR 叢集間資料的功能。如果您有要處理的大量現場部署資料，您會發現 Direct Connect 服務很有用。

**Topics**
+ [將資料上傳至 Amazon S3](emr-plan-upload-s3.md)
+ [使用 上傳資料 AWS DataSync](emr-plan-upload-datasync.md)
+ [使用 Amazon EMR 匯入具有分散式快取的檔案](emr-plan-input-distributed-cache.md)
+ [使用 Amazon EMR 偵測和處理壓縮檔案](HowtoProcessGzippedFiles.md)
+ [使用 Amazon EMR 將 DynamoDB 資料匯入 Hive](emr-plan-input-dynamodb.md)
+ [從 Amazon EMR AWS Direct Connect 使用 連線至資料](emr-plan-input-directconnect.md)
+ [使用 上傳 Amazon EMR 的大量資料 AWS Snowball Edge](emr-plan-input-snowball.md)