

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# Amazon EMR にデータを取得するさまざまな方法
<a name="emr-plan-get-data-in"></a>

Amazon EMR では、複数の方法でデータをクラスターに配置することができます。最も一般的な方法は、Simple Storage Service (Amazon S3) にデータをアップロードし、Amazon EMR の組み込み機能を使用してクラスターにデータをロードするというものです。また、Hadoop の DistributedCache 機能を使用して、分散ファイルシステムからローカルファイルシステムにファイルを転送することもできます。Amazon EMR によって提供される Hive (Hive バージョン 0.7.1.1 以降) の実装には、DynamoDB と Amazon EMR クラスターの間でデータのインポートおよびエクスポートを行う場合に使用できる機能が含まれています。処理する社内データが大量にある場合、 Direct Connect サービスが役に立つ場合があります。

**Topics**
+ [データを Simple Storage Service (Amazon S3) にアップロードする](emr-plan-upload-s3.md)
+ [を使用してデータをアップロードする AWS DataSync](emr-plan-upload-datasync.md)
+ [Amazon EMR での分散キャッシュによるファイルのインポート](emr-plan-input-distributed-cache.md)
+ [Amazon EMR を使用した圧縮ファイルの検出と処理](HowtoProcessGzippedFiles.md)
+ [Amazon EMR を使用して DynamoDB データを Hive にインポートする](emr-plan-input-dynamodb.md)
+ [Amazon EMR AWS Direct Connect から を使用してデータに接続する](emr-plan-input-directconnect.md)
+ [を使用して Amazon EMR の大量のデータをアップロードする AWS Snowball Edge](emr-plan-input-snowball.md)