

# チュートリアル:Amazon DynamoDB と Apache Hive の使用
<a name="EMRforDynamoDB.Tutorial"></a>

このチュートリアルでは、まず、Amazon EMR クラスターを起動した上で、DynamoDB テーブルに格納されているデータの処理に Apache Hive を使用していきます。

*Hive*は、Hadoop 用のデータウェアハウスアプリケーションで、複数のソースからのデータを処理および分析することを可能にします。Hive では、SQL に似た言語である *HiveQL* を使用しながら、ローカルの Amazon EMR クラスター、または外部のデータソース (Amazon DynamoDB など) に保存されたデータを操作できます。

詳細については、「[Hive Tutorial](https://cwiki.apache.org/confluence/display/Hive/Tutorial)」を参照してください。

**Topics**
+ [開始する前に](#EMRforDynamoDB.Tutorial.BeforeYouBegin)
+ [ステップ 1: Amazon EC2 キーペアを作成する](EMRforDynamoDB.Tutorial.EC2KeyPair.md)
+ [ステップ 2: Amazon EMR クラスターを起動します](EMRforDynamoDB.Tutorial.LaunchEMRCluster.md)
+ [ステップ 3: リーダーノードに接続します](EMRforDynamoDB.Tutorial.ConnectToLeaderNode.md)
+ [ステップ 4: HDFS にデータをロードします](EMRforDynamoDB.Tutorial.LoadDataIntoHDFS.md)
+ [ステップ 5: データを DynamoDB にコピーします](EMRforDynamoDB.Tutorial.CopyDataToDDB.md)
+ [ステップ 6: DynamoDB テーブル内のデータをクエリを行います](EMRforDynamoDB.Tutorial.QueryDataInDynamoDB.md)
+ [ステップ 7: (オプション) クリーンアップする](EMRforDynamoDB.Tutorial.CleanUp.md)

## 開始する前に
<a name="EMRforDynamoDB.Tutorial.BeforeYouBegin"></a>

このチュートリアルでは、以下が必要になります。
+ AWS アカウント。アカウントをお持ちでない場合は、「[へのサインアップAWS](SettingUp.DynamoWebService.md#SettingUp.DynamoWebService.SignUpForAWS)」を参照してください。
+ SSH クライアント (セキュアシェル)。SSH クライアントを使用して、Amazon EMR クラスターのリーダーノードに接続し、対話型コマンドを実行します。ほとんどの Linux、Unix、および Mac OS X の実装では、SSH クライアントをデフォルトで利用できます。Windows ユーザーの場合は、SSH がサポートする [PuTTY](http://www.chiark.greenend.org.uk/~sgtatham/putty/) クライアントをダウンロードしてインストールできます。

**次のステップ**  
[ステップ 1: Amazon EC2 キーペアを作成する](EMRforDynamoDB.Tutorial.EC2KeyPair.md)