

# 자습서: Amazon DynamoDB 및 Apache Hive 작업
<a name="EMRforDynamoDB.Tutorial"></a>

이 자습서에서는 Amazon EMR 클러스터를 시작한 다음 Apache Hive를 사용하여 DynamoDB 테이블에 저장된 데이터를 처리합니다.

*Hive*는 여러 소스의 데이터를 처리 및 분석할 수 있게 해주는, Hadoop용 데이터 웨어하우스 애플리케이션입니다. Hive는 SQL과 유사한 언어인 *HiveQL*을 제공합니다. 이 언어를 사용하면 Amazon EMR 클러스터에 로컬로 저장된 데이터 또는 외부 데이터 원본(예: Amazon DynamoDB)에 저장된 데이터로 작업할 수 있습니다.

자세한 내용은 [Hive Tutorial](https://cwiki.apache.org/confluence/display/Hive/Tutorial)을 참조하세요.

**Topics**
+ [시작하기 전 준비 사항](#EMRforDynamoDB.Tutorial.BeforeYouBegin)
+ [1단계: Amazon EC2 키 페어 생성](EMRforDynamoDB.Tutorial.EC2KeyPair.md)
+ [2단계: Amazon EMR 클러스터 시작](EMRforDynamoDB.Tutorial.LaunchEMRCluster.md)
+ [3단계: 리더 노드에 연결](EMRforDynamoDB.Tutorial.ConnectToLeaderNode.md)
+ [4단계: HDFS로 데이터 로드](EMRforDynamoDB.Tutorial.LoadDataIntoHDFS.md)
+ [5단계: DynamoDB로 데이터 복사](EMRforDynamoDB.Tutorial.CopyDataToDDB.md)
+ [6단계: DynamoDB 테이블의 데이터 쿼리](EMRforDynamoDB.Tutorial.QueryDataInDynamoDB.md)
+ [7단계: (선택 사항) 정리](EMRforDynamoDB.Tutorial.CleanUp.md)

## 시작하기 전 준비 사항
<a name="EMRforDynamoDB.Tutorial.BeforeYouBegin"></a>

이 자습서를 이해하려면 다음이 필요합니다.
+ AWS 계정. 계정이 없을 경우 [에 가입AWS](SettingUp.DynamoWebService.md#SettingUp.DynamoWebService.SignUpForAWS) 단원을 참조하세요.
+ SSH 클라이언트(Secure Shell). SSH 클라이언트를 사용하여 Amazon EMR 클러스터의 리더 노드에 연결하고 대화형 명령을 실행합니다. SSH 클라이언트는 대부분의 Linux, Unix 및 Mac OS X 설치 시 기본적으로 사용됩니다. Windows 사용자는 SSH가 지원되는 [PuTTY](http://www.chiark.greenend.org.uk/~sgtatham/putty/) 클라이언트를 다운로드하여 설치하면 됩니다.

**다음 단계**  
[1단계: Amazon EC2 키 페어 생성](EMRforDynamoDB.Tutorial.EC2KeyPair.md)