

더 이상 Amazon Machine Learning 서비스를 업데이트하거나 새 사용자를 받지 않습니다. 이 설명서는 기존 사용자에 제공되지만 더 이상 업데이트되지 않습니다. 자세한 내용은 [머신 러닝이란?](https://docs.aws.amazon.com/machine-learning/latest/dg/what-is-amazon-machine-learning.html) 단원을 참조하세요.

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 자습서: Amazon ML을 사용하여 마케팅 제안에 대한 응답 예측
<a name="tutorial"></a>

Amazon Machine Learning(Amazon ML)을 사용하면 예측 모델을 빌드 및 학습시키고 확장 가능한 클라우드 솔루션에서 애플리케이션을 호스팅할 수 있습니다. 이 자습서에서는 Amazon ML 콘솔을 사용하여 데이터 소스를 생성하고, 기계 학습(ML) 모델을 빌드하고, 모델을 사용하여 애플리케이션에서 사용할 수 있는 예측을 생성하는 방법을 보여줍니다.

샘플 연습에서는 타겟 마케팅 캠페인의 잠재 고객을 식별하는 방법을 보여주지만 동일한 원칙을 적용하여 다양한 ML 모델을 만들고 사용할 수 있습니다. 샘플 실습을 완료하려면 [캘리포니아 대학교 어바인 캠퍼스(UCI)의 기계 학습 리포지토리](http://archive.ics.uci.edu/ml/datasets.php)에서 공개적으로 사용할 수 있는 은행 및 마케팅 데이터 세트를 사용해야 합니다. 이러한 데이터 세트에는 고객에 대한 일반 정보와 고객이 이전 마케팅 담당자에 대해 어떻게 반응했는지에 대한 정보가 포함되어 있습니다. 이 데이터를 사용하여 새 상품인 예금 증서(CD)라고도 하는 은행 정기 예금에 가입할 가능성이 가장 높은 고객을 식별할 수 있습니다.

**주의**  
이 자습서는 AWS 프리 티어에 포함되어 있지 않습니다. ML 요금에 대한 자세한 내용은 [https://aws.amazon.com/machine-learning/pricing/](https://aws.amazon.com/machine-learning/pricing/) 단원을 참조하세요.

## 사전 조건
<a name="prereqs"></a>

 개별 교습을 수행하려면 AWS 계정이 있어야 합니다. AWS 계정이 없는 경우 [머신 러닝 설정](https://docs.aws.amazon.com/machine-learning/latest/dg/setting-up-amazon-machine-learning.html) 단원을 참조하세요.

## 단계
<a name="steps"></a>
+ [1단계: 데이터 준비](step-1-download-edit-and-upload-data.md)
+ [2단계: 학습 데이터 세트 생성](step-2-create-a-datasource.md)
+ [3단계: ML 모델 생성](step-3-create-an-ml-model.md)
+ [4단계: ML 모델의 예측 성능 검토 및 점수 임계값 설정](step-4-review-model-and-set-cutoff.md)
+ [5단계: ML 모델을 사용하여 예측 생성](step-5-create-predictions.md)
+ [6단계: 정리](step-6-clean-up.md)

# 1단계: 데이터 준비
<a name="step-1-download-edit-and-upload-data"></a>

기계 학습에서는 일반적으로 학습 프로세스를 시작하기 전에 데이터를 확보하고 형식이 올바른지 확인합니다. 본 자습서의 목적에 맞게 [UCI 기계 학습 리포지토리](http://archive.ics.uci.edu/ml/)에서 샘플 데이터 세트를 확보했고 ML 지침에 맞게 형식을 지정했고 다운로드할 수 있게 만들었습니다. 이 주제의 절차에 따라 Amazon Simple Storage Service(Amazon S3) 저장 위치에서 데이터 세트를 다운로드하고 자체 S3 버킷으로 업로드합니다.

 ML 형식 요구 사항은 [Amazon ML의 데이터 형식에 대한 이해](understanding-the-data-format-for-amazon-ml.md) 단원을 참조하세요.

**데이터 세트를 다운로드하려면**

1. [banking.zip](samples/banking.zip)을 클릭하여 은행 정기 예금과 유사한 상품을 구입한 고객의 과거 데이터가 포함된 파일을 다운로드합니다. 폴더의 압축을 풀고 banking.csv 파일을 컴퓨터에 저장합니다.

1. [banking-batch.zip](samples/banking-batch.zip)을 클릭하여 잠재 고객이 귀하의 제안에 응답하는지 여부를 예측하는 데 사용할 파일을 다운로드합니다. 폴더의 압축을 풀고 banking-batch.csv 파일을 컴퓨터에 저장합니다.

1.  `banking.csv`를 엽니다. 데이터의 행 및 열을 확인할 수 있습니다. *헤더 열*에는 각 열의 속성 이름이 들어 있습니다. *속성*은 각 고객의 특정한 특성을 설명하는 이름이 지정된 고유한 속성입니다. 예를 들어 nr\$1employed는 고객의 취업 상태를 나타냅니다. 각 행은 단일 고객에 대한 관측치 모음을 나타냅니다.  
![\[Spreadsheet preview showing header row with columns for euribor3m, nr_employed, and y.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/image1.png)

   ML 모델에게서 “이 고객이 새 상품에 가입할 것입니까?”라는 질문의 대답을 얻고 싶습니다. `banking.csv` 데이터 세트에서 이 질문에 대한 대답은 1(yes인 경우) 또는 0(no인 경우)의 값을 포함하는 속성 **y**입니다. ML이 예측 방법을 학습하길 원하는 속성을 *대상 속성*이라고 합니다.
**참고**  
속성 **y**는 이진 속성입니다. 이 속성은 두 개의 값 중 하나만 포함할 수 있으며 이 경우 0 또는 1입니다. 원본 UCI 데이터 세트에서 **y** 속성은 Yes 또는 No입니다. 원본 데이터 세트를 편집해 드렸습니다. 이제 yes를 의미하는 속성 **y**의 모든 값은 1이며, no를 의미하는 모든 값은 0입니다. 자체 데이터를 사용하는 경우 이진 속성에 다른 값을 사용할 수 있습니다. 유효한 값에 대한 자세한 내용은 [AttributeType 필드 사용](creating-a-data-schema-for-amazon-ml.md#assigning-data-types) 단원을 참조하세요.

 다음 예제에서는 속성 **y**의 값을 이진 속성 0 및 1로 변경하기 전후의 데이터를 보여줍니다.

![\[Data table showing 'banking.csv' with columns for 'euribor3m', 'nr_employed', and binary 'y' values.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/image2.png)


![\[Partial view of a CSV file showing banking data with columns for euribor3m, nr_employed, and y.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/image3.png)


 `banking-batch.csv` 파일에는 **y** 속성이 없습니다. ML 모델을 생성한 후에는 이 모델을 사용하여 해당 파일의 각 레코드에 대해 **y**를 예측합니다.

 그 다음 `banking.csv ` 및 `banking-batch.csv` 파일을 S3에 업로드합니다.

**Amazon S3 위치에 파일을 업로드하려면**

1. 에 로그인AWS Management Console하고 [https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/) Amazon S3 콘솔을 엽니다.

1.  **모든 버킷** 목록에서 버킷을 생성하거나 파일을 업로드할 위치를 선택합니다.

1. 탐색 모음에서 **업로드**를 선택합니다.

1. **파일 추가**를 선택합니다.

1.  대화 상자에서 바탕 화면으로 이동하여 `banking.csv` 및 `banking-batch.csv`를 선택한 다음 **열기**를 선택합니다.

 이제 [학습 데이터 소스를 생성](step-2-create-a-datasource.md)할 준비가 되었습니다.

# 2단계: 학습 데이터 세트 생성
<a name="step-2-create-a-datasource"></a>

Simple Storage Service(S3) 위치에 `banking.csv` 데이터 세트를 업로드한 후 데이터 세트를 사용하여 학습 데이터 소스를 생성합니다. 데이터 소스는 입력 데이터와 입력 데이터에 대한 중요한 메타데이터의 위치를 포함하고 있는 Amazon Machine Learning(Amazon ML) 객체입니다. Amazon ML은 데이터 소스를 ML 모델 학습 및 평가 등의 작업에 사용합니다.

데이터 소스를 생성하려면 다음을 제공합니다.
+  데이터의 Amazon S3 위치 및 데이터에 대한 액세스 권한 
+  데이터에 있는 속성의 이름과 각 속성의 유형(숫자, 텍스트, 범주형 또는 이진)을 포함하고 있는 스키마 
+  Amazon ML에서 예측 방법을 학습하도록 하려는 답변(대상 속성)이 들어 있는 속성의 이름 

**참고**  
데이터 소스는 데이터를 실제로 저장하지 않고 참조만 합니다. Amazon S3에 저장된 파일을 이동하거나 변경하지 마십시오. 파일을 이동하거나 변경할 경우 Amazon ML이 해당 파일에 액세스하여 ML 모델을 만들거나 평가를 생성하거나 예측을 생성할 수 없습니다.

**학습 데이터 소스를 만들려면**

1. [https://console.aws.amazon.com/machinelearning/](https://console.aws.amazon.com/machinelearning/)에서 머신 러닝 콘솔을 엽니다.

1.  **Get started**를 선택합니다.
**참고**  
이 자습서에서는 Amazon ML을 처음 사용하는 것으로 가정합니다. 이전에 ML을 사용해 본 적이 있다면 ML 대시보드의 **새로 생성...** 드롭다운 목록을 사용하여 새 데이터 소스를 생성해도 됩니다.

1. **머신 러닝 시작하기** 페이지에서 **시작**을 선택합니다.  
![\[Amazon Machine Learning interface with "Launch" button highlighted for standard setup.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/get-started-launch.png)

1. **데이터 입력** 페이지에서 **데이터 위치**에 대해 **S3**가 선택되었는지 확인합니다.  
![\[Radio button selection between S3 and Redshift options, with S3 selected.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/image5.png)

1. **S3 위치**에 대해 1단계: 데이터 준비의 `banking.csv ` 파일 전체 위치를 입력합니다. 예: *your-bucket***/banking.csv**. Amazon ML이 사용자를 대신하여 버킷 이름 앞에 s3://를 추가합니다.

1. **데이터소스 이름**에 대해 **Banking Data 1**를 입력합니다.  
![\[S3 location input field and Datasource name field for entering banking data information.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/image6.png)

1. **Verify**를 선택합니다.

1. **S3 권한** 대화 상자에서 **예**를 선택합니다.  
![\[Dialog box asking to grant Amazon Machine Learning read permission for S3 location.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/image7.png)

1.  Amazon ML이 S3 위치의 데이터 파일에 액세스하고 읽을 수 있는 경우 다음과 비슷한 페이지가 표시됩니다. 속성을 검토한 다음 **계속**을 선택합니다.  
![\[Validation success message with datasource details including name, location, and file information.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/image8.png)

그 다음, 스키마를 설정합니다. *스키마*는 ML이 속성 이름 및 할당된 데이터 형식, 특수 속성의 이름 등을 포함하여 ML 모델의 입력 데이터를 해석하는 데 필요한 정보입니다. Amazon ML에 스키마를 제공하는 방법은 다음 두 가지가 있습니다.
+  Amazon S3 데이터를 업로드할 때 별도의 스키마 파일을 제공합니다.
+  Amazon ML이 속성 유형을 유추하고 스키마를 생성하도록 허용합니다.

이 자습서에서는 Amazon ML에 스키마를 유추하도록 요청할 것입니다.

별도의 스키마 파일을 생성하는 방법에 대한 자세한 내용은 [Amazon ML용 데이터 스키마 생성](creating-a-data-schema-for-amazon-ml.md) 단원을 참조하세요.

**Amazon ML이 스키마를 유추할 수 있도록 하려면**

1. **스키마** 페이지에는 ML이 유추한 스키마가 표시됩니다. Amazon ML에서 속성에 대해 유추한 데이터 유형을 검토합니다. Amazon ML이 데이터를 올바르게 수집하고 속성에 대한 올바른 특성 처리를 가능하게 하려면 속성에 올바른 데이터 유형을 할당하는 것이 중요합니다.
   + 예 또는 아니요와 같이 두 가지 상태만 가능한 속성은 **이진**으로 표시해야 합니다.
   + 범주를 나타내는 데 사용되는 숫자 또는 문자열인 속성은 **범주형**으로 표시해야 합니다.
   + 순서에 의미가 있는 숫자 수량인 속성은 **숫자**로 표시해야 합니다.
   + 문자열을 공백으로 구분한 단어로 취급하려는 속성은 **텍스트**로 표시해야 합니다.  
![\[Data table showing fields like age, campaign, and contact with their data types and sample values.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/image10.png)

1. 이 자습서에서는 ML이 모든 속성에 대한 데이터 유형을 올바르게 식별했으므로 **계속**을 선택합니다.

그 다음, 대상 속성을 선택합니다.

대상은 ML 모델이 예측 방법을 학습해야 하는 속성이라는 점을 명심하세요. 속성 **y**는 개인이 과거에 캠페인을 구독했는지 여부를 나타냅니다(1(예) 또는 0(아니요)).

**참고**  
ML 모델 학습 및 평가에 데이터 소스를 사용할 경우에만 대상 속성을 선택합니다.

**y를 대상 속성으로 선택하려면**

1. 표 오른쪽 하단에서 단일 화살표를 선택하여 표의 마지막 페이지로 이동합니다. 그러면 `y`라는 이름이 지정된 속성이 나타납니다.  
![\[Navigation buttons for a paginated table, with the last page arrow highlighted.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/image11.png)

1. **대상** 열에서 `y`를 선택합니다.  
![\[Checkbox in Target column next to variable 'y' with Binary data type.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/image12.png)

   ML이 **y**가 대상으로 선택되었음을 확인해줍니다.

1. **계속**을 선택합니다.

1. **행 ID** 페이지에서 **데이터에 식별자가 포함되어 있습니까?**에 대해 기본값인 **아니요**가 선택되어 있는지 확인합니다.

1. **계속**, **등록**을 차례로 선택합니다.

이제 학습 데이터 소스가 준비되었으므로 [모델을 생성](step-3-create-an-ml-model.md)할 준비가 되었습니다.

# 3단계: ML 모델 생성
<a name="step-3-create-an-ml-model"></a>

 학습 데이터 소스를 생성한 후 이를 사용하여 ML 모델을 생성하고 모델을 학습시킨 다음 결과를 평가합니다. ML 모델은 Amazon ML이 학습 중에 데이터에서 발견한 패턴 모음입니다. 모델을 사용하여 예측을 생성합니다.

**ML 모델을 생성하려면**

1.  시작 마법사가 학습 데이터 소스와 모델을 모두 생성해주므로 머신 러닝(ML)은 방금 생성한 학습 데이터 소스를 자동으로 사용하여 **ML 모델 설정** 페이지로 바로 이동합니다. **ML 모델 설정** 페이지에서 **ML 모델 이름**에 대해 기본값인 **ML model: Banking Data 1**이 표시되어 있는지 확인합니다.

   기본값과 같이 친숙한 이름을 사용하면 ML 모델을 쉽게 식별하고 관리할 수 있습니다.

1.  **학습 및 평가 설정**에 대해 **기본값**이 선택되었는지 확인합니다.  
![\[Select training and evaluation settings interface with Default option selected.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/image19.png)

1.  **이 평가에 이름 지정**에 대해 기본값인 **Evaluation: ML model: Banking Data 1**을 그대로 사용합니다.

1.  **검토**를 선택하고, 설정을 검토한 다음 **완료**를 선택합니다.

    **완료**를 선택하면 ML이 모델을 처리 대기열에 추가합니다. Amazon ML은 모델을 생성할 때 기본값을 적용하고 다음 작업을 수행합니다.
   + 학습 데이터 소스를 두 섹션으로 분리합니다. 하나는 데이터의 70%를 포함하고 있고 다른 하나는 나머지 30%를 포함하고 있습니다.
   + 입력 데이터의 70%가 포함된 섹션에서 ML 모델을 학습시킵니다.
   + 입력 데이터의 나머지 30%를 사용하여 모델을 평가합니다.

   모델이 대기열에 있는 동안 ML은 상태를 **보류 중**으로 보고합니다. ML은 모델을 생성하는 동안 상태를 **진행 중**으로 보고합니다. 모든 작업이 완료되면 상태를 **완료됨**으로 보고합니다. 평가가 완료될 때까지 기다렸다가 진행합니다.

이제 [모델의 성능을 검토하고 커트라인 점수를 설정](step-4-review-model-and-set-cutoff.md)할 준비가 되었습니다.

 모델 학습 및 평가에 대한 자세한 내용은 [모델 학습](training-ml-models.md) 및 [ML 모델 평가](evaluating_models.md) 단원을 참조하세요.

# 4단계: ML 모델의 예측 성능 검토 및 점수 임계값 설정
<a name="step-4-review-model-and-set-cutoff"></a>

 ML 모델을 생성하고 Amazon Machine Learning(Amazon ML)에서 이를 평가했으니 이제 사용하기에 충분한지 살펴보겠습니다. 평가 과정에서 Amazon ML은 곡선하면적(AUC) 지표라는 업계 표준 품질 지표를 계산하여 ML 모델의 성능 품질을 나타냅니다. 또한 Amazon ML은 AUC 지표를 해석하여 ML 모델의 품질이 대부분의 기계 학습 애플리케이션에 적합한지 여부도 알려줍니다. ([ML 모델 정확도 측정](binary-model-insights.md#measuring-ml-model-accuracy)의 AUC에 대해 알아봅니다.) AUC 지표를 검토한 다음 점수 임계값 또는 커트라인을 조정하여 모델의 예측 성능을 최적화해 보겠습니다.

**ML 모델의 AUC 지표를 검토하려면**

1.  **ML 모델 요약** 페이지의 **ML 모델 보고서** 탐색 창에서 **평가**를 선택하고 **평가: ML 모델: 은행 모델 1**을 선택한 다음 **요약**을 선택합니다.

1.  **평가 요약** 페이지에서 모델의 AUC 성능 지표를 포함하여 평가 요약을 검토합니다.  
![\[ML model performance metric showing extremely good quality score with AUC of 0.94.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/image24.png)

 ML 모델은 예측 데이터 소스의 각 레코드에 대한 숫자 예측 점수를 생성한 다음 임계값을 적용하여 이 점수를 0(아니요) 또는 1(예)의 이진 레이블로 변환합니다. *점수 임계값*을 변경하여 ML 모델이 이러한 레이블을 할당하는 방식을 조정할 수 있습니다. 이제 점수 임계값을 설정합니다.

 **ML 모델의 점수 임계값을 설정하려면** 

1.  **평가 요약** 페이지에서 **점수 임계값 조정**을 선택합니다.  
![\[ML model performance chart showing predicted distributions for "1" and "0" records with adjustable score threshold.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/image25.png)

   점수 임계값을 조정하면 ML 모델 성능 지표를 세밀하게 조정할 수 있습니다. 이 값을 조정하면 예측이 긍정적으로 간주되기 전에 모델이 예측에 대해 가져야 하는 신뢰 수준이 변경됩니다. 또한 예측에서 허용할 수 있는 거짓 부정과 거짓 긍정의 수도 달라집니다.

    참 긍정이 될 가능성이 가장 높은 예측만 긍정으로 간주할 때까지 점수 임계값을 높여 모델이 긍정적 예측으로 간주하는 기준을 제어할 수 있습니다. 더 이상 거짓 부정이 발생하지 않을 때까지 점수 임계값을 낮출 수도 있습니다. 비즈니스 요구 사항을 반영하여 커트라인을 선택하세요. 이 자습서에서는 거짓 긍정이 발생할 때마다 캠페인 비용이 발생하므로 참 긍정 대 거짓 긍정의 비율을 높이고자 합니다.

1. 제품을 구독할 고객 중 상위 3%를 타겟팅하기를 원한다고 가정해 보겠습니다. 세로 선택기를 밀어 점수 임계값을 **“1”로 예측되는 레코드의 3%에 해당하는 값**으로 설정합니다.  
![\[ML model performance chart showing distribution of predicted answers for "1" and "0" records.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/image26.png)

    이 점수 임계값이 ML 모델의 성능에 미치는 영향: 거짓 긍정률이 0.007임을 유의하세요. 거짓 긍정 비율이 수용 가능하다고 가정해 보겠습니다.

1.  **점수 임계값을 0.77에서 저장**을 선택합니다.

이 ML 모델을 사용하여 예측할 때마다 점수가 0.77을 초과하는 레코드는 “1”로, 나머지 레코드는 “0”으로 예측합니다.

점수 임계값에 대한 자세한 내용은 [바이너리 분류](binary-classification.md) 단원을 참조하세요.

이제 [모델을 사용하여 예측을 만들](step-5-create-predictions.md) 준비가 되었습니다.

# 5단계: ML 모델을 사용하여 예측 생성
<a name="step-5-create-predictions"></a>

 Amazon Machine Learning(Amazon ML)은 배치 예측과 실시간 예측이라는 두 가지 유형의 예측을 생성할 수 있습니다.

*실시간 예측*은 ML이 온디맨드 방식으로 생성하는 단일 관측치에 대한 예측입니다. 실시간 예측은 결과를 대화식으로 사용해야 하는 모바일 앱, 웹 사이트 및 기타 애플리케이션에 적합합니다.

 *배치 예측*은 관측치 그룹에 대한 예측 집합입니다. Amazon ML은 레코드를 배치 예측으로 함께 처리하므로 처리에 다소 시간이 걸릴 수 있습니다. 배치 예측은 관측치 집합에 대한 예측이 필요한 애플리케이션이나 결과를 대화식으로 사용하지 않는 예측이 필요한 애플리케이션에 사용합니다.

이 자습서에서는 한 명의 잠재 고객이 신제품을 구독할지 여부를 예측하는 실시간 예측을 생성합니다. 또한 대규모 잠재 고객에 대한 예측도 생성할 수 있습니다. 배치 예측의 경우 [1단계: 데이터 준비](step-1-download-edit-and-upload-data.md)에서 업로드한 `banking-batch.csv` 파일을 사용하게 될 것입니다.

실시간 예측부터 시작해 보겠습니다.

**참고**  
실시간 예측이 필요한 애플리케이션의 경우 ML 모델을 위한 실시간 엔드포인트를 만들어야 합니다. 실시간 엔드포인트를 사용할 수 있는 동안 요금이 발생합니다. 실시간 예측을 사용하기 전에 실시간 엔드포인트를 만들지 않고도 웹 브라우저의 실시간 예측 기능을 사용해 볼 수 있습니다. 이것이 바로 이 개인 교습에서 우리가 할 일입니다.

**실시간 예측을 시도하려면**

1. **ML 모델 보고서** 탐색 창에서 **실시간 예측 시도**를 선택합니다.  
![\[Navigation pane with "Try real-time predictions" option circled in red.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/try-real-time-prediction-menu.png)

1. **레코드 붙여넣기**를 선택합니다.  
![\[Button labeled "Paste a record" highlighted in a web interface form.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/paste-a-record.png)

1. **레코드 붙여넣기** 대화 상자에서 다음 관측치를 붙여 넣습니다.

   ```
   32,services,divorced,basic.9y,no,unknown,yes,cellular,dec,mon,110,1,11,0,nonexistent,-1.8,94.465,-36.1,0.883,5228.1
   ```

1. **레코드 붙여넣기** 대화 상자에서 **제출**을 선택하여 이 관측치에 대한 예측을 생성할지 확인합니다. Amazon ML이 실시간 예측 양식에 값을 채워줍니다.  
![\[Table row showing 'age' attribute with Numeric type and Value of 32.0.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/value-column.png)
**참고**  
개별 값을 입력하여 **값** 필드를 채울 수도 있습니다. 어떤 방법을 선택하든 모델 학습에 사용되지 않은 관측치를 제공해야 합니다.

1. 페이지 하단에서 **예측 생성**을 선택합니다.

   예측이 오른쪽의 **예측 결과** 창에 표시됩니다. 이 예측에는 `0`의 **예측 레이블**이 붙어 있는데, 이는 이 잠재 고객이 캠페인에 반응할 가능성이 낮다는 것을 의미합니다. `1`의 **예측 레이블**은 고객이 캠페인에 반응할 가능성이 높다는 뜻입니다.  
![\[Prediction results showing binary ML model with predicted label 0 and score 0.033486433.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/real-time-result.png)

이제 배치 예측을 생성합니다. 사용 중인 ML 모델의 이름, 예측을 생성하려는 입력 데이터의 Amazon Simple Storage Service(Amazon S3) 위치(Amazon ML이 이 데이터로부터 배치 예측 데이터 소스를 생성함), 결과를 저장할 Amazon S3 위치를 Amazon ML에 제공하게 될 것입니다.

**배치 예측을 생성하려면**

1. **머신 러닝**을 선택한 다음 **배치 예측**을 선택합니다.  
![\[Amazon Machine Learning dropdown menu with Batch Predictions option highlighted.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/image29.png)

1. **새 배치 예측 생성**을 선택합니다.

1. **배치 예측용 ML 모델** 페이지에서 **ML 모델: 은행 데이터 1**을 선택합니다.

   Amazon ML이 ML 모델 이름, ID, 생성 시간 및 관련 데이터 소스 ID를 표시합니다.

1. **계속**을 선택합니다.

1. 예측을 생성하려면 Amazon ML에 예측이 필요한 데이터를 제공해야 합니다. 이를 *입력 데이터*라고 합니다. 먼저 Amazon ML에서 액세스할 수 있도록 입력 데이터를 데이터 소스에 넣습니다.

   **입력 데이터 찾기**에서 **내 데이터가 S3에 있고, 데이터 소스를 생성해야 합니다**를 선택합니다.  
![\[Radio button options for locating input data, with the second option selected.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/image31.png)

1. **데이터 소스 이름**에서 **Banking Data 2**를 입력합니다.

1. **S3 위치**에서 `banking-batch.csv` 파일: *your-bucket***/banking-batch.csv**의 전체 위치를 입력합니다.

1. **CSV의 첫 줄에 열 이름이 들어 있습니까?**에 대해, **예**를 선택합니다.

1. **확인**을 선택합니다.

   Amazon ML이 데이터의 위치를 검증합니다.

1. **계속**을 선택합니다.

1. **S3 목적지**에서 1단계: 데이터 준비에서 파일을 업로드했던 S3 위치의 이름을 입력합니다. Amazon ML이 여기에 예측 결과를 업로드합니다.

1. **배치 예측 이름**에 대해 기본값인 **Batch prediction: ML model: Banking Data 1**를 그대로 사용합니다. Amazon ML은 예측 생성에 사용할 모델을 기반으로 기본 이름을 선택합니다. 이 자습서에서는 학습 데이터 소스, `Banking Data 1`의 이름을 따서 모델 및 예측의 이름을 지정합니다.

1. **검토**를 선택합니다.

1. **S3 권한** 대화 상자에서 **예**를 선택합니다.  
![\[Dialog box asking to grant Amazon Machine Learning write permission on S3 location.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/image32.png)

1. **검토** 페이지에서 **완료**를 선택합니다.

   배치 예측 요청이 Amazon ML로 전송되고 대기열로 들어갑니다. Amazon ML에서 배치 예측을 처리하는 데 걸리는 시간은 데이터 소스의 크기와 ML 모델의 복잡성에 따라 달라집니다. ML은 요청을 처리하는 동안 상태가 **진행 중**으로 보고됩니다. 배치 예측이 완료되면 요청 상태가 **완료됨**으로 변경됩니다. 이제 결과를 확인할 수 있습니다.

**예측을 확인하려면**

1. **머신 러닝**을 선택한 다음 **배치 예측**을 선택합니다.  
![\[Amazon Machine Learning dropdown menu showing options including Batch Predictions.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/image33.png)

1. 예측 목록에서 **배치 예측: ML 모델: 은행 데이터 1**을 선택합니다. **배치 예측 정보** 페이지가 나타납니다.  
![\[Batch prediction details including name, ID, status, and associated data sources and models.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/image34.png)

1. 배치 예측 결과를 확인하려면 S3 콘솔([https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/))로 이동하여 **출력 S3 URL** 필드에 참조된 S3 위치로 이동합니다. 여기에서 `s3://aml-data/batch-prediction/result`과 비슷한 이름을 가진 결과 폴더로 이동합니다.  
![\[AWS S3 console showing a single file in the batch-prediction result folder.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/image35.png)

   예측은 확장자가.gz인 압축된.gzip 파일 형태로 저장됩니다.

1. 예측 파일을 데스크톱으로 다운로드하고 압축을 풀고 엽니다.  
![\[Table showing bestAnswer scores with numerical values ranging from 0.00046 to 0.30811.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/image36.png)

   이 파일에는 **BestAnswer**와 **점수**라는 두 개의 열과 데이터 소스의 각 관측치에 대한 행이 있습니다. **최고응답** 열의 결과는 [4단계: ML 모델의 예측 성능 검토 및 점수 임계값 설정](step-4-review-model-and-set-cutoff.md)에서 설정했던 점수 임계값인 0.77을 기반으로 합니다. 0.77보다 큰 **점수**는 긍정 응답 또는 예측에 해당하는 **최고응답** 1이 되고, 0.77보다 작은 **점수**는 부정 응답 또는 예측에 해당하는 **최고응답** 0이 됩니다.

   다음 예에서는 점수 임계값인 0.77을 기반으로 한 긍정 예측과 부정 예측을 보여줍니다.

 긍정 예측: 

![\[Table showing bestAnswer score of 1 with a corresponding value of 0.822876.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/image37.png)


이 예제에서 **최고응답**의 값은 1이고 **점수**의 값은 0.8228876입니다. **점수**가 점수 임계값인 0.77보다 크기 때문에 **최고응답**의 값은 1이 됩니다. **최고응답**이 1이면 고객이 제품을 구매할 가능성이 높다는 의미이므로 긍정 예측으로 간주됩니다.

 부정 예측: 

![\[Table showing bestAnswer score of 0 and a numerical score of 0.7693356.\]](http://docs.aws.amazon.com/ko_kr/machine-learning/latest/dg/images/image38.png)


 이 예제에서 **점수** 값이 0.7695356이고 점수 임계값인 0.77보다 작기 때문에 **최고응답**의 값이 0이 됩니다. **최고응답**가 0이면 고객이 제품을 구매할 가능성이 낮다는 의미이므로 부정 예측으로 간주됩니다.

배치 결과의 각 행은 배치 입력(데이터 소스의 관측치)의 행에 해당합니다.

예측을 분석한 후 타겟 마케팅 캠페인을 실행할 수 있습니다. 예를 들어 예측 점수가 `1`인 전단지를 모든 사람에게 발송할 수 있습니다.

이제 모델을 만들고, 검토하고, 사용했으니, [생성한 데이터와 AWS 리소스를 정리](step-6-clean-up.md)하여 불필요한 비용이 발생하지 않도록 하고 작업 공간을 깔끔하게 유지합니다.

# 6단계: 정리
<a name="step-6-clean-up"></a>

Amazon Simple Storage Service(Amazon S3) 요금이 추가로 발생하지 않도록 하려면 Amazon S3에 저장했던 데이터를 삭제합니다. 사용하지 않은 다른 Amazon ML 리소스에 대해서는 요금이 청구되지 않지만, 작업 공간을 깔끔하게 유지하려면 해당 리소스를 삭제하는 것이 좋습니다.<a name="delete-input-data"></a>

**Amazon S3에 저장된 입력 데이터를 삭제하려면**

1. [https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/)에서 S3 콘솔을 엽니다.

1.  `banking.csv` 및 `banking-batch.csv` 파일을 저장한 S3 위치로 이동합니다.

1.  `banking.csv`, `banking-batch.csv` 및 `.writePermissionCheck.tmp` 파일을 선택합니다.

1.  **작업**을 선택한 후 **삭제**를 선택합니다.

1.  확인 메시지가 표시되면 **확인**을 선택합니다.

Amazon ML에서 실행한 배치 예측이나 자습서 중에 생성한 데이터 소스, 모델 및 평가의 기록을 보관하는 데는 요금이 부과되지 않지만, 작업 공간이 복잡해지지 않도록 삭제해 두는 것이 좋습니다.<a name="delete-predictions"></a>

**배치 예측을 삭제하려면**

1.  배치 예측의 출력을 저장한 Amazon S3 위치로 이동합니다.

1.  `batch-prediction` 폴더를 선택합니다.

1.  **작업**을 선택한 후 **삭제**를 선택합니다.

1.  확인 메시지가 표시되면 **확인**을 선택합니다.<a name="delete-ml-resources"></a>

**Amazon ML 리소스를 삭제하려면**

1. Amazon ML 대시보드에서 다음 리소스를 선택합니다.
   + `Banking Data 1` 데이터 소스
   + `Banking Data 1_[percentBegin=0, percentEnd=70, strategy=sequential]` 데이터 소스
   + `Banking Data 1_[percentBegin=70, percentEnd=100, strategy=sequential]` 데이터 소스
   + `Banking Data 2` 데이터 소스
   + `ML model: Banking Data 1` ML 모델 
   + `Evaluation: ML model: Banking Data 1` 평가

1. **작업**을 선택한 후 **삭제**를 선택합니다.

1. 대화 상자에서 **삭제**를 선택하여 선택한 리소스를 모두 삭제합니다.

 이제 자습서를 성공적으로 완료했습니다. 콘솔을 계속 사용하여 데이터 소스, 모델 및 예측을 생성하려면 [머신 러닝 개발자 안내서](https://docs.aws.amazon.com/machine-learning/latest/dg/)를 참조하세요. API 사용 방법을 알아보려면 [머신 러닝 API 참조](https://docs.aws.amazon.com/machine-learning/latest/APIReference/) 단원을 참조하세요.