

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 이미지를 사용하여 훈련 및 테스트 데이터 세트 생성
<a name="md-create-dataset"></a>

데이터 세트가 하나인 프로젝트 또는 훈련 데이터 세트와 테스트 데이터 세트가 분리된 프로젝트로 시작할 수 있습니다. 단일 데이터 세트로 시작하는 경우 Amazon Rekognition Custom Labels는 훈련 중에 데이터 세트를 분할하여 프로젝트에 사용할 훈련 데이터 세트(80%)와 테스트 데이터 세트(20%)를 생성합니다. Amazon Rekognition Custom Labels가 훈련 및 테스트에 사용할 이미지를 결정하게 하려면 단일 데이터 세트로 시작하세요. 훈련, 테스트 및 성능 튜닝을 완벽하게 제어하려면 별도의 훈련 및 테스트 데이터 세트로 프로젝트를 시작하는 것이 좋습니다.

다음 위치 중 하나에서 이미지를 가져와서 프로젝트에 대한 훈련 및 테스트 데이터 세트를 만들 수 있습니다.
+ [Amazon S3 버킷에서 이미지 가져오기](md-create-dataset-s3.md)
+ [로컬 컴퓨터에서 이미지 가져오기](md-create-dataset-computer.md)
+ [매니페스트 파일을 사용하여 이미지 가져오기](md-create-dataset-ground-truth.md)
+ [기존 데이터세트에서 콘텐츠 복사](md-create-dataset-existing-dataset.md)

별도의 훈련 및 테스트 데이터 세트로 프로젝트를 시작하는 경우 데이터 세트마다 다른 소스 위치를 사용할 수 있습니다.

이미지를 가져온 위치에 따라 이미지에 레이블이 지정되지 않을 수 있습니다. 예를 들어 로컬 컴퓨터에서 가져온 이미지에는 레이블이 지정되지 않습니다. Amazon SageMaker AI Ground Truth 매니페스트 파일에서 가져온 이미지에는 레이블이 지정됩니다. Amazon Rekognition Custom Labels 콘솔을 사용하여 레이블을 추가, 변경 및 할당할 수 있습니다. 자세한 내용은 [이미지 레이블 지정](md-labeling-images.md) 단원을 참조하십시오.

이미지 업로드 중에 오류가 발생하거나, 이미지가 누락되었거나, 이미지에 레이블이 누락된 경우 [실패한 모델 훈련 디버깅](tm-debugging.md) 항목을 읽어보세요.

데이터 세트에 관한 자세한 내용은 [데이터 세트 관리](managing-dataset.md) 항목을 참조하세요.

## 훈련 및 테스트 데이터 세트 생성(SDK)
<a name="cd-create-dataset-sdk"></a>

 AWS SDK를 사용하여 훈련 및 테스트 데이터 세트를 생성할 수 있습니다.

`CreateDataset` 작업을 사용하면 리소스를 분류하고 관리할 목적으로 새 데이터세트를 생성할 때 선택적으로 태그를 지정할 수 있습니다.

### 훈련 데이터 세트
<a name="cd-create-training-dataset"></a>

 AWS SDK를 사용하여 다음과 같은 방법으로 훈련 데이터 세트를 생성할 수 있습니다.
+ 사용자가 제공하는 Amazon Sagemaker 형식 매니페스트 파일로 [CreateDataset](https://docs.aws.amazon.com/rekognition/latest/APIReference/API_CreateDataset)를 사용하세요. 자세한 내용은 [매니페스트 파일 생성](md-create-manifest-file.md) 단원을 참조하십시오. 예제 코드는 [SageMaker AI Ground Truth 매니페스트 파일(SDK)을 사용하여 데이터 세트 생성](md-create-dataset-ground-truth.md#md-create-dataset-ground-truth-sdk) 항목을 참조하세요.
+ `CreateDataset`를 사용하여 기존 Amazon Rekognition Custom Labels 데이터 세트를 복사하세요. 예제 코드는 [기존 데이터 세트를 사용하여 데이터 세트 생성(SDK)](md-create-dataset-existing-dataset-sdk.md) 항목을 참조하세요.
+ `CreateDataset`를 사용하여 빈 데이터 세트를 생성하고 나중에 [UpdateDataSetEntries](https://docs.aws.amazon.com/rekognition/latest/APIReference/API_UpdateDatasetEntries)로 데이터 세트 항목을 추가할 수 있습니다. 빈 데이터 세트를 만들려면 [프로젝트에 데이터 세트 추가](md-add-dataset.md) 항목을 참조하세요. 데이터 세트에 이미지를 추가하려면 [더 많은 이미지 추가(SDK)](md-add-images.md#md-add-images-sdk) 항목을 참조하세요. 모델을 훈련하려면 먼저 데이터 세트 항목을 추가해야 합니다.

### 테스트 데이터 세트
<a name="cd-create-test-dataset"></a>

 AWS SDK를 사용하여 다음과 같은 방법으로 테스트 데이터 세트를 생성할 수 있습니다.
+ 사용자가 제공하는 Amazon Sagemaker 형식 매니페스트 파일로 [CreateDataset](https://docs.aws.amazon.com/rekognition/latest/APIReference/API_CreateDataset)를 사용하세요. 자세한 내용은 [매니페스트 파일 생성](md-create-manifest-file.md) 단원을 참조하십시오. 예제 코드는 [SageMaker AI Ground Truth 매니페스트 파일(SDK)을 사용하여 데이터 세트 생성](md-create-dataset-ground-truth.md#md-create-dataset-ground-truth-sdk) 항목을 참조하세요.
+ `CreateDataset`를 사용하여 기존 Amazon Rekognition Custom Labels 데이터 세트를 복사하세요. 예제 코드는 [기존 데이터 세트를 사용하여 데이터 세트 생성(SDK)](md-create-dataset-existing-dataset-sdk.md) 항목을 참조하세요.
+ `CreateDataset`를 사용하여 빈 데이터 세트를 생성하고 나중에 `UpdateDatasetEntries`로 데이터 세트 항목을 추가합니다. 빈 데이터 세트를 만들려면 [프로젝트에 데이터 세트 추가](md-add-dataset.md) 항목을 참조하세요. 데이터 세트에 이미지를 추가하려면 [더 많은 이미지 추가(SDK)](md-add-images.md#md-add-images-sdk) 항목을 참조하세요. 모델을 훈련하려면 먼저 데이터 세트 항목을 추가해야 합니다.
+ 훈련 데이터 세트를 별도의 훈련 데이터 세트와 테스트 데이터 세트로 분할합니다. 먼저 `CreateDataset`를 사용하여 빈 테스트 데이터 세트를 만듭니다. 그런 다음 [DistributeDatasetEntries](https://docs.aws.amazon.com/rekognition/latest/APIReference/API_DistributeDatasetEntries)를 직접 호출하여 훈련 데이터 세트 항목의 20%를 테스트 데이터 세트로 이동합니다. 빈 데이터 세트를 만들려면 [프로젝트에 데이터 세트 추가(SDK)](md-add-dataset.md#md-add-dataset-sdk) 항목을 참조하세요. 훈련 데이터 세트를 분할하려면 [훈련 데이터 세트 배포(SDK)](md-distributing-datasets.md) 항목을 참조하세요.