

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 매니페스트 파일 입력
<a name="sms-input-data-input-manifest"></a>

입력 매니페스트 파일의 각 줄은 레이블을 지정할 객체 또는 객체에 대한 참조를 포함하는 항목입니다. 항목에는 이전 작업의 레이블과 일부 태스크 유형의 경우 추가 정보가 포함될 수도 있습니다.

입력 데이터 및 매니페스트 파일은 Amazon Simple Storage Service(S3)에 저장해야 합니다. 각 시스템에는 다음과 같은 특정 스토리지 및 액세스 요구 사항이 있습니다.
+ 입력 데이터가 포함된 Amazon S3 버킷은 Amazon SageMaker Ground Truth를 실행하는 리전과 동일한 AWS 리전에 있어야 합니다. Amazon S3 버킷에 저장된 데이터를 읽을 수 있도록 Amazon SageMaker AI 액세스 권한을 부여해야 합니다. Amazon S3 버킷에 대한 자세한 정보는 [Amazon S3 버킷 작업](https://docs.aws.amazon.com/AmazonS3/latest/dev/UsingBucket.html)을 참조하세요.
+ 매니페스트 파일은 데이터 파일과 동일한 AWS 리전에 있어야 하지만 데이터 파일과 동일한 위치에 있을 필요는 없습니다. 레이블 지정 작업을 생성할 때 Ground Truth에 할당한 AWS Identity and Access Management (IAM) 역할에 액세스할 수 있는 모든 Amazon S3 버킷에 저장할 수 있습니다.

**참고**  
3D 포인트 클라우드 및 동영상 프레임 [태스크 유형](https://docs.aws.amazon.com/sagemaker/latest/dg/sms-task-types.html)에는 서로 다른 입력 매니페스트 요구 사항 및 속성이 있습니다.  
[3D 포인트 클라우드 태스크 유형](https://docs.aws.amazon.com/sagemaker/latest/dg/sms-point-cloud.html)은 [3D 포인트 클라우드 레이블 지정 작업에 대한 입력 매니페스트 파일](sms-point-cloud-input-manifest.md) 섹션을 참조하세요.  
[동영상 프레임 작업 유형](https://docs.aws.amazon.com/sagemaker/latest/dg/sms-video-task-types.html)은 [동영상 프레임 입력 매니페스트 파일 생성](sms-video-manual-data-setup.md#sms-video-create-manifest) 섹션을 참조하세요.

매니페스트는 각 행이 하나의 완성된 유효한 JSON 객체인 UTF-8 인코딩 파일입니다. 각 행은 표준 줄 바꿈인 \$1n 또는 \$1r\$1n으로 구분됩니다. 각 행이 유효한 JSON 객체여야 하므로 이스케이프되지 않은 줄 바꿈 문자를 사용할 수 없습니다. 데이터 형식에 대한 자세한 정보는 [JSON 라인](http://jsonlines.org/)을 참조하세요.

매니페스트 파일의 각 JSON 객체는 100,000자를 초과할 수 없습니다. 객체 내 단일 속성은 20,000자를 초과할 수 없습니다. 속성 이름은 `$`(달러 기호)로 시작할 수 없습니다.

매니페스트 파일의 각 JSON 객체에는 `source-ref` 또는 `source` 키 중 하나가 포함되어야 합니다. 키 값은 다음과 같이 해석됩니다.
+ `source-ref` – 객체의 소스는 값에 지정된 Amazon S3 객체입니다. 객체가 바이너리 객체(예: 이미지)인 경우 이 값을 사용하세요.
+ `source` – 객체의 소스가 이 값입니다. 객체가 문자 값일 때 이 값을 사용하세요.



다음은 Amazon S3 버킷에 저장된 매니페스트 파일의 예입니다.

```
{"source-ref": "S3 bucket location 1"}
{"source-ref": "S3 bucket location 2"}
   ...
{"source-ref": "S3 bucket location n"}
```

경계 상자, 이미지 분류(단일 및 다중 레이블), 의미 체계 분할 및 동영상 분류 레이블 지정 작업을 위한 동영상 클립에 `source-ref` 키를 사용합니다. 3D 포인트 클라우드 및 동영상 프레임 레이블 지정 작업에서도 `source-ref` 키를 사용하지만 이러한 레이블 지정 작업은 입력 매니페스트 파일에 추가 정보가 필요합니다. 자세한 내용은 [3D 포인트 클라우드 입력 데이터](sms-point-cloud-input-data.md) 및 [동영상 프레임 입력 데이터](sms-video-frame-input-data-overview.md) 섹션을 참조하세요.

다음은 매니페스트에 저장된 입력 데이터와 함께 매니페스트 파일의 예입니다.

```
{"source": "Lorem ipsum dolor sit amet"}
{"source": "consectetur adipiscing elit"}
   ...
{"source": "mollit anim id est laborum"}
```

단일 및 다중 레이블 텍스트 분류 및 명명된 주체 인식 레이블 지정 작업에 `source` 키를 사용합니다.

매니페스트 파일에는 다른 키-값 페어를 포함할 수 있습니다. 이러한 페어는 출력 파일에 변경 없이 전달되며, 애플리케이션 간에 정보를 전달하려 할 때 유용합니다. 자세한 내용은 [작업 출력 데이터 레이블 지정](sms-data-output.md) 섹션을 참조하세요.