

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 작업자에게 전송되는 데이터 객체의 흐름 제어
<a name="sms-batching"></a>

생성하는 레이블 지정 작업의 유형에 따라 Amazon SageMaker Ground Truth는 데이터 객체를 배치로 또는 스트리밍 방식으로 작업자에게 전송합니다. 다음과 같은 방법으로 작업자에 전달되는 데이터 객체의 흐름을 제어할 수 있습니다.
+ 두 가지 유형의 레이블 지정 작업 모두에 대해 레이블 지정 작업이 실행되는 특정 시점에서 모든 작업자가 사용할 수 있는 총 데이터 객체 수를 제어하는데 `MaxConcurrentTaskCount`를 사용할 수 있습니다.
+ 스트리밍 레이블 지정 작업의 경우 레이블 지정 작업과 관련된 Amazon SQS로 전송되는 데이터 객체의 수를 모니터링하고 제어하여 작업자에게 전달되는 데이터 객체의 흐름을 제어할 수 있습니다.

다음 섹션을 통해 이런 옵션에 대해 자세히 알아보세요.

**Topics**
+ [MaxConcurrentTaskCount를 사용하여 데이터 객체의 흐름을 제어합니다](#sms-batching-maxconcurrenttaskcount)
+ [Amazon SQS를 사용하여 스트리밍 레이블 지정 작업으로의 데이터 객체 흐름을 제어할 수 있습니다](#sms-batching-streaming-sqs)

## MaxConcurrentTaskCount를 사용하여 데이터 객체의 흐름을 제어합니다
<a name="sms-batching-maxconcurrenttaskcount"></a>

[https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_HumanTaskConfig.html#sagemaker-Type-HumanTaskConfig-MaxConcurrentTaskCount](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_HumanTaskConfig.html#sagemaker-Type-HumanTaskConfig-MaxConcurrentTaskCount) 는 작업자 포털 작업 대기열에서 한 번에 사용할 수 있는 최대 데이터 객체 수를 정의합니다. 콘솔을 사용하는 경우 이 파라미터는 1,000으로 설정됩니다. `CreateLabelingJob`을 사용하는 경우 이 파라미터를 1에서 5,000 사이의 정수로 설정할 수 있습니다 (1 및 1,000 포함).

다음 예제를 사용하여 매니페스트 파일, 및 의 항목 수가 작업자-포털 UI의 작업 대기열에서 작업자에게 표시되는 작업을 `NumberOfHumanWorkersPerDataObject` `MaxConcurrentTaskCount` 정의하는 방법을 더 잘 이해할 수 있습니다.

1. 600개의 항목이 있는 입력 매니페스트 파일이 있습니다.

1. 입력 매니페스트 파일의 각 항목에 대해 `NumberOfHumanWorkersPerDataObject`를 사용하여 입력 매니페스트 파일의 항목에 레이블을 지정할 인적 작업자 수를 정의할 수 있습니다. 이 예제에서는 `NumberOfHumanWorkersPerDataObject`를 3으로 설정합니다. 이렇게 하면 입력 매니페스트 파일의 각 항목에 대해 3개의 서로 다른 작업이 생성됩니다. 또한 레이블이 성공적으로 지정된 것으로 표시되려면 최소한 3 명의 다른 작업자가 객체에 레이블을 지정해야 합니다. 이렇게 하면 작업자가 완료할 총 1,800개의 작업(600 x 3)이 생성됩니다.

1. 작업자가 작업자 포털 UI의 대기열에서 한 번에 100개의 작업만 보도록 해야 합니다. 이렇게 하려면 `MaxConcurrentTaskCount`를 100으로 설정합니다. 그런 다음 Ground Truth는 작업자당 100개의 작업으로 작업자-포털 작업 대기열을 채웁니다.

1. 다음에 발생하는 일은 생성하는 레이블 지정 작업 유형과 스트리밍 레이블 지정 작업인지 여부에 따라 달라집니다.
   + **스트리밍 레이블 지정 작업**: 작업자가 사용할 수 있는 총 객체 수가 `MaxConcurrentTaskCount`와 같은 한 입력 매니페스트 파일에 있고 Amazon SNS를 사용하여 실시간으로 전송하는 나머지 모든 데이터세트 객체가 Amazon SQS 대기열에 배치됩니다. 작업자가 사용할 수 있는 총 객체 수가 `MaxConcurrentTaskCount`에서 `NumberOfHumanWorkersPerDataObject`를 뺀 숫자 이하로 떨어지면 대기열의 새 데이터 객체를 사용하여 `NumberOfHumanWorkersPerDataObject` 태스크를 생성하여 작업자에게 실시간으로 전송합니다.
   + **비스트리밍 레이블 지정 작업**(Non-streaming labeling job): 작업자가 한 세트의 객체에 레이블을 완료하면 최대 `MaxConcurrentTaskCount` 번까지 `NumberOfHumanWorkersPerDataObject`개의 새 작업이 작업자에게 전송됩니다. 입력 매니페스트 파일의 모든 데이터 객체에 레이블이 지정될 때까지 이 프로세스가 반복됩니다.

## Amazon SQS를 사용하여 스트리밍 레이블 지정 작업으로의 데이터 객체 흐름을 제어할 수 있습니다
<a name="sms-batching-streaming-sqs"></a>

스트리밍 레이블 지정 작업을 생성하면 Amazon SQS 대기열이 사용자 계정에 자동으로 생성됩니다. 데이터 객체는 작업자에게 전송된 총 객체 수가 `MaxConcurrentTaskCount`를 초과할 때만 Amazon SQS 대기열에 추가됩니다. 그렇지 않으면 객체가 작업자에게 직접 전송됩니다.

이 대기열을 사용하여 레이블 지정 작업으로의 데이터 객체 흐름을 관리할 수 있습니다. 자세한 내용은 [Amazon SQS 대기열을 사용하여 레이블 지정 요청 관리](sms-streaming-how-it-works-sqs.md)을 참조하세요.