

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Criar um trabalho de rotulagem (API)
<a name="sms-create-labeling-job-api"></a>

Para criar um trabalho de etiquetagem usando a SageMaker API da Amazon, você usa a [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateLabelingJob.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateLabelingJob.html)operação. Para obter instruções específicas sobre como criar um trabalho de rotulagem para um tipo de tarefa integrada, consulte a [página do tipo de tarefa](https://docs.aws.amazon.com/sagemaker/latest/dg/sms-task-types.html) em questão. Para saber como criar um trabalho de rotulagem de streaming, que é um trabalho de rotulagem que é executado perpetuamente, consulte [Criar um trabalho de rotulagem de streaming](sms-streaming-create-job.md).

Para usar a operação `CreateLabelingJob`, você precisa do seguinte:
+ Um modelo de tarefas do operador (`UiTemplateS3Uri`) ou um ARN de interface do usuário de tarefa humana (`[HumanTaskUiArn](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UiConfig.html#sagemaker-Type-UiConfig-HumanTaskUiArn)`) no Amazon S3. 
  + Para trabalhos de nuvem de pontos 3D, trabalhos de monitoramento, de detecção de objetos de vídeo e trabalhos NER, use o ARN listado em `HumanTaskUiArn` para seu tipo de tarefa.
  + Se estiver usando um tipo de tarefa integrada que não seja uma tarefa de nuvem de pontos 3D, você poderá adicionar as instruções do operador a um dos modelos pré-criados e salvar o modelo (usando uma extensão.html ou .liquid) no bucket do S3. Encontre os modelos de pré-compilação na [página do tipo de tarefa](https://docs.aws.amazon.com/sagemaker/latest/dg/sms-task-types.html) em questão.
  + Se estiver usando um fluxo de trabalho de rotulagem personalizado, você poderá criar um modelo personalizado e salvar o modelo no bucket do S3. Para saber como criar um modelo de operador personalizado, consulte [Um modelo de tarefas do operador personalizado.](sms-custom-templates-step2.md). Para obter elementos HTML personalizados que você pode usar para personalizar o modelo, consulte [Referência do Crowd HTML Elements](sms-ui-template-reference.md). Para obter um repositório de modelos de demonstração para uma variedade de tarefas de rotulagem, consulte [Amazon SageMaker Ground Truth Sample Task UIs ](https://github.com/aws-samples/amazon-sagemaker-ground-truth-task-uis).
+ Um arquivo manifesto de entrada que especifique os dados de entrada no Amazon S3. Especifique o local do arquivo manifesto de entrada no `ManifestS3Uri`. Para obter informações sobre como criar um manifesto de entrada, consulte [Dados de entrada](sms-data-input.md). Se você criar um trabalho de rotulagem de streaming, isso é opcional. Para saber como criar um trabalho de rotulagem de streaming, consulte [Criar um trabalho de rotulagem de streaming](sms-streaming-create-job.md).
+ Um bucket do Amazon S3 para armazenar seus dados de saída. Você especifica este bucket e, opcionalmente, um prefixo em `S3OutputPath`.
+ Um arquivo de configuração de categoria de rótulo. O nome de cada categoria de rótulo deve ser exclusivo. Especifique o local desse arquivo no Amazon S3 usando o parâmetro `LabelCategoryConfigS3Uri`. As categorias de rótulo e formato desse arquivo dependem do tipo de tarefa que você usa:
  + Para classificação de imagens e classificação de texto (rótulo único e múltiplos), você deve especificar pelo menos duas categorias de rótulos. Para todos os outros tipos de tarefas, o número mínimo de categorias de rótulos exigido é 01. 
  + Para tarefas de reconhecimento de entidades nomeadas, você deve fornecer instruções de trabalhadores nesse arquivo. Para obter detalhes e um exemplo, consulte [Forneça instruções de trabalho em um Arquivo de configuração de categoria de rótulo](sms-named-entity-recg.md#worker-instructions-ner).
  + Para o tipo de tarefa de nuvem de pontos 3D e quadros de vídeo, use o formato em [Arquivo de configuração de categorias de rotulagem com referência de atributos de categorias e quadros de rótulo](sms-label-cat-config-attributes.md).
  + Para todos os outros tipos de tarefa integradas e tarefas personalizadas, o arquivo de configuração da categoria de rótulo deve ser um arquivo JSON no seguinte formato. Identifique os rótulos que você deseja usar substituindo `label_1`, `label_2`, `...`, `label_n` pelas categorias de rótulos. 

    ```
    {
        "document-version": "2018-11-28",
        "labels": [
            {"label": "label_1"},
            {"label": "label_2"},
            ...
            {"label": "label_n"}
        ]
    }
    ```
+ Uma função AWS Identity and Access Management (IAM) com a política [AmazonSageMakerGroundTruthExecution](https://console.aws.amazon.com/iam/home?#/policies/arn:aws:iam::aws:policy/AmazonSageMakerGroundTruthExecution)gerenciada do IAM anexada e com permissões para acessar seus buckets do S3. Especifique essa função em `RoleArn`. Para saber mais sobre essa política, consulte [Use políticas gerenciadas do IAM com o Ground Truth](sms-security-permissions-get-started.md). Se você precisar de permissões mais granulares, consulte [Atribua permissões do IAM para usar o Ground Truth](sms-security-permission.md).

  Se o nome do bucket de entrada ou saída não contiver `sagemaker`, você poderá anexar uma política à função passada para a operação `CreateLabelingJob` semelhante à seguinte.

------
#### [ JSON ]

****  

  ```
  {
      "Version":"2012-10-17",		 	 	 
      "Statement": [
          {
              "Effect": "Allow",
              "Action": [
                  "s3:GetObject"
              ],
              "Resource": [
                  "arn:aws:s3:::my_input_bucket/*"
              ]
          },
          {
              "Effect": "Allow",
              "Action": [
                  "s3:PutObject"
              ],
              "Resource": [
                  "arn:aws:s3:::my_output_bucket/*"
              ]
          }
      ]
  }
  ```

------
+ Um Nome de recurso da Amazon (ARN) da função de pré e pós-anotação do AWS Lambda (ou consolidação de anotação) para processar seus dados de entrada e saída. 
  + As funções Lambda são predefinidas em cada AWS região para tipos de tarefas incorporados. Para encontrar a pré-anotação Lambda ARN para sua região, consulte. [PreHumanTaskLambdaArn](https://docs.aws.amazon.com/sagemaker/latest/dg/API_HumanTaskConfig.html#SageMaker-Type-HumanTaskConfig-PreHumanTaskLambdaArn) Para encontrar o ARN Lambda de consolidação de anotações para sua região, consulte. [AnnotationConsolidationLambdaArn](https://docs.aws.amazon.com/sagemaker/latest/dg/API_AnnotationConsolidationConfig.html#SageMaker-Type-AnnotationConsolidationConfig-AnnotationConsolidationLambdaArn) 
  + Para fluxos de trabalho de rotulagem personalizada, é necessário fornecer um ARN do Lambda de pré e pós-anotação. Para saber como criar essas funções do Lambda, consulte [Processando dados em um fluxo de trabalho de rotulagem personalizado com AWS Lambda](sms-custom-templates-step3.md).
+ Um ARN de equipe de trabalho que você especifica em `WorkteamArn`. Você recebe um ARN de equipe de trabalho ao assinar uma força de trabalho de um fornecedor ou criar uma equipe de trabalho privada. Se você estiver criando um trabalho de rotulagem para um quadro de vídeo ou tipo de tarefa de nuvem de pontos, não poderá usar a Amazon Mechanical Turk força de trabalho. Para todos os outros tipos de tarefas, para usar a força de trabalho do Mechanical Turk, use o seguinte ARN. *`region`*Substitua pela AWS região que você está usando para criar o trabalho de etiquetagem.

  ` arn:aws:sagemaker:region:394669845002:workteam/public-crowd/default`

  Se você usar a [força de trabalho Amazon Mechanical Turk](https://docs.aws.amazon.com/sagemaker/latest/dg/sms-workforce-management-public.html), use o parâmetro `ContentClassifiers` em `DataAttributes` de `InputConfig` para declarar que o seu conteúdo não contém informações de identificação pessoal e nem conteúdo adulto. 

  O Ground Truth *exige* que seus dados de entrada estejam livres de informações de identificação pessoal (PII) quando você usa o Mechanical Turk. Se você usa o Mechanical Turk e não especifica que seus dados de entrada estão livres de PII usando o sinalizador `FreeOfPersonallyIdentifiableInformation`, seu trabalho de rotulagem irá falhar. Use a `FreeOfAdultContent` bandeira para declarar que seus dados de entrada estão livres de conteúdo adulto. SageMaker A IA pode restringir os funcionários do Amazon Mechanical Turk que podem visualizar sua tarefa se ela contiver conteúdo adulto. 

  Para saber mais sobre equipes de trabalho e forças de trabalho, consulte [Forças de trabalho](sms-workforce-management.md). 
+ Se você usa a força de trabalho do Mechanical Turk, deve especificar o preço que pagará aos trabalhadores pela execução de uma única tarefa em `PublicWorkforceTaskPrice`.
+ Para configurar a tarefa, você deve fornecer uma descrição da tarefa e um título usando `TaskDescription` e `TaskTitle`, respectivamente. Opcionalmente, você pode fornecer limites de tempo que controlam por quanto tempo os operadores precisam trabalhar em uma tarefa individual (`TaskTimeLimitInSeconds`) e por quanto tempo as tarefas permanecem no portal do operador, disponível para os operadores (`TaskAvailabilityLifetimeInSeconds`).
+ (Opcional) Para [alguns tipos de tarefa](https://docs.aws.amazon.com/sagemaker/latest/dg/sms-annotation-consolidation.html), é possível que vários operadores rotulem um único objeto de dados inserindo um número superior a um para o parâmetro `NumberOfHumanWorkersPerDataObject`. Para obter mais informações sobre consolidação de anotações, consulte [Consolidação de anotações](sms-annotation-consolidation.md).
+ (Opcional) Para criar um trabalho automatizado de rotulagem de dados, especifique um dos ARNs listados [LabelingJobAlgorithmSpecificationArn](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_LabelingJobAlgorithmsConfig.html)em`LabelingJobAlgorithmsConfig`. Esse ARN identifica o algoritmo usado na tarefa automatizada de rotulagem de dados. O tipo de tarefa associado a esse ARN deve corresponder ao tipo de tarefa do `PreHumanTaskLambdaArn` e `AnnotationConsolidationLambdaArn` que você especificar. A rotulagem automatizada de dados é compatível com os seguintes tipos de tarefas: classificação de imagens, caixa delimitadora, segmentação de semântica e classificação de texto. O número mínimo de objetos permitidos para a rotulagem de dados automatizada é de 1.250, mas é altamente recomendável fornecer um mínimo de 5.000 objetos. Para saber mais sobre trabalhos de rotulagem de dados automatizados, consulte[Automatizar a rotulagem de dados](sms-automated-labeling.md).
+ (Opcional) Você pode fornecer [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateLabelingJob.html#API_CreateLabelingJob_RequestSyntax](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateLabelingJob.html#API_CreateLabelingJob_RequestSyntax), que faz com que o trabalho de rotulagem seja interrompido se uma das condições for atendida. Você pode usar condições de interrupção para controlar o custo do trabalho de rotulagem.

## Exemplos
<a name="sms-create-labeling-job-api-examples"></a>

Os exemplos de código a seguir demonstram como criar um trabalho de rotulagem usando `CreateLabelingJob`. Você também pode ver esses blocos de notas de exemplo GitHub no [repositório de exemplos de SageMaker IA](https://github.com/aws/amazon-sagemaker-examples/tree/master/ground_truth_labeling_jobs).

------
#### [ AWS SDK para Python (Boto3) ]

Veja a seguir um exemplo de uma [solicitação do AWS SDK Python (Boto3)](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/sagemaker.html#SageMaker.Client.create_labeling_job) para criar um trabalho de rotulagem para tipos de tarefas integradas na região Leste dos EUA (Norte da Virgínia) usando uma força de trabalho privada. Substitua tudo *red-italized text* pelos recursos e especificações do seu trabalho de etiquetagem. 

```
response = client.create_labeling_job(
    LabelingJobName="example-labeling-job",
    LabelAttributeName="label",
    InputConfig={
        'DataSource': {
            'S3DataSource': {
                'ManifestS3Uri': "s3://bucket/path/manifest-with-input-data.json"
            }
        },
        'DataAttributes': {
            'ContentClassifiers': [
                "FreeOfPersonallyIdentifiableInformation"|"FreeOfAdultContent",
            ]
        }
    },
    OutputConfig={
        'S3OutputPath': "s3://bucket/path/file-to-store-output-data",
        'KmsKeyId': "string"
    },
    RoleArn="arn:aws:iam::*:role/*",
    LabelCategoryConfigS3Uri="s3://bucket/path/label-categories.json",
    StoppingConditions={
        'MaxHumanLabeledObjectCount': 123,
        'MaxPercentageOfInputDatasetLabeled': 123
    },
    HumanTaskConfig={
        'WorkteamArn': "arn:aws:sagemaker:region:*:workteam/private-crowd/*",
        'UiConfig': {
            'UiTemplateS3Uri': "s3://bucket/path/custom-worker-task-template.html"
        },
        'PreHumanTaskLambdaArn': "arn:aws:lambda:us-east-1:432418664414:function:PRE-tasktype",
        'TaskKeywords': [
            "Images",
            "Classification",
            "Multi-label"
        ],
        'TaskTitle': "Multi-label image classification task",
        'TaskDescription': "Select all labels that apply to the images shown",
        'NumberOfHumanWorkersPerDataObject': 1,
        'TaskTimeLimitInSeconds': 3600,
        'TaskAvailabilityLifetimeInSeconds': 21600,
        'MaxConcurrentTaskCount': 1000,
        'AnnotationConsolidationConfig': {
            'AnnotationConsolidationLambdaArn': "arn:aws:lambda:us-east-1:432418664414:function:ACS-"
        },
    Tags=[
        {
            'Key': "string",
            'Value': "string"
        },
    ]
)
```

------
#### [ AWS CLI ]

Veja a seguir um exemplo de uma solicitação de AWS CLI para criar um trabalho de rotulagem para um tipo de tarefa incorporado na região Leste dos EUA (Norte da Virgínia) usando a força de trabalho do [Amazon Mechanical Turk](https://docs.aws.amazon.com/sagemaker/latest/dg/sms-workforce-management-public.html). Para obter mais informações, consulte [start-human-loop](https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-labeling-job.html) na *Referência de comandos da [AWS CLI](https://docs.aws.amazon.com/cli/latest/reference/)*. Substitua tudo *red-italized text* pelos recursos e especificações do seu trabalho de etiquetagem. 

```
$ aws --region us-east-1 sagemaker create-labeling-job \
--labeling-job-name "example-labeling-job" \
--label-attribute-name "label" \
--role-arn "arn:aws:iam::account-id:role/role-name" \
--input-config '{
        "DataAttributes": {
            "ContentClassifiers": [
                "FreeOfPersonallyIdentifiableInformation",
                "FreeOfAdultContent"
            ]
        },
        "DataSource": {
            "S3DataSource": {
                "ManifestS3Uri": "s3://bucket/path/manifest-with-input-data.json"
            }
        }
    }' \
--output-config '{
        "KmsKeyId": "",
        "S3OutputPath": "s3://bucket/path/file-to-store-output-data"
    }' \
--human-task-config '{
        "AnnotationConsolidationConfig": {
            "AnnotationConsolidationLambdaArn": "arn:aws:lambda:us-east-1:432418664414:function:ACS-"
        },
        "TaskAvailabilityLifetimeInSeconds": 21600,
        "TaskTimeLimitInSeconds": 3600,
        "NumberOfHumanWorkersPerDataObject": 1,
        "PreHumanTaskLambdaArn":  "arn:aws:lambda:us-east-1:432418664414:function:PRE-tasktype",
        "WorkteamArn": "arn:aws:sagemaker:us-east-1:394669845002:workteam/public-crowd/default",
        "PublicWorkforceTaskPrice": {
            "AmountInUsd": {
                "Dollars": 0,
                "TenthFractionsOfACent": 6,
                "Cents": 3
            }
        },
        "TaskDescription": "Select all labels that apply to the images shown",
        "MaxConcurrentTaskCount": 1000,
        "TaskTitle": "Multi-label image classification task",,
        "TaskKeywords": [
            "Images",
            "Classification",
            "Multi-label"
        ],
        "UiConfig": {
            "UiTemplateS3Uri": "s3://bucket/path/custom-worker-task-template.html"
        }
    }'
```

------

Para obter mais informações sobre essa operação, consulte [CreateLabelingJob](https://docs.aws.amazon.com/sagemaker/latest/dg/API_CreateLabelingJob.html). Para obter informações sobre como usar outro idioma específico SDKs, consulte [Consulte também](https://docs.aws.amazon.com/sagemaker/latest/dg/API_CreateLabelingJob.html#API_CreateLabelingJob_SeeAlso) no `CreateLabelingJobs` tópico. 