

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Categorizar o texto com classificação de texto (multirrótulo)
<a name="sms-text-classification-multilabel"></a>

Para categorizar artigos e texto em várias categorias predefinidas, use o tipo de tarefa de classificação de texto com vários rótulos. Por exemplo, você pode usar esse tipo de tarefa para identificar mais de uma emoção transmitida no texto. As seções a seguir fornecem informações de sobre como criar uma tarefa de classificação de texto multirrótulo por meio do console e da API.

Ao trabalhar em uma tarefa de classificação de texto com vários rótulos, os operadores devem escolher todos os rótulos aplicáveis, mas devem escolher pelo menos um. Ao criar uma tarefa usando esse tipo de tarefa, você pode fornecer até 50 categorias de rótulo. 

O Amazon SageMaker Ground Truth não fornece a categoria “nenhum” para quando nenhum dos rótulos se aplica. Para fornecer essa opção aos operadores, inclua um rótulo semelhante a “none (nenhum)” ou “other (outro)” ao criar um trabalho de classificação de texto com vários rótulos. 

Para restringir a escolha dos operadores a um único rótulo para cada seleção de documento ou texto, use o tipo de tarefa [Classificar texto com classificação de texto (Rótulo Único)](sms-text-classification.md). 

**Importante**  
Se você criar manualmente um arquivo de manifesto de entrada, use `"source"` para identificar o texto que você deseja rotular. Para obter mais informações, consulte [Dados de entrada](sms-data-input.md).

## Criar um trabalho de rotulagem de classificação de texto com vários rótulos (console)
<a name="sms-creating-multilabel-text-classification-console"></a>

Você pode seguir as instruções [Criar um trabalho de rotulagem (console)](sms-create-labeling-job-console.md) para aprender como criar um trabalho de rotulagem de classificação de texto com vários rótulos no console do Amazon SageMaker AI. Na Etapa 10, escolha **Texto** no menu suspenso **Categoria da tarefa** e **Classificação de texto (vários rótulos)** como o tipo de tarefa. 

O Ground Truth fornece uma interface de usuário do operador que se parece com a seguinte para tarefas de rotulagem: Ao criar o trabalho de rotulagem com o console, você especifica instruções para ajudar os operadores a concluírem o trabalho e os rótulos que eles podem escolher. 

![Gif mostrando como criar um trabalho de rotulagem de classificação de texto com vários rótulos no console Amazon SageMaker AI.](http://docs.aws.amazon.com/pt_br/sagemaker/latest/dg/images/sms/gifs/multi-label-text.gif)


## Criar um trabalho de rotulagem de classificação de texto com vários rótulos (API)
<a name="sms-creating-multilabel-text-classification-api"></a>

Para criar um trabalho de rotulagem de classificação de texto com vários rótulos, use a operação `CreateLabelingJob` de SageMaker API. Essa API define essa operação para todos AWS SDKs. Para ver uma lista de idiomas específicos com SDKs suporte para essa operação, **consulte a seção Consulte também** do. [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateLabelingJob.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateLabelingJob.html)

Siga as instruções em [Criar um trabalho de rotulagem (API)](sms-create-labeling-job-api.md) e faça o seguinte enquanto você configura a solicitação: 
+ As funções do Lambda de pré-anotação para esse tipo de tarefa terminam com `PRE-TextMultiClassMultiLabel`. Para encontrar a pré-anotação Lambda ARN para sua região, consulte. [PreHumanTaskLambdaArn](https://docs.aws.amazon.com/sagemaker/latest/dg/API_HumanTaskConfig.html#SageMaker-Type-HumanTaskConfig-PreHumanTaskLambdaArn) 
+ As funções do Lambda de consolidação de anotações para esse tipo de tarefa terminam com `ACS-TextMultiClassMultiLabel`. Para encontrar o ARN Lambda de consolidação de anotações para sua região, consulte. [AnnotationConsolidationLambdaArn](https://docs.aws.amazon.com/sagemaker/latest/dg/API_AnnotationConsolidationConfig.html#SageMaker-Type-AnnotationConsolidationConfig-AnnotationConsolidationLambdaArn) 

Veja a seguir um exemplo de uma [solicitação do SDK Python (Boto3) da AWS](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/sagemaker.html#SageMaker.Client.create_labeling_job) para criar um trabalho de rotulagem de dados automatizada na região Leste dos EUA (Norte da Virgínia). Todos os parâmetros em vermelho devem ser substituídos por suas especificações e recursos. 

```
response = client.create_labeling_job(
    LabelingJobName={{'example-multi-label-text-classification-labeling-job}},
    LabelAttributeName={{'label'}},
    InputConfig={
        'DataSource': {
            'S3DataSource': {
                'ManifestS3Uri': {{'s3://bucket/path/manifest-with-input-data.json'}}
            }
        },
        'DataAttributes': {
            'ContentClassifiers': [
                {{'FreeOfPersonallyIdentifiableInformation'|'FreeOfAdultContent'}},
            ]
        }
    },
    OutputConfig={
        'S3OutputPath': {{'s3://bucket/path/file-to-store-output-data'}},
        'KmsKeyId': {{'string'}}
    },
    RoleArn={{'arn:aws:iam::*:role/*}},
    LabelCategoryConfigS3Uri={{'s3://bucket/path/label-categories.json'}},
    StoppingConditions={
        'MaxHumanLabeledObjectCount': {{123}},
        'MaxPercentageOfInputDatasetLabeled': {{123}}
    },
    HumanTaskConfig={
        'WorkteamArn': {{'arn:aws:sagemaker:region:*:workteam/private-crowd/*'}},
        'UiConfig': {
            'UiTemplateS3Uri': {{'s3://bucket/path/custom-worker-task-template.html'}}
        },
        'PreHumanTaskLambdaArn': 'arn:aws:lambda::function:PRE-TextMultiClassMultiLabel,
        'TaskKeywords': [
            {{'Text Classification'}},
        ],
        'TaskTitle': {{'Multi-label text classification task'}},
        'TaskDescription': {{'Select all labels that apply to the text shown'}},
        'NumberOfHumanWorkersPerDataObject': {{123}},
        'TaskTimeLimitInSeconds': {{123}},
        'TaskAvailabilityLifetimeInSeconds': {{123}},
        'MaxConcurrentTaskCount': {{123}},
        'AnnotationConsolidationConfig': {
            'AnnotationConsolidationLambdaArn': 'arn:aws:lambda:{{us-east-1:432418664414}}:function:ACS-TextMultiClassMultiLabel'
        },
    Tags=[
        {
            'Key': {{'string'}},
            'Value': {{'string'
}}        },
    ]
)
```

### Criar um modelo para classificação de texto com vários rótulos
<a name="custom-template-multi-label-text-classification"></a>

Se você criar um trabalho de rotulagem usando a API, será necessário fornecer um modelo de tarefas de operador em `UiTemplateS3Uri`. Copie e modifique o modelo a seguir. Modifique somente [https://docs.aws.amazon.com/sagemaker/latest/dg/sms-creating-instruction-pages.html#sms-creating-quick-instructions](https://docs.aws.amazon.com/sagemaker/latest/dg/sms-creating-instruction-pages.html#sms-creating-quick-instructions), [https://docs.aws.amazon.com/sagemaker/latest/dg/sms-creating-instruction-pages.html#sms-creating-full-instructions](https://docs.aws.amazon.com/sagemaker/latest/dg/sms-creating-instruction-pages.html#sms-creating-full-instructions) e `header`. 

Faça upload deste modelo para o S3 e forneça o URI do S3 para este arquivo em `UiTemplateS3Uri`.

```
<script src="https://assets.crowd.aws/crowd-html-elements.js"></script>
<crowd-form>
  <crowd-classifier-multi-select
    name="crowd-classifier-multi-select"
    categories="{{ task.input.labels | to_json | escape }}"
    header="Please identify all classes in the below text"
  >
    <classification-target style="white-space: pre-wrap">
      {{ task.input.taskObject }}
    </classification-target>
    <full-instructions header="Classifier instructions">
      <ol><li><strong>Read</strong> the text carefully.</li>
      <li><strong>Read</strong> the examples to understand more about the options.</li>
      <li><strong>Choose</strong> the appropriate labels that best suit the text.</li></ol>
    </full-instructions>
    <short-instructions>
      <p>Enter description of the labels that workers have to choose from</p>
      <p><br></p>
      <p><br></p><p>Add examples to help workers understand the label</p>
      <p><br></p><p><br></p><p><br></p><p><br></p><p><br></p>
    </short-instructions>
  </crowd-classifier-multi-select>
  </crowd-form>
```

Para saber como criar um modelo personalizado, consulte [Fluxos de trabalho de rotulagem personalizados](sms-custom-templates.md). 

## Dados de saída de classificação de texto com vários rótulos
<a name="sms-text-classification-multi-select-output-data"></a>

Depois de criar um trabalho de rotulagem de classificação de texto de vários rótulos, seus dados de saída serão localizados no bucket do Amazon S3 especificado no parâmetro `S3OutputPath` ao usar a API ou no campo **Local do conjunto de dados** de saída da seção **Visão geral do trabalho** do console. 

Para saber mais sobre o arquivo manifesto de saída gerado pelo Ground Truth, e sobre a estrutura do arquivo que o Ground Truth usa para armazenar os dados de saída, consulte [Rotulando dados de saída do trabalho](sms-data-output.md). 

Para ver um exemplo de arquivos manifesto de saída para o trabalho de rotulagem de classificação de texto com vários rótulos, consulte [Saída do trabalho de classificação multirrótulo](sms-data-output.md#sms-output-multi-label-classification).