

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Criar um filtro de vocabulário
<a name="vocabulary-filter-create"></a>

Há duas opções para criar um filtro de vocabulário personalizado:

1. Salve uma lista de palavras separadas por linha como um arquivo de texto sem formatação com codificação UTF-8.
   + Você pode usar essa abordagem com o Console de gerenciamento da AWS, a AWS CLI ou os SDKs da AWS.
   + Se estiver usando o Console de gerenciamento da AWS, você pode fornecer um caminho local ou um URI do Amazon S3 para seu arquivo de vocabulário personalizado.
   + Se estiver usando a AWS CLI ou os SDKs da AWS, você deve carregar seu arquivo de vocabulário personalizado em um bucket do Amazon S3 e incluir o URI do Amazon S3 em sua solicitação.

1. Inclua uma lista de palavras separadas por vírgula diretamente na solicitação de API.
   + Você pode utilizar essa abordagem com a AWS CLI ou os SDKs da AWS usando o parâmetro [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabularyFilter.html#transcribe-CreateVocabularyFilter-request-Words](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabularyFilter.html#transcribe-CreateVocabularyFilter-request-Words).

Para obter exemplos de cada método, consulte [Criar filtros de vocabulário personalizados](#vocabulary-filtering-create-examples).

Fatores a serem observados ao criar um filtro de vocabulário personalizado:
+ As palavras não diferenciam maiúsculas de minúsculas. Por exemplo, “xingar” e “XINGAR” são tratados da mesma forma.
+ Somente as correspondências exatas de palavras são filtradas. Por exemplo, se seu filtro incluir “xingar”, mas sua mídia contiver “xingamentos” ou “xingação”, essas palavras não serão filtradas. Somente as ocorrências de “xingar” são filtradas. Portanto, você deve incluir todas as variações das palavras que deseja filtrar.
+ Os filtros não se aplicam a palavras contidas em outras palavras. Por exemplo, se um filtro de vocabulário contiver “total”, mas não “subtotal”, “subtotal” não será alterado na transcrição. 
+ Cada entrada só pode conter uma palavra (sem espaços).
+ Se você salvar seu filtro de vocabulário personalizado como um arquivo de texto, ele deverá estar em formato de texto simples com codificação UTF-8.
+ Você pode ter até 100 filtros de vocabulário personalizados por Conta da AWS e cada um pode ter até 50 Kb de tamanho.
+ Você só pode usar caracteres compatíveis com seu idioma. Consulte o [conjunto de caracteres](charsets.md) do seu idioma para obter detalhes.

## Criar filtros de vocabulário personalizados
<a name="vocabulary-filtering-create-examples"></a>

Para processar um filtro de vocabulário personalizado para uso com o Amazon Transcribe, consulte os seguintes exemplos:

### Console de gerenciamento da AWS
<a name="vocab-filter-create-console-batch"></a>

Antes de continuar, salve seu filtro de vocabulário personalizado como um arquivo de texto (\$1.txt). Opcionalmente, você pode carregar seu arquivo em um bucket do Amazon S3.

1. Faça login no [Console de gerenciamento da AWS](https://console.aws.amazon.com/transcribe/).

1. No painel de navegação, escolha **Filtragem de vocabulário**. Isso abre a página **Filtros de vocabulário**, onde você pode visualizar os filtros de vocabulário personalizados existentes ou criar um.

1. Selecione **Criar filtro de vocabulário**.  
![\[Captura de tela do console do Amazon Transcribe: a página “Filtros de vocabulário”.\]](http://docs.aws.amazon.com/pt_br/transcribe/latest/dg/images/vocab-filter-create-console.png)

   Isso levará você à página **Criar filtro de vocabulário**. Digite um nome para o novo filtro de vocabulário personalizado.

   Selecione a opção **Fazer upload de arquivo** ou **Localização no S3** em **Fonte de entrada de vocabulário**. Em seguida, especifique o local do arquivo de vocabulário personalizado.  
![\[Captura de tela do console do Amazon Transcribe: a página “Criar filtro de vocabulário”.\]](http://docs.aws.amazon.com/pt_br/transcribe/latest/dg/images/vocab-filter-create-console-upload.png)

1. Opcionalmente, adicione tags ao seu de vocabulário personalizado. Quando todos os campos estiverem preenchidos, selecione **Criar filtro de vocabulário** na parte inferior da página. Se não houver erros ao processar o arquivo, você retornará à página **Filtros de vocabulário**.

   O filtro de vocabulário personalizado está pronto para ser usado.

### AWS CLI
<a name="vocab-filter-create-cli"></a>

Este exemplo usa o comando [create-vocabulary-filter](https://docs.aws.amazon.com/cli/latest/reference/transcribe/create-vocabulary-filter.html) para processar uma lista de palavras em um filtro de vocabulário personalizado utilizável. Para obter mais informações, consulte [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabularyFilter.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabularyFilter.html).

**Opção 1**: você pode incluir sua lista de palavras na solicitação usando o parâmetro `words`.

```
aws transcribe create-vocabulary-filter \ 
--vocabulary-filter-name my-first-vocabulary-filter \ 
--language-code en-US \ 
--words profane,offensive,Amazon,Transcribe
```

**Opção 2**: você pode salvar sua lista de palavras como um arquivo de texto e enviá-la a um bucket do Amazon S3 e, em seguida, incluir o URI do arquivo na solicitação usando o parâmetro `vocabulary-filter-file-uri`.

```
aws transcribe create-vocabulary-filter \ 
--vocabulary-filter-name my-first-vocabulary-filter \ 
--language-code en-US \ 
--vocabulary-filter-file-uri s3://amzn-s3-demo-bucket/my-vocabulary-filters/my-vocabulary-filter.txt
```

Veja a seguir outro exemplo usando o comando [create-vocabulary-filter](https://docs.aws.amazon.com/cli/latest/reference/transcribe/create-vocabulary-filter.html) e um corpo de solicitação que cria o filtro de vocabulário personalizado.

```
aws transcribe create-vocabulary-filter \
--cli-input-json file://filepath/my-first-vocab-filter.json
```

O arquivo *my-first-vocab-filter.json* contém o corpo de solicitação a seguir.

**Opção 1**: você pode incluir sua lista de palavras na solicitação usando o parâmetro `Words`.

```
{
  "VocabularyFilterName": "my-first-vocabulary-filter",
  "LanguageCode": "en-US",
  "Words": [
        "profane","offensive","Amazon","Transcribe"
  ]
}
```

**Opção 2**: você pode salvar sua lista de palavras como um arquivo de texto e enviá-la a um bucket do Amazon S3 e, em seguida, incluir o URI do arquivo na solicitação usando o parâmetro `VocabularyFilterFileUri`.

```
{
  "VocabularyFilterName": "my-first-vocabulary-filter",
  "LanguageCode": "en-US",
  "VocabularyFilterFileUri": "s3://amzn-s3-demo-bucket/my-vocabulary-filters/my-vocabulary-filter.txt"
}
```

**nota**  
Se você incluir `VocabularyFilterFileUri` na solicitação, não poderá usar `Words`; você deve escolher um ou outro.

### AWS SDK para Python (Boto3)
<a name="vocab-filter-create-python-batch"></a>

Este exemplo usa o AWS SDK para Python (Boto3) para criar um filtro de vocabulário personalizado usando o método [create\$1vocabulary\$1filter](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/transcribe.html#TranscribeService.Client.create_vocabulary_filter). Para obter mais informações, consulte [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabularyFilter.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabularyFilter.html).

Para ver exemplos adicionais de uso dos SDKs da AWS, bem como exemplos específicos de recursos, cenários e entre serviços, consulte o capítulo [Exemplos de código para o Amazon Transcribe usando AWS SDKs](service_code_examples.md).

**Opção 1**: você pode incluir sua lista de palavras na solicitação usando o parâmetro `Words`.

```
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
vocab_name = "my-first-vocabulary-filter"
response = transcribe.create_vocabulary_filter(
    LanguageCode = 'en-US',
    VocabularyFilterName = vocab_name,
    Words = [        
        'profane','offensive','Amazon','Transcribe'
    ]
)
```

**Opção 2**: você pode salvar sua lista de palavras como um arquivo de texto e enviá-la a um bucket do Amazon S3 e, em seguida, incluir o URI do arquivo na solicitação usando o parâmetro `VocabularyFilterFileUri`.

```
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
vocab_name = "my-first-vocabulary-filter"
response = transcribe.create_vocabulary_filter(
    LanguageCode = 'en-US',
    VocabularyFilterName = vocab_name,
    VocabularyFilterFileUri = 's3://amzn-s3-demo-bucket/my-vocabulary-filters/my-vocabulary-filter.txt'
)
```

**nota**  
Se você incluir `VocabularyFilterFileUri` na solicitação, não poderá usar `Words`; você deve escolher um ou outro.

**nota**  
Se você criar um bucket do Amazon S3 para os arquivos de filtro de vocabulário personalizado, verifique se o perfil do IAM que está fazendo a solicitação [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabularyFilter.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabularyFilter.html) tem permissões para acessar esse bucket. Se o perfil não tiver as permissões corretas, sua solicitação falhará. Opcionalmente, você pode especificar um perfil do IAM em sua solicitação incluindo o parâmetro `DataAccessRoleArn`. Para obter mais informações sobre políticas e perfis do IAM no Amazon Transcribe, consulte [Amazon Transcribe exemplos de políticas baseadas em identidade](security_iam_id-based-policy-examples.md).