

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Création d’un filtre de vocabulaire
<a name="vocabulary-filter-create"></a>

Vous avez deux options à votre disposition pour créer un filtre de vocabulaire personnalisé :

1. Enregistrez une liste de mots séparés par des lignes sous forme de fichier texte brut encodé en UTF-8.
   + Vous pouvez utiliser cette approche avec le AWS Management Console AWS CLI, ou AWS SDKs.
   + Si vous utilisez le AWS Management Console, vous pouvez fournir un chemin local ou une Amazon S3 URI pour votre fichier de vocabulaire personnalisé.
   + Si vous utilisez le AWS CLI ou AWS SDKs, vous devez télécharger votre fichier de vocabulaire personnalisé dans un Amazon S3 bucket et inclure l' Amazon S3 URI dans votre demande.

1. Incluez une liste de mots séparés par des virgules directement dans votre demande d’API.
   + Vous pouvez utiliser cette approche avec le paramètre AWS CLI ou AWS SDKs à l'aide du [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabularyFilter.html#transcribe-CreateVocabularyFilter-request-Words](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabularyFilter.html#transcribe-CreateVocabularyFilter-request-Words)paramètre.

Pour des exemples de chaque méthode, consultez la section [Création de filtres de vocabulaire personnalisé](#vocabulary-filtering-create-examples).

Points à prendre en compte lors de la création de votre filtre de vocabulaire personnalisé :
+ Les mots ne sont pas sensibles à la casse. Par exemple, « course » et « COURSE » sont traités de la même manière.
+ Seules les correspondances de mots exactes sont filtrées. Par exemple, si votre filtre inclut « juron » mais que votre média contient le mot « jurons » ou « jurer », ceux-ci ne sont pas filtrés. Seules les occurrences de « juron » sont filtrées. Vous devez donc inclure toutes les variantes des mots que vous souhaitez filtrer.
+ Les filtres ne s’appliquent pas aux mots contenus dans d’autres termes. Par exemple, si un filtre de vocabulaire contient « marin », mais pas « sous-marin », « sous-marin » n’est pas modifié dans la transcription. 
+ Chaque entrée ne peut contenir qu’un seul mot (sans espaces).
+ Si vous enregistrez votre filtre de vocabulaire personnalisé sous forme de fichier texte, il doit être au format texte brut avec encodage UTF-8.
+ Vous pouvez avoir jusqu'à 100 Compte AWS filtres de vocabulaire personnalisés chacun, d'une taille maximale de 50 Ko.
+ Vous ne pouvez utiliser que des caractères pris en charge pour votre langue. Reportez-vous au [jeu de caractères](charsets.md) de votre langue pour plus de détails.

## Création de filtres de vocabulaire personnalisé
<a name="vocabulary-filtering-create-examples"></a>

Pour traiter un filtre de vocabulaire personnalisé à utiliser avec Amazon Transcribe, consultez les exemples suivants :

### AWS Management Console
<a name="vocab-filter-create-console-batch"></a>

Avant de continuer, enregistrez votre filtre de vocabulaire personnalisé sous forme de fichier texte (\$1.txt). Vous pouvez éventuellement charger votre fichier dans un Amazon S3 bucket.

1. Connectez-vous à la [AWS Management Console](https://console.aws.amazon.com/transcribe/).

1. Dans le panneau de navigation, choisissez **Filtrage du vocabulaire**. La page **Filtres de vocabulaire** s’ouvre. Elle vous permet de consulter les filtres de vocabulaire personnalisé existants ou d’en créer un nouveau.

1. Sélectionnez **Créer un filtre de vocabulaire**.  
![\[Amazon Transcribe capture d'écran de la console : la page « filtres de vocabulaire ».\]](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/images/vocab-filter-create-console.png)

   Vous accédez alors à la page **Créer un filtre de vocabulaire**. Entrez un nom pour votre nouveau filtre de vocabulaire personnalisé.

   Sélectionnez l’option **Chargement de fichiers** ou **Emplacement S3** sous **Source d’entrée de vocabulaire**. Spécifiez ensuite l’emplacement de votre fichier de vocabulaire personnalisé.  
![\[Amazon Transcribe capture d'écran de la console : la page « créer un filtre de vocabulaire ».\]](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/images/vocab-filter-create-console-upload.png)

1. Vous pouvez éventuellement ajouter des balises à votre filtre de vocabulaire personnalisé. Une fois que vous avez rempli tous les champs, sélectionnez **Créer un filtre de vocabulaire** en bas de la page. S’il n’y a aucune erreur lors du traitement de votre fichier, vous revenez à la page **Filtres de vocabulaire**.

   Votre filtre de vocabulaire personnalisé est maintenant prêt à être utilisé.

### AWS CLI
<a name="vocab-filter-create-cli"></a>

Cet exemple utilise la [create-vocabulary-filter](https://docs.aws.amazon.com/cli/latest/reference/transcribe/create-vocabulary-filter.html)commande pour transformer une liste de mots en un filtre de vocabulaire personnalisé utilisable. Pour de plus amples informations, veuillez consulter [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabularyFilter.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabularyFilter.html).

**Option 1** : vous pouvez inclure votre liste de mots à votre demande à l’aide du paramètre `words`.

```
aws transcribe create-vocabulary-filter \ 
--vocabulary-filter-name my-first-vocabulary-filter \ 
--language-code en-US \ 
--words profane,offensive,Amazon,Transcribe
```

**Option 2** : vous pouvez enregistrer votre liste de mots sous forme de fichier texte et la télécharger dans un compartiment Amazon S3 , puis inclure l’URI du fichier à votre demande à l’aide du paramètre `vocabulary-filter-file-uri`.

```
aws transcribe create-vocabulary-filter \ 
--vocabulary-filter-name my-first-vocabulary-filter \ 
--language-code en-US \ 
--vocabulary-filter-file-uri s3://amzn-s3-demo-bucket/my-vocabulary-filters/my-vocabulary-filter.txt
```

Voici un autre exemple d'utilisation de la [create-vocabulary-filter](https://docs.aws.amazon.com/cli/latest/reference/transcribe/create-vocabulary-filter.html)commande et d'un corps de requête qui crée votre filtre de vocabulaire personnalisé.

```
aws transcribe create-vocabulary-filter \
--cli-input-json file://filepath/my-first-vocab-filter.json
```

Le fichier *my-first-vocab-filter.json* contient le corps de requête suivant.

**Option 1** : vous pouvez inclure votre liste de mots à votre demande à l’aide du paramètre `Words`.

```
{
  "VocabularyFilterName": "my-first-vocabulary-filter",
  "LanguageCode": "en-US",
  "Words": [
        "profane","offensive","Amazon","Transcribe"
  ]
}
```

**Option 2** : vous pouvez enregistrer votre liste de mots sous forme de fichier texte et la télécharger dans un compartiment Amazon S3 , puis inclure l’URI du fichier à votre demande à l’aide du paramètre `VocabularyFilterFileUri`.

```
{
  "VocabularyFilterName": "my-first-vocabulary-filter",
  "LanguageCode": "en-US",
  "VocabularyFilterFileUri": "s3://amzn-s3-demo-bucket/my-vocabulary-filters/my-vocabulary-filter.txt"
}
```

**Note**  
Si vous incluez `VocabularyFilterFileUri` à votre demande, vous ne pouvez pas utiliser `Words` ; vous devez choisir l’un ou l’autre.

### AWS SDK pour Python (Boto3)
<a name="vocab-filter-create-python-batch"></a>

Cet exemple utilise le AWS SDK pour Python (Boto3) pour créer un filtre de vocabulaire personnalisé à l'aide de la méthode [create\$1vocabulary\$1filter](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/transcribe.html#TranscribeService.Client.create_vocabulary_filter). Pour de plus amples informations, veuillez consulter [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabularyFilter.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabularyFilter.html).

Pour des exemples supplémentaires utilisant le AWS SDKs, notamment des exemples spécifiques aux fonctionnalités, des scénarios et des exemples multiservices, reportez-vous au chapitre. [Exemples de code pour Amazon Transcribe à l'aide de AWS SDKs](service_code_examples.md)

**Option 1** : vous pouvez inclure votre liste de mots à votre demande à l’aide du paramètre `Words`.

```
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
vocab_name = "my-first-vocabulary-filter"
response = transcribe.create_vocabulary_filter(
    LanguageCode = 'en-US',
    VocabularyFilterName = vocab_name,
    Words = [        
        'profane','offensive','Amazon','Transcribe'
    ]
)
```

**Option 2** : vous pouvez enregistrer votre liste de mots sous forme de fichier texte et la télécharger dans un compartiment Amazon S3 , puis inclure l’URI du fichier à votre demande à l’aide du paramètre `VocabularyFilterFileUri`.

```
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
vocab_name = "my-first-vocabulary-filter"
response = transcribe.create_vocabulary_filter(
    LanguageCode = 'en-US',
    VocabularyFilterName = vocab_name,
    VocabularyFilterFileUri = 's3://amzn-s3-demo-bucket/my-vocabulary-filters/my-vocabulary-filter.txt'
)
```

**Note**  
Si vous incluez `VocabularyFilterFileUri` à votre demande, vous ne pouvez pas utiliser `Words` ; vous devez choisir l’un ou l’autre.

**Note**  
Si vous créez un nouveau Amazon S3 compartiment pour vos fichiers de filtres de vocabulaire personnalisés, assurez-vous que le IAM rôle à l'origine de la [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabularyFilter.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabularyFilter.html)demande est autorisé à accéder à ce compartiment. Si le rôle ne dispose pas des autorisations appropriées, votre demande échoue. Vous pouvez éventuellement spécifier un IAM rôle dans votre demande en incluant le `DataAccessRoleArn` paramètre. Pour plus d'informations sur IAM les rôles et les politiques dans Amazon Transcribe, voir[Amazon Transcribe exemples de politiques basées sur l'identité](security_iam_id-based-policy-examples.md).