

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Erstellen eines Wortschatzfilters
<a name="vocabulary-filter-create"></a>

Es gibt zwei Möglichkeiten, einen benutzerdefinierten Wortschatzfilter zu erstellen:

1. Speichern Sie eine Liste von zeilengetrennten Wörtern als reine Textdatei mit UTF-8-Kodierung.
   + Sie können diesen Ansatz mit dem AWS-Managementkonsole AWS CLI, oder verwenden AWS SDKs.
   + Wenn Sie den verwenden AWS-Managementkonsole, können Sie einen lokalen Pfad oder eine Amazon S3 URI für Ihre benutzerdefinierte Vokabeldatei angeben.
   + Wenn Sie das AWS CLI oder verwenden AWS SDKs, müssen Sie Ihre benutzerdefinierte Vokabeldatei in einen Amazon S3 Bucket hochladen und den Amazon S3 URI in Ihre Anfrage aufnehmen.

1. Fügen Sie eine Liste mit kommagetrennten Wörtern direkt in Ihre API-Anfrage ein.
   + Sie können diesen Ansatz mit dem AWS CLI oder AWS SDKs mithilfe des [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabularyFilter.html#transcribe-CreateVocabularyFilter-request-Words](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabularyFilter.html#transcribe-CreateVocabularyFilter-request-Words)Parameters verwenden.

Beispiele für die einzelnen Methoden finden Sie unter [Erstellen benutzerdefinierter Wortschatzfilter](#vocabulary-filtering-create-examples)

Das sollten Sie bei der Erstellung Ihres benutzerdefinierten Wortschatzfilters beachten:
+ Bei Wörtern wird nicht zwischen Groß- und Kleinschreibung unterschieden. Zum Beispiel werden „curse“ und „CURSE“ gleich behandelt.
+ Es werden nur exakte Wortübereinstimmungen gefiltert. Wenn Ihr Filter z. B. „swear“ enthält, Ihre Medien aber das Wort „swears“ oder „swearing“ enthalten, werden diese nicht gefiltert. Es werden nur Instanzen von „swear“ gefiltert. Sie müssen daher alle Varianten der Wörter, die Sie filtern möchten, einbeziehen.
+ Die Filter gelten nicht für Wörter, die in anderen Wörtern enthalten sind. Wenn beispielsweise ein benutzerdefinierter Wortschatzfilter „Boot“, aber nicht „U-Boot“ enthält, wird „U-Boot“ im Transkript nicht geändert. 
+ Jeder Eintrag darf nur ein Wort enthalten (keine Leerzeichen).
+ Wenn Sie Ihren benutzerdefinierten Wortschatzfilter als Textdatei speichern, muss er im Klartextformat mit UTF-8-Kodierung vorliegen.
+ Sie können jeweils bis zu 100 benutzerdefinierte Vokabelfilter verwenden AWS-Konto , die jeweils bis zu 50 KB groß sein können.
+ Sie können nur Zeichen verwenden, die für Ihre Sprache unterstützt werden. Einzelheiten dazu finden Sie im [Zeichensatz](charsets.md) Ihrer Sprache.

## Erstellen benutzerdefinierter Wortschatzfilter
<a name="vocabulary-filtering-create-examples"></a>

In den folgenden Beispielen erfahren Sie Amazon Transcribe, wie Sie einen benutzerdefinierten Vokabelfilter für die Verwendung mit verarbeiten können:

### AWS-Managementkonsole
<a name="vocab-filter-create-console-batch"></a>

Bevor Sie fortfahren, speichern Sie Ihren benutzerdefinierten Wortschatzfilter als Textdatei (\$1.txt). Sie können Ihre Datei optional in einen Amazon S3 Bucket hochladen.

1. Melden Sie sich an der [AWS-Managementkonsole](https://console.aws.amazon.com/transcribe/) an.

1. Wählen Sie im Navigationsbereich die Option **Vokabularfilter** aus. Dadurch wird die Seite **Wortschatzfilter** geöffnet, auf der Sie vorhandene benutzerdefinierte Wortschatzfilter anzeigen oder neue Filter erstellen können.

1. Wählen Sie **Wortschatzfilter erstellen**.  
![\[Amazon Transcribe Konsolen-Screenshot: Die Seite mit den „Vokabelfiltern“.\]](http://docs.aws.amazon.com/de_de/transcribe/latest/dg/images/vocab-filter-create-console.png)

   Sie gelangen auf die Seite **Wortschatzfilter erstellen**. Geben Sie einen Namen für Ihren neuen benutzerdefinierten Wortschatzfilter ein.

   Wählen Sie unter **Eingabequelle für den Wortschatz** die Option **Datei-Upload** oder **S3-Speicherort**. Geben Sie dann den Speicherort für Ihre benutzerdefinierte Vokabulardatei an.  
![\[Amazon Transcribe Konsolen-Screenshot: Die Seite „Vokabelfilter erstellen“.\]](http://docs.aws.amazon.com/de_de/transcribe/latest/dg/images/vocab-filter-create-console-upload.png)

1. Optional können Sie Ihrem benutzerdefinierten Wortschatzfilter Tags hinzufügen. Sobald Sie alle Felder ausgefüllt haben, wählen Sie unten auf der Seite **Wortschatzfilter erstellen**. Wenn bei der Bearbeitung Ihrer Datei keine Fehler aufgetreten sind, gelangen Sie zurück zur Seite **Wortschatzfilter**.

   Ihr benutzerdefinierter Wortschatzfilter ist nun einsatzbereit.

### AWS CLI
<a name="vocab-filter-create-cli"></a>

In diesem Beispiel wird der [create-vocabulary-filter](https://docs.aws.amazon.com/cli/latest/reference/transcribe/create-vocabulary-filter.html)Befehl verwendet, um eine Wortliste in einen nutzbaren benutzerdefinierten Vokabelfilter umzuwandeln. Weitere Informationen finden Sie unter [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabularyFilter.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabularyFilter.html).

**Option 1**: Sie können Ihre Wortliste mit dem Parameter `words` in Ihre Anfrage aufnehmen.

```
aws transcribe create-vocabulary-filter \ 
--vocabulary-filter-name my-first-vocabulary-filter \ 
--language-code en-US \ 
--words profane,offensive,Amazon,Transcribe
```

**Option 2**: Sie können Ihre Wortliste als Textdatei speichern und in einen Amazon S3 -Bucket hochladen und dann den URI der Datei mit dem Parameter `vocabulary-filter-file-uri` in Ihre Anfrage aufnehmen.

```
aws transcribe create-vocabulary-filter \ 
--vocabulary-filter-name my-first-vocabulary-filter \ 
--language-code en-US \ 
--vocabulary-filter-file-uri s3://amzn-s3-demo-bucket/my-vocabulary-filters/my-vocabulary-filter.txt
```

Hier ist ein weiteres Beispiel, in dem der [create-vocabulary-filter](https://docs.aws.amazon.com/cli/latest/reference/transcribe/create-vocabulary-filter.html)Befehl verwendet wird, und ein Anfragetext, der Ihren benutzerdefinierten Vokabelfilter erstellt.

```
aws transcribe create-vocabulary-filter \
--cli-input-json file://filepath/my-first-vocab-filter.json
```

Die Datei *my-first-vocab-filter.json* enthält den folgenden Anfragetext.

**Option 1**: Sie können Ihre Wortliste mit dem Parameter `Words` in Ihre Anfrage aufnehmen.

```
{
  "VocabularyFilterName": "my-first-vocabulary-filter",
  "LanguageCode": "en-US",
  "Words": [
        "profane","offensive","Amazon","Transcribe"
  ]
}
```

**Option 2**: Sie können Ihre Wortliste als Textdatei speichern und in einen Amazon S3 -Bucket hochladen und dann den URI der Datei mit dem Parameter `VocabularyFilterFileUri` in Ihre Anfrage aufnehmen.

```
{
  "VocabularyFilterName": "my-first-vocabulary-filter",
  "LanguageCode": "en-US",
  "VocabularyFilterFileUri": "s3://amzn-s3-demo-bucket/my-vocabulary-filters/my-vocabulary-filter.txt"
}
```

**Anmerkung**  
Wenn Sie `VocabularyFilterFileUri` in Ihrer Anfrage angeben, können Sie nicht `Words` verwenden. Sie müssen entweder das eine oder das andere wählen.

### AWS SDK für Python (Boto3)
<a name="vocab-filter-create-python-batch"></a>

In diesem Beispiel wird mithilfe der Methode AWS SDK für Python (Boto3) [create\$1vocabulary\$1filter](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/transcribe.html#TranscribeService.Client.create_vocabulary_filter) ein benutzerdefinierter Vokabelfilter erstellt. Weitere Informationen finden Sie unter [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabularyFilter.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabularyFilter.html).

Weitere Beispiele für die Verwendung der AWS SDKs, einschließlich funktionsspezifischer, szenarienspezifischer und serviceübergreifender Beispiele, finden Sie im Kapitel. [Codebeispiele für Amazon Transcribe mit AWS SDKs](service_code_examples.md)

**Option 1**: Sie können Ihre Wortliste mit dem Parameter `Words` in Ihre Anfrage aufnehmen.

```
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
vocab_name = "my-first-vocabulary-filter"
response = transcribe.create_vocabulary_filter(
    LanguageCode = 'en-US',
    VocabularyFilterName = vocab_name,
    Words = [        
        'profane','offensive','Amazon','Transcribe'
    ]
)
```

**Option 2**: Sie können Ihre Wortliste als Textdatei speichern und in einen Amazon S3 -Bucket hochladen und dann den URI der Datei mit dem Parameter `VocabularyFilterFileUri` in Ihre Anfrage aufnehmen.

```
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
vocab_name = "my-first-vocabulary-filter"
response = transcribe.create_vocabulary_filter(
    LanguageCode = 'en-US',
    VocabularyFilterName = vocab_name,
    VocabularyFilterFileUri = 's3://amzn-s3-demo-bucket/my-vocabulary-filters/my-vocabulary-filter.txt'
)
```

**Anmerkung**  
Wenn Sie `VocabularyFilterFileUri` in Ihrer Anfrage angeben, können Sie nicht `Words` verwenden. Sie müssen entweder das eine oder das andere wählen.

**Anmerkung**  
Wenn Sie einen neuen Amazon S3 Bucket für Ihre benutzerdefinierten Vokabelfilterdateien erstellen, stellen Sie sicher, dass die IAM Rolle, die die [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabularyFilter.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabularyFilter.html)Anfrage stellt, über Zugriffsberechtigungen für diesen Bucket verfügt. Wenn die Rolle nicht über die richtigen Berechtigungen verfügt, schlägt Ihre Anfrage fehl. Sie können optional eine IAM Rolle in Ihrer Anfrage angeben, indem Sie den `DataAccessRoleArn` Parameter angeben. Weitere Informationen zu IAM Rollen und Richtlinien finden Sie unter[Amazon Transcribe Beispiele für identitätsbasierte Politik](security_iam_id-based-policy-examples.md). Amazon Transcribe