

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# 語彙フィルターを作成する
<a name="vocabulary-filter-create"></a>

カスタム語彙フィルターの作成には次の 2 つのオプションがあります。

1. 行で区切られた単語のリストを、UTF-8 エンコーディングのプレーンテキストファイルとして保存する。
   + AWS マネジメントコンソール、AWS CLI または AWS SDK でアプローチを使用できます。
   + AWS マネジメントコンソール を使用する場合は、カスタム語彙ファイルのローカルパスまたは Amazon S3 URI を指定できます。
   + AWS CLI または AWS SDK を使用する場合は、カスタム語彙ファイルを Amazon S3 バケットにアップロードし、Amazon S3 URI をリクエストに含める必要があります。

1. カンマ区切りの単語のリストを API リクエストに直接含めます。
   + このアプローチは [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabularyFilter.html#transcribe-CreateVocabularyFilter-request-Words](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabularyFilter.html#transcribe-CreateVocabularyFilter-request-Words) を使って、AWS CLI、AWS SDK で使用できます。

各方法の例については、「[カスタム語彙フィルターの作成](#vocabulary-filtering-create-examples)」を参照してください。

カスタム語彙フィルターを作成する際の注意事項
+ 単語では、大文字と小文字が区別されません。例えば、「curse」と「CURSE」は同じとみなされます。
+ 完全に一致する単語のみがフィルタリングされます。例えば、フィルターに「swear」が含まれていても、メディアに「swears」または「swearing」という単語が含まれている場合、これらはフィルタリングされません。フィルターの対象となるのは「swear」のインスタンスのみです。そのため、フィルタリングしたい単語のバリエーションをすべて含める必要があります。
+ フィルターは他の単語に含まれる単語には適用されません。例えば、カスタム語彙フィルターに「marine」が含まれていても、「submarine」が含まれていない場合、トランスクリプトでは「submarine」は変更されません。
+ 各エントリには 1 つの単語のみ入力できます (スペースなし)。
+ カスタム語彙フィルターをテキストファイルとして保存する場合は、UTF-8 エンコーディングのプレーンテキスト形式である必要があります。
+ カスタム語彙フィルターは AWS アカウント あたり最大100 個まで設定でき、それぞれのサイズは最大 50 KB です。
+ 使用する言語でサポートされている文字のみを使用できます。詳細については、ご使用の言語の[文字セット](charsets.md)を参照してください。

## カスタム語彙フィルターの作成
<a name="vocabulary-filtering-create-examples"></a>

Amazon Transcribe で使用するカスタム語彙フィルターを処理するには、以下の例を参照してください。

### AWS マネジメントコンソール
<a name="vocab-filter-create-console-batch"></a>

続行する前に、カスタム語彙フィルターをテキスト (\$1.txt) ファイルとして保存してください。オプションでファイルを Amazon S3 バケットにアップロードできます。

1. にサインインします。。[AWS マネジメントコンソール](https://console.aws.amazon.com/transcribe/)

1. ナビゲーションペインで、[**語彙フィルタリング**] を選択します。**語彙フィルター**ページが開き、既存のカスタム語彙フィルタ―を表示したり、新しい語彙フィルターを作成したりできます。

1. [**語彙フィルターの作成**] を選択します。  
![\[Amazon Transcribe コンソールのスクリーンショット:「語彙フィルター」ページ。\]](http://docs.aws.amazon.com/ja_jp/transcribe/latest/dg/images/vocab-filter-create-console.png)

   これにより「**語彙フィルターの作成**」ページに移動します。新しいカスタム語彙フィルターの名前を入力します。

   [**語彙入力ソース**] で [**ファイルアップロード**] または [**S3 ロケーション**] オプションを選択します。次に、カスタム語彙ファイルの場所を指定します。  
![\[Amazon Transcribe コンソールのスクリーンショット:「語彙フィルターの作成」ページ。\]](http://docs.aws.amazon.com/ja_jp/transcribe/latest/dg/images/vocab-filter-create-console-upload.png)

1. オプションで、カスタム語彙フィルターにタグを追加します。すべてのフィールドを入力したら、ページの一番下にある [**語彙フィルターの作成**] を選択します。ファイルの処理中にエラーがなければ、**語彙フィルター**ページに戻ります。

   カスタム語彙フィルターを使用する準備ができました。

### AWS CLI
<a name="vocab-filter-create-cli"></a>

この例では、[create-vocary-filter](https://docs.aws.amazon.com/cli/latest/reference/transcribe/create-vocabulary-filter.html) コマンドを使用して、単語リストを使用可能なカスタム語彙フィルターに加工します。詳細については、[ を参照してください。`CreateVocabularyFilter`](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabularyFilter.html)

**オプション 1**: `words` パラメータを使用して単語リストをリクエストに含めることができます。

```
aws transcribe create-vocabulary-filter \ 
--vocabulary-filter-name my-first-vocabulary-filter \ 
--language-code en-US \ 
--words profane,offensive,Amazon,Transcribe
```

**オプション 2**: 単語リストをテキストファイルとして保存して Amazon S3 バケットにアップロードし、`vocabulary-filter-file-uri` パラメータを使用してファイルの URI をリクエストに含めることができます。

```
aws transcribe create-vocabulary-filter \ 
--vocabulary-filter-name my-first-vocabulary-filter \ 
--language-code en-US \ 
--vocabulary-filter-file-uri s3://amzn-s3-demo-bucket/my-vocabulary-filters/my-vocabulary-filter.txt
```

ここでは、[create-vocabulary-filter](https://docs.aws.amazon.com/cli/latest/reference/transcribe/create-vocabulary-filter.html) コマンドと、カスタム語彙フィルターを作成するリクエストボディを使用した別の例を示します。

```
aws transcribe create-vocabulary-filter \
--cli-input-json file://filepath/my-first-vocab-filter.json
```

ファイル *my-first-vocab-filter.json* には、次のリクエストボディが含まれています。

**オプション 1**: `Words` パラメータを使用して単語リストをリクエストに含めることができます。

```
{
  "VocabularyFilterName": "my-first-vocabulary-filter",
  "LanguageCode": "en-US",
  "Words": [
        "profane","offensive","Amazon","Transcribe"
  ]
}
```

**オプション 2**: 単語リストをテキストファイルとして保存して Amazon S3 バケットにアップロードし、`VocabularyFilterFileUri` パラメータを使用してファイルの URI をリクエストに含めることができます。

```
{
  "VocabularyFilterName": "my-first-vocabulary-filter",
  "LanguageCode": "en-US",
  "VocabularyFilterFileUri": "s3://amzn-s3-demo-bucket/my-vocabulary-filters/my-vocabulary-filter.txt"
}
```

**注記**  
`VocabularyFilterFileUri` をリクエストに含めると、`Words` は使用できません。どちらか一方を選択する必要があります。

### AWS SDK for Python (Boto3)
<a name="vocab-filter-create-python-batch"></a>

この例では、AWS SDK for Python (Boto3) を使用して [create\$1vocabulary\$1filter](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/transcribe.html#TranscribeService.Client.create_vocabulary_filter) メソッドでカスタム語彙フィルターを作成します。詳細については、[ を参照してください。`CreateVocabularyFilter`](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabularyFilter.html)

特徴固有の例、シナリオ例、クロスサービスの例など、AWS SDK を使用するその他の例については、[SDK を使用した Amazon Transcribe のコード例 AWS SDKs](service_code_examples.md) 章を参照してください。

**オプション 1**: `Words` パラメータを使用して単語リストをリクエストに含めることができます。

```
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
vocab_name = "my-first-vocabulary-filter"
response = transcribe.create_vocabulary_filter(
    LanguageCode = 'en-US',
    VocabularyFilterName = vocab_name,
    Words = [        
        'profane','offensive','Amazon','Transcribe'
    ]
)
```

**オプション 2**: 単語リストをテキストファイルとして保存して Amazon S3 バケットにアップロードし、`VocabularyFilterFileUri` パラメータを使用してファイルの URI をリクエストに含めることができます。

```
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
vocab_name = "my-first-vocabulary-filter"
response = transcribe.create_vocabulary_filter(
    LanguageCode = 'en-US',
    VocabularyFilterName = vocab_name,
    VocabularyFilterFileUri = 's3://amzn-s3-demo-bucket/my-vocabulary-filters/my-vocabulary-filter.txt'
)
```

**注記**  
`VocabularyFilterFileUri` をリクエストに含めると、`Words` は使用できません。どちらか一方を選択する必要があります。

**注記**  
カスタム語彙フィルターファイル用に新しい Amazon S3 バケットを作成する場合は、[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabularyFilter.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabularyFilter.html) リクエストを行う IAM ロールにこのバケットにアクセスする権限があることを確認します。ロールに正しいアクセス許可がない場合、リクエストは失敗します。`DataAccessRoleArn` パラメーターを含めることで、リクエスト内で IAM ロールを指定できます。IAM ロールと Amazon Transcribe のポリシー詳細については、「[Amazon Transcribe アイデンティティベースのポリシーの例](security_iam_id-based-policy-examples.md)」を参照してください。