

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# カスタム語彙
<a name="custom-vocabulary"></a>

カスタム語彙を追加して、1 つまたは複数の単語の文字起こし精度を向上させます。これらは通常、ブランド名や頭字語、固有名詞、Amazon Transcribe が正しく表示されない単語など、ドメイン固有の用語です。

カスタム語彙は、サポートされているすべての言語で使用できます。カスタム語彙で使用できるのは、その言語の[文字セット](charsets.md)にリストされている文字だけであることに注意してください。

**重要**  
Amazon Transcribe を使用する場合、お客様はご自身のデータの完全性について責任を負うものとします。機密情報、個人情報 (PII)、または保護対象の医療情報 (PHI) をカスタム語彙に入力しないでください。

カスタム語彙を作成する際の考慮事項
+ カスタム語彙ファイルは AWS アカウント 個につき最大 100 個まで作成できます。
+ カスタム語彙のサイズは 50 KB に制限されます。
+ API を使用してカスタム語彙を作成する場合、語彙ファイルはテキスト (\$1.txt) 形式である必要があります。AWS マネジメントコンソール を使用する場合、語彙ファイルはテキスト (\$1.txt) 形式でもカンマ区切り値 (\$1.csv) 形式でもかまいません。
+ カスタム語彙内の各エントリは 256 文字を超えることはできません。
+ カスタム語彙を使用するには、文字起こしと同じ AWS リージョン で作成されている必要があります。

**ヒント**  
カスタム語彙は、AWS マネジメントコンソール を使用してテストできます。カスタム語彙が使用できるようになったら、AWS マネジメントコンソール にログインして [**リアルタイム文字起こし**] を選択し、[**カスタマイズ**] までスクロールして [**カスタム語彙**] をオンにし、ドロップダウンリストから [カスタム語彙] を選択します。次に [**ストリーミングを開始する**] を選択します。カスタム語彙のいくつかの単語をマイクに向かって話し、正しくレンダリングされるかどうかを確認します。

## カスタム語彙テーブルとリスト
<a name="custom-vocabulary-tables-lists"></a>

**重要**  
リスト形式のカスタム語彙は廃止される予定です。新しいカスタム語彙を作成する場合は、[テーブル形式](custom-vocabulary-create-table.md)を使用してください。

テーブルを使用すると、カスタム語彙内の単語の入出力に対するオプションがより多くなり、より詳細に制御できます。テーブルでは、出力を微調整できるように、複数のカテゴリ (Phrase and DisplayAs) を指定する必要があります。

リストには追加のオプションがないため、入力できるのは文字起こしに表示したいエントリのみで、スペースはすべてハイフンに置き換えます。

AWS マネジメントコンソール、AWS CLI、AWS SDK すべて同じ方法でカスタム語彙テーブルを使用します。リストは各手法で使用方法が異なるため、メソッド間で正常に使用するには、追加の書式設定が必要になる場合があります。

詳細については、「[テーブルを使用してカスタム語彙を作成する](custom-vocabulary-create-table.md)」および「[リストを使用してカスタム語彙を作成する](custom-vocabulary-create-list.md)」を参照してください。

もう少し深く掘り下げて、カスタム語彙で Amazon Augmented AI を使用する方法を学ぶには、以下を参照してください。

[![AWS Videos](http://img.youtube.com/vi/https://www.youtube.com/embed/65eVesNiJzY/0.jpg)](http://www.youtube.com/watch?v=https://www.youtube.com/embed/65eVesNiJzY)


**カスタム語彙に固有の API オペレーション**  
 [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html), [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_DeleteVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_DeleteVocabulary.html), [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_GetVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_GetVocabulary.html), [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_ListVocabularies.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_ListVocabularies.html), [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_UpdateVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_UpdateVocabulary.html) 

# テーブルを使用してカスタム語彙を作成する
<a name="custom-vocabulary-create-table"></a>

カスタム語彙を作成するには、テーブル形式を使用することをおすすめします。語彙テーブルは 4 つの (Phrase, SoundsLike, IPA, and DisplayAs) 列で構成されている必要があり、どの順序でも含めることができます。


| フレーズ | SoundsLike | IPA | DisplayAs | 
| --- | --- | --- | --- | 
|  必須。テーブルのすべての行には、この列のエントリが含まれている必要があります。 この列にはスペースを使用しないでください。 エントリに複数の単語が含まれている場合は、各単語をハイフン (-) で区切ります。例えば、**Andorra-la-Vella**、**Los-Angeles** です。 頭字語の場合は、発音する文字をすべてピリオドで区切る必要があります。末尾のピリオドも発音する必要があります。頭字語が複数形の場合は、頭字語と「s」の間にハイフンを使用する必要があります。たとえば、「CLI」は **C.L.I.** (**C.L.I** ではない) で、「ABCs」は **A.B.C.-s** (**A.B.C-s** ではない) です。 フレーズが単語と頭字語の両方で構成されている場合は、これら 2 つの要素をハイフンでつなぐ必要があります。たとえば、「DynamoDB」は **Dynamo-D.B.** です。 この列には数字を含めないでください。数字はスペルアウトする必要があります。たとえば、「VX02Q」は **V.X.-zero-two-Q.** です。  |  `SoundsLike` はカスタム語彙ではサポートされなくなりました。列は空のままにしてください。この列の値はすべて無視されます。今後、この列のサポートは廃止される予定です。  |  `IPA` はカスタム語彙ではサポートされなくなりました。列は空のままにしてください。この列の値はすべて無視されます。今後、この列のサポートは廃止される予定です。  |  オプション。この列の行は空のままでかまいません。 この列にはスペースを使用できます。 文字起こし出力でのエントリの表示方法を定義します。たとえば、`Phrase` 列の **Andorra-la-Vella** は `DisplayAs` 列の **Andorra la Vella** にあります。 この列の行が空の場合、Amazon Transcribe は `Phrase` 列の内容を使用して出力を決定します。 この列には数字 (`0-9`) を含めることができます。  | 

テーブルを作成する際の注意事項
+ テーブルには、必ず 4 つの列ヘッダー (Phrase, SoundsLike, IPA, and DisplayAs) を含めてください。`Phrase` 列には、各行に必ずエントリを含めてください。`IPA` と `SoundsLike` による発音入力機能はサポート終了となりました。これらの列は空のままにしておいてください。これらの列の値はすべて無視されます。
+ 各列は TAB またはカンマ (,) で区切る必要があります。これはカスタム語彙ファイルのすべての行に適用されます。行に空の列がある場合でも、各列に区切り記号 (TAB またはカンマ) を含める必要があります。
+ スペースは `IPA` 列と `DisplayAs` 列のみ使用できます。列を区切るのにスペースを使用しないでください。
+ `IPA` および `SoundsLike` は、カスタム語彙ではサポートされなくなりました。列は空のままにしてください。これらの列の値はすべて無視されます。今後、この列のサポートは廃止される予定です。
+ `DisplayAs` 列は記号と特殊文字 (C\$1\$1 など) をサポートします。他のすべての列は、使用している言語の[文字セット](charsets.md)ページに記載されている文字をサポートします。
+ `Phrase` 列に数字を含めたい場合は、数字をスペルアウトする必要があります。数字 (`0-9`) は `DisplayAs` 列でのみサポートされています。
+ テーブルは `LF` 形式のプレーンテキスト (\$1.txt) ファイルとして保存する必要があります。`CRLF` など、他の形式を使用した場合、カスタム語彙は処理できません。
+ 文字起こしのリクエストに含める前に、カスタム語彙ファイルをAmazon S3 バケットにアップロードし、[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html) バケットを使用して処理する必要があります。手順については、「[カスタム語彙テーブルを作成する](#custom-vocabulary-create-table-examples)」を参照してください。

**注記**  
頭字語など、1 文字ずつ個別に発音する単語は、ピリオド (**A.B.C.**) で区切って 1 文字で入力します。「ABC」のように複数形の頭字語を入力するには、「s」と頭字語をハイフン (**A.B.C.-s**) で区切ります。頭字語の入力には、大文字と小文字のどちらでも使用できます。頭字語はすべての言語には対応していません。「[サポートされている言語および言語固有の機能](supported-languages.md)」を参照してください。

カスタム語彙テーブル (**[TAB]** はタブ文字を表す) の例を以下に示します。

```
Phrase[TAB]SoundsLike[TAB]IPA[TAB]DisplayAs
Los-Angeles[TAB][TAB][TAB]Los Angeles
Eva-Maria[TAB][TAB][TAB]
A.B.C.-s[TAB][TAB][TAB]ABCs
Amazon-dot-com[TAB][TAB][TAB]Amazon.com
C.L.I.[TAB][TAB][TAB]CLI
Andorra-la-Vella[TAB][TAB][TAB]Andorra la Vella
Dynamo-D.B.[TAB][TAB][TAB]DynamoDB
V.X.-zero-two[TAB][TAB][TAB]VX02
V.X.-zero-two-Q.[TAB][TAB][TAB]VX02Q
```

見やすくするために、同じ表に列をそろえて示します。カスタム語彙テーブルの列間にスペースを入れ**ないでください**。前の例のようにテーブルの位置がずれて見えるはずです。

```
Phrase          [TAB]SoundsLike          [TAB]IPA                [TAB]DisplayAs  
Los-Angeles     [TAB]                    [TAB]                   [TAB]Los Angeles   
Eva-Maria       [TAB]                    [TAB]                   [TAB]
A.B.C.-s        [TAB]                    [TAB]                   [TAB]ABCs  
amazon-dot-com  [TAB]                    [TAB]                   [TAB]amazon.com
C.L.I.          [TAB]                    [TAB]                   [TAB]CLI   
Andorra-la-Vella[TAB]                    [TAB]                   [TAB]Andorra la Vella
Dynamo-D.B.     [TAB]                    [TAB]                   [TAB]DynamoDB
V.X.-zero-two   [TAB]                    [TAB]                   [TAB]VX02
V.X.-zero-two-Q.[TAB]                    [TAB]                   [TAB]VX02Q
```

## カスタム語彙テーブルを作成する
<a name="custom-vocabulary-create-table-examples"></a>

Amazon Transcribe で使用するカスタム語彙テーブルを処理するには、以下の例を参照してください。

### AWS マネジメントコンソール
<a name="vocab-create-table-console"></a>

1. [AWS マネジメントコンソール](https://console.aws.amazon.com/transcribe/) にサインインします。

1. ナビゲーションペインで、[**カスタム語彙**] を選択します。**カスタム語彙**のページが開き、既存の語彙の表示したり、新しい語彙を作成したりできます。

1. [**語彙の作成**] を選択します。  
![\[Amazon Transcribe コンソールのスクリーンショット:「カスタム語彙」ページ。\]](http://docs.aws.amazon.com/ja_jp/transcribe/latest/dg/images/vocab-create-console.png)

   「**語彙の作成**」ページに移動します。新しいカスタム語彙の名前を入力します。

   次の 3 つの選択肢があります。

   1. コンピュータから txt または csv ファイルをアップロードします。

      カスタム語彙を一から作成することも、テンプレートをダウンロードして始めることもできます。その後、**語彙の表示と編集**ペインに語彙が自動入力されます。  
![\[Amazon Transcribe コンソールのスクリーンショット:「語彙の作成とインポート」ページ。\]](http://docs.aws.amazon.com/ja_jp/transcribe/latest/dg/images/vocab-create-console-upload.png)

   1. txt または csv ファイルを Amazon S3 の場所からインポートします。

      カスタム語彙を一から作成することも、テンプレートをダウンロードして始めることもできます。完成した語彙ファイルを Amazon S3 バケットにアップロードし、リクエストにその URI を指定します。その後、**語彙の表示と編集**ペインに語彙が自動入力されます。  
![\[Amazon Transcribe コンソールのスクリーンショット:「語彙の作成とインポート」ページ。\]](http://docs.aws.amazon.com/ja_jp/transcribe/latest/dg/images/vocab-create-console-s3.png)

   1. コンソールで語彙を手動で作成します。

      **語彙の表示と編集**ペインまでスクロールし、[**10 行追加**] を選択します。用語を手動で入力できるようになりました。  
![\[Amazon Transcribe コンソールのスクリーンショット:「語彙の作成とインポート」ページ。\]](http://docs.aws.amazon.com/ja_jp/transcribe/latest/dg/images/vocab-create-console-manual.png)

1. **語彙の表示と編集**ペインで語彙を編集できます。変更するには、変更するエントリをクリックします。  
![\[Amazon Transcribe コンソールのスクリーンショット:「語彙の作成と編集」ペイン。\]](http://docs.aws.amazon.com/ja_jp/transcribe/latest/dg/images/vocab-create-edit2.png)

   エラーがあると詳細なエラーメッセージが表示されるので、語彙を処理する前に問題を修正できます。[**語彙の作成**] を選択する前にすべてのエラーを修正しないと、語彙のリクエストは失敗するので注意してください。  
![\[Amazon Transcribe コンソールのスクリーンショット:「語彙の作成と編集」ペイン。\]](http://docs.aws.amazon.com/ja_jp/transcribe/latest/dg/images/vocab-create-edit3.png)

   チェックマーク (✓) を選択して変更を保存するか、「X」を選択して変更を破棄します。

1. オプションで、カスタム語彙にタグを追加します。すべてのフィールドを入力し、語彙に問題がなければ、ページの一番下にある [**語彙の作成**] を選択します。**カスタム語彙**のページに戻ると、カスタム語彙のステータスを確認できます。ステータスが「保留中」から「準備完了」に変わったら、カスタム語彙を文字起こしに使用できます。  
![\[Amazon Transcribe コンソールのスクリーンショット: 処理中の保留状態のカスタム語彙。\]](http://docs.aws.amazon.com/ja_jp/transcribe/latest/dg/images/vocab-create-console-pending.png)

1. ステータスが「失敗」に変わったら、カスタム語彙の名前を選択して、その語彙の情報ページに移動します。  
![\[Amazon Transcribe コンソールのスクリーンショット: 完了した語彙と失敗した語彙が 1 つずつ表示されている「カスタム語彙」ページ。\]](http://docs.aws.amazon.com/ja_jp/transcribe/latest/dg/images/vocab-create-console-failed.png)

   このページの上部には、カスタム語彙が失敗した理由に関する情報が記載された**失敗の理由**バナーがあります。テキストファイルのエラーを修正して、もう一度試してください。  
![\[Amazon Transcribe コンソールのスクリーンショット: 失敗の理由が表示されている語彙の情報ページ。\]](http://docs.aws.amazon.com/ja_jp/transcribe/latest/dg/images/vocab-create-console-failed2.png)

### AWS CLI
<a name="vocab-create-table-cli"></a>

この例では、テーブル形式の語彙ファイルで[語彙の作成](https://docs.aws.amazon.com/cli/latest/reference/transcribe/create-vocabulary.html)コマンドを使用します。詳細については、[ を参照してください。`CreateVocabulary`](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html)

文字起こしジョブで既存のカスタム語彙を使用するには、[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html) オペレーションを呼び出すときに [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html) フィールドに `VocabularyName` を設定するか、AWS マネジメントコンソール から、またはドロップダウンリストから [カスタム語彙] を選択します。

```
aws transcribe create-vocabulary \ 
--vocabulary-name my-first-vocabulary \ 
--vocabulary-file-uri s3://amzn-s3-demo-bucket/my-vocabularies/my-vocabulary-file.txt \
--language-code en-US
```

ここでは、[語彙の作成](https://docs.aws.amazon.com/cli/latest/reference/transcribe/create-vocabulary.html)コマンドと、カスタム語彙を作成するリクエストボディを使用した別の例を示します。

```
aws transcribe create-vocabulary \
--cli-input-json file://filepath/my-first-vocab-table.json
```

ファイル *my-first-vocab-table.json* には、次のリクエストボディが含まれています。

```
{
  "VocabularyName": "my-first-vocabulary",
  "VocabularyFileUri": "s3://amzn-s3-demo-bucket/my-vocabularies/my-vocabulary-table.txt",
  "LanguageCode": "en-US"
}
```

`VocabularyState` を`PENDING` から `READY` に変更すると、カスタム語彙を文字起こしに使用できるようになります。カスタム語彙の現在のステータスを表示するには、以下を実行します。

```
aws transcribe get-vocabulary \
--vocabulary-name my-first-vocabulary
```

### AWS SDK for Python (Boto3)
<a name="vocab-create-table-python-batch"></a>

この例では、[語彙作成](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/transcribe.html#TranscribeService.Client.create_vocabulary)メソッドでテーブルからカスタム語彙を作成し、AWS SDK for Python (Boto3) を使用します。詳細については、[ を参照してください。`CreateVocabulary`](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html)

文字起こしジョブで既存のカスタム語彙を使用するには、[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html) オペレーションを呼び出すときに [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html) フィールドに `VocabularyName` を設定するか、AWS マネジメントコンソール から、またはドロップダウンリストから [カスタム語彙] を選択します。

特徴固有の例、シナリオ例、クロスサービスの例など、AWS SDK を使用するその他の例については、[SDK を使用した Amazon Transcribe のコード例 AWS SDKs](service_code_examples.md) 章を参照してください。

```
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
vocab_name = "my-first-vocabulary"
response = transcribe.create_vocabulary(
    LanguageCode = 'en-US',
    VocabularyName = vocab_name,
    VocabularyFileUri = 's3://amzn-s3-demo-bucket/my-vocabularies/my-vocabulary-table.txt'
)

while True:
    status = transcribe.get_vocabulary(VocabularyName = vocab_name)
    if status['VocabularyState'] in ['READY', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)
```

**注記**  
カスタム語彙ファイル用に新しい Amazon S3 バケットを作成する場合は、[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html) リクエストを行う IAM ロールにこのバケットにアクセスする権限があることを確認してください。ロールに正しいアクセス許可がない場合、リクエストは失敗します。`DataAccessRoleArn` パラメーターを含めることで、リクエスト内で IAM ロールを指定できます。IAM ロールと Amazon Transcribe のポリシー詳細については、「[Amazon Transcribe アイデンティティベースのポリシーの例](security_iam_id-based-policy-examples.md)」を参照してください。

# リストを使用してカスタム語彙を作成する
<a name="custom-vocabulary-create-list"></a>

**重要**  
リスト形式のカスタム語彙は廃止が予定されているため、新しいカスタム語彙を作成する場合は、[テーブル形式](custom-vocabulary-create-table.md)を使用することを強くおすすめします。

AWS マネジメントコンソール、AWS CLI、または AWS SDK を使用してリストからカスタム語彙を作成できます。
+ **AWS マネジメントコンソール**: カスタム語彙を含むテキストファイルを作成してアップロードする必要があります。行区切りまたはカンマ区切りのエントリを使用できます。リストは `LF` 形式のテキスト (\$1.txt) ファイルとして保存する必要があります。`CRLF` などの他の形式を使用した場合、カスタム語彙は Amazon Transcribe では受け入れられません。
+ **AWS CLI** および **AWS SDK**: [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html#transcribe-CreateVocabulary-request-Phrases](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html#transcribe-CreateVocabulary-request-Phrases) フラグを使用して、API コールにカスタム語彙をカンマで区切ったエントリとして含める必要があります。

エントリに複数の単語が含まれている場合は、各単語をハイフンでつなぐ必要があります。たとえば、「ロサンゼルス」を **Los-Angeles**、「アンドララベリャ」を **Andorra-la-Vella** とします。

以下は 2 つの有効なリスト形式の例です。メソッド固有の例については、「[カスタム語彙リストの作成](#custom-vocabulary-create-list-examples)」を参照してください。
+ カンマで区切られたエントリ:

  ```
  Los-Angeles,CLI,Eva-Maria,ABCs,Andorra-la-Vella
  ```
+ 行で区切られたエントリ:

  ```
  Los-Angeles
  CLI
  Eva-Maria
  ABCs
  Andorra-la-Vella
  ```

**重要**  
使用する言語でサポートされている文字のみを使用できます。詳細については、ご使用の言語の「[文字セット](charsets.md)」を参照してください。

カスタム語彙リストは、[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateMedicalVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateMedicalVocabulary.html) オペレーションではサポートされていません。医療用のカスタム語彙を作成する場合は、テーブル形式を使用する必要があります。手順については、「[テーブルを使用してカスタム語彙を作成する](custom-vocabulary-create-table.md)」を参照してください。

## カスタム語彙リストの作成
<a name="custom-vocabulary-create-list-examples"></a>

Amazon Transcribe で使用するカスタム語彙リストを処理するには、以下の例を参照してください。

### AWS CLI
<a name="vocab-create-list-cli"></a>

この例では、リスト形式のカスタム語彙ファイルで[語彙の作成](https://docs.aws.amazon.com/cli/latest/reference/transcribe/create-vocabulary.html)コマンドを使用します。詳細については、[ を参照してください。`CreateVocabulary`](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html)

```
aws transcribe create-vocabulary \ 
--vocabulary-name my-first-vocabulary \ 
--language-code en-US \ 
--phrases {CLI,Eva-Maria,ABCs}
```

ここでは、[語彙の作成](https://docs.aws.amazon.com/cli/latest/reference/transcribe/create-vocabulary.html)コマンドと、カスタム語彙を作成するリクエストボディを使用した別の例を示します。

```
aws transcribe create-vocabulary \
--cli-input-json file://filepath/my-first-vocab-list.json
```

ファイル *my-first-vocab-list.json* には、次のリクエストボディが含まれています。

```
{
  "VocabularyName": "my-first-vocabulary",
  "LanguageCode": "en-US",
  "Phrases": [
        "CLI","Eva-Maria","ABCs"
  ]
}
```

`VocabularyState` を`PENDING` から `READY` に変更すると、カスタム語彙を文字起こしに使用できるようになります。カスタム語彙の現在のステータスを表示するには、以下を実行します。

```
aws transcribe get-vocabulary \
--vocabulary-name my-first-vocabulary
```

### AWS SDK for Python (Boto3)
<a name="vocab-create-list-python-batch"></a>

この例では、[語彙の作成](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/transcribe.html#TranscribeService.Client.create_vocabulary)メソッドでリストからカスタム語彙を作成し、AWS SDK for Python (Boto3) を使用します。詳細については、[ を参照してください。`CreateVocabulary`](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html)

特徴固有の例、シナリオ例、クロスサービスの例など、AWS SDK を使用するその他の例については、[SDK を使用した Amazon Transcribe のコード例 AWS SDKs](service_code_examples.md) 章を参照してください。

```
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
vocab_name = "my-first-vocabulary"
response = transcribe.create_vocabulary(
    LanguageCode = 'en-US',
    VocabularyName = vocab_name,
    Phrases = [
        'CLI','Eva-Maria','ABCs'
    ]
)

while True:
    status = transcribe.get_vocabulary(VocabularyName = vocab_name)
    if status['VocabularyState'] in ['READY', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)
```

**注記**  
カスタム語彙ファイル用に新しい Amazon S3 バケットを作成する場合は、[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateVocabulary.html) リクエストを行う IAM ロールにこのバケットにアクセスする権限があることを確認してください。ロールに正しいアクセス許可がない場合、リクエストは失敗します。`DataAccessRoleArn` パラメーターを含めることで、リクエスト内で IAM ロールを指定できます。IAM ロールと Amazon Transcribe のポリシー詳細については、「[Amazon Transcribe アイデンティティベースのポリシーの例](security_iam_id-based-policy-examples.md)」を参照してください。

# カスタム語彙の使用
<a name="custom-vocabulary-using"></a>

カスタム語彙を作成したら、それを文字起こしのリクエストに含めることができます。例については、以下のセクションを参照してください。

リクエストに含めるカスタム語彙の言語は、メディアに指定した言語コードと一致する必要があります。言語が一致しない場合、カスタム語彙は文字起こしに適用されず、警告やエラーも発生しません。

## バッチ文字起こしでカスタム語彙を使用する
<a name="custom-vocabulary-using-batch"></a>

バッチ文字起こしでカスタム語彙を使用するには、以下の例を参照してください。

### AWS マネジメントコンソール
<a name="vocab-using-console-batch"></a>

1. [AWS マネジメントコンソール](https://console.aws.amazon.com/transcribe/) にサインインします。

1. ナビゲーションペインで、[**文字起こしジョブ**] を選択後、[**ジョブの作成**] (右上) を選択します。これにより、「**ジョブの詳細を指定**」ページが開きます。  
![\[Amazon Transcribe コンソールのスクリーンショット: 「ジョブの詳細を指定」ページ。\]](http://docs.aws.amazon.com/ja_jp/transcribe/latest/dg/images/console-batch-job-details-1.png)

   ジョブに名前を付け、入力メディアを指定します。オプションで、他のフィールドも追加し、[**次へ**] を選択します。

1. **ジョブの設定**ページの下部にある**カスタマイズ**パネルで、**カスタム語彙**をオンに切り替えます。  
![\[Amazon Transcribe コンソールのスクリーンショット: 「ジョブの設定」ページ。\]](http://docs.aws.amazon.com/ja_jp/transcribe/latest/dg/images/console-batch-configure-job-vocab.png)

1. ドロップダウンメニューから [カスタム語彙] を選択します。

   [**ジョブの作成**] を選択して、文字起こしジョブを実行します。

### AWS CLI
<a name="vocab-using-cli"></a>

この例では、[start-transcription-job](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/transcribe/start-transcription-job.html) コマンドと `Settings` パラメータ、`VocabularyName` サブパラメータを使用します。詳細については、「[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html)」および「[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html)」を参照してください。

```
aws transcribe start-transcription-job \
--region us-west-2 \
--transcription-job-name my-first-transcription-job \
--media MediaFileUri=s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac \
--output-bucket-name amzn-s3-demo-bucket \
--output-key my-output-files/ \
--language-code en-US \
--settings VocabularyName=my-first-vocabulary
```

以下は、[start-transcription-job](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/transcribe/start-transcription-job.html) コマンド、およびそのジョブでカスタム語彙を含むリクエストボディを使用した別の例です。

```
aws transcribe start-transcription-job \
--region us-west-2 \
--cli-input-json file://my-first-vocabulary-job.json
```

ファイル *my-first-vocabulary-job.json* には、次のリクエストボディが含まれています。

```
{
  "TranscriptionJobName": "my-first-transcription-job",
  "Media": {
        "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
  },
  "OutputBucketName": "amzn-s3-demo-bucket",
  "OutputKey": "my-output-files/", 
  "LanguageCode": "en-US",
  "Settings": {
        "VocabularyName": "my-first-vocabulary"
   }
}
```

### AWS SDK for Python (Boto3)
<a name="vocab-using-python-batch"></a>

この例では、[transstart\$1transcription\$1job](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/transcribe.html#TranscribeService.Client.start_transcription_job) メソッドの `Settings` 引数で、カスタム言語モデルを含めるために AWS SDK for Python (Boto3) を使用します。詳細については、「[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html)」および「[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html)」を参照してください。

特徴固有の例、シナリオ例、クロスサービスの例など、AWS SDK を使用するその他の例については、[SDK を使用した Amazon Transcribe のコード例 AWS SDKs](service_code_examples.md) 章を参照してください。

```
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
job_name = "my-first-transcription-job"
job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
transcribe.start_transcription_job(
    TranscriptionJobName = job_name,
    Media = {
        'MediaFileUri': job_uri
    },
    OutputBucketName = 'amzn-s3-demo-bucket',
    OutputKey = 'my-output-files/', 
    LanguageCode = 'en-US', 
    Settings = {
        'VocabularyName': 'my-first-vocabulary' 
   }
)

while True:
    status = transcribe.get_transcription_job(TranscriptionJobName = job_name)
    if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)
```

## ストリーミング文字起こしでのカスタム語彙の使用
<a name="custom-vocabulary-using-stream"></a>

ストリーミング文字起こしでカスタム語彙を使用するには、以下の例を参照してください。

### AWS マネジメントコンソール
<a name="vocab-using-console-stream"></a>

1. [AWS マネジメントコンソール](https://console.aws.amazon.com/transcribe/) にサインインします。

1. ナビゲーションペインで、[**リアルタイム文字起こし**] を選択します。**カスタマイズ**までスクロールして、最小化されている場合はこのフィールドを展開します。  
![\[Amazon Transcribe コンソールのスクリーンショット:「リアルタイム文字起こし」ページ。\]](http://docs.aws.amazon.com/ja_jp/transcribe/latest/dg/images/stream-main.png)

1. **カスタム語彙**をオンにして、ドロップダウンメニューから [カスタム語彙] を選択します。  
![\[Amazon Transcribe コンソールのスクリーンショット: 展開された「カスタマイズ」ペイン。\]](http://docs.aws.amazon.com/ja_jp/transcribe/latest/dg/images/vocab-stream2.png)

   ストリームに適用するその他の設定を含めます。

1. これで、ストリームを書き起こす準備ができました。[**ストリーミングを開始する**] を選択し、話し始めます。ディクテーションを終了するには、[**ストリーミングを停止する**] を選択します。

### HTTP/2 ストリーム
<a name="vocab-using-http2"></a>

この例では、カスタム語彙を含む HTTP/2 リクエストを作成します。Amazon Transcribe で HTTP/2 ストリーミングを使用する際の詳細については、「[HTTP/2 ストリームの設定](streaming-setting-up.md#streaming-http2)」を参照してください。Amazon Transcribe に固有のパラメータとヘッダーの詳細については、「[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html)」を参照してください。

```
POST /stream-transcription HTTP/2
host: transcribestreaming.us-west-2.amazonaws.com
X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription
Content-Type: application/vnd.amazon.eventstream
X-Amz-Content-Sha256: string
X-Amz-Date: 20220208T235959Z
Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string
x-amzn-transcribe-language-code: en-US
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000      
x-amzn-transcribe-vocabulary-name: my-first-vocabulary
transfer-encoding: chunked
```

パラメータの定義は [API リファレンス](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Reference.html)にあり、すべての AWS API オペレーションに共通するパラメータは「[共通パラメータ](https://docs.aws.amazon.com/transcribe/latest/APIReference/CommonParameters.html)」セクションに記載されています。

### WebSocket ストリーム
<a name="vocab-using-websocket"></a>

この例では、カスタム語彙を WebSocket ストリームに適用する署名付き URL を作成します。読みやすくするために、改行が追加されています。Amazon Transcribe での WebSocket ストリームの使用の詳細については、「[WebSocket ストリームの設定](streaming-setting-up.md#streaming-websocket)」を参照してください。パラメータの詳細については、「[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html)」を参照してください。

```
GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket?
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=string
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date
&language-code=en-US
&media-encoding=flac
&sample-rate=16000    
&vocabulary-name=my-first-vocabulary
```

パラメータの定義は [API リファレンス](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Reference.html)にあり、すべての AWS API オペレーションに共通するパラメータは「[共通パラメータ](https://docs.aws.amazon.com/transcribe/latest/APIReference/CommonParameters.html)」セクションに記載されています。