

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# 医療用カスタム語彙による文字起こしの精度の向上
<a name="vocabulary-med"></a>

 Amazon Transcribe Medical の文字起こし精度を向上させるには、1 つ以上の医療カスタム語彙を作成して使用します。*カスタム語彙* は、ドメイン固有の単語またはフレーズのコレクションです。このコレクションは、これらの単語やフレーズを書き起こす際の Amazon Transcribe Medical のパフォーマンスを向上させるのに役立ちます。

 Amazon Transcribe Medical を使用する際、お客様は自身のデータの整合性について責任を負います。カスタム語彙には、機密情報、個人情報 (PII)、または保護対象の医療情報 (PHI) を入力しないでください。

個別の小さなカスタム語彙を作成し、それぞれが特定の音声録音を文字起こしする場合、最良の結果が得られます。すべての録音で使用する大きなカスタム語彙を 1 つ作成した場合よりも、文字起こしの精度が向上します。

デフォルトでは、 に最大 100 個のカスタム語彙を含めることができます AWS アカウント。カスタム語彙のサイズは 50 KB を超えることはできません。に用意できるカスタム語彙数の増加をリクエストする方法については AWS アカウント、[AWS 「サービスクォータ](https://docs.aws.amazon.com/general/latest/gr/aws_service_limits.html)」を参照してください。

カスタム語彙は、アメリカ英語 (en-US) で利用できます。

**Topics**
+ [医療用カスタム語彙のテキストファイルを作成する](create-med-vocab-text.md)
+ [テキストファイルを使用して医療用カスタム語彙を作成する](create-med-custom-vocabulary.md)
+ [医療用カスタム語彙を使用した音声ファイルの文字起こし](start-med-custom-vocab-job.md)
+ [医療用カスタム語彙を使用してリアルタイムストリームを文字起こし](start-med-vocab-stream.md)
+ [Amazon Transcribe Medical の文字セット](charsets-med.md)

# 医療用カスタム語彙のテキストファイルを作成する
<a name="create-med-vocab-text"></a>

カスタム語彙を作成する場合、UTF-8 形式のテキストファイルを作成します。このファイルでは、4 列のテーブルを作成し、各列がフィールドを指定します。各フィールドは、ドメイン固有の用語がどのように発音されるか、または文字起こしにこれらの用語を表示する方法を Amazon Transcribe Medical に伝えます。これらのフィールドを含むテキストファイルは、 Amazon S3 バケットに保存します。

## テキストファイルのフォーマット方法を理解する
<a name="understand-vocab-formatting"></a>

医療用カスタム語彙を作成するには、列名をヘッダー行として入力します。ヘッダー行の下にある各列の値を入力します。

表の 4 つの列の名前を以下に示します。
+  `Phrase`: 列、値は必要です。
+  `IPA`: 列は必須です。値はオプションでもかまいません。
+  `SoundsLike`: 列は必須です。値はオプションでもかまいません。
+  `DisplayAs`: 列は必須です。値はオプションでもかまいません。

カスタム語彙を作成するときは、次のことを必ず実行してください。
+ 各列を 1 つの Tab character Amazon Transcribe で区切ります。列をスペースまたは複数の Tab 文字で区切ろうとすると、エラーメッセージが表示されます。
+ 列内の各値の後に末尾にスペースや空白がないことを確認してください。

各列に入力する値が以下であることを確認します。
+ 256 文字未満 (ハイフンを含む)
+ 文字セットの文字を使用する場合のみ、「[Amazon Transcribe Medical の文字セット](charsets-med.md)」を参照してください。

## テーブルの列の値を入力する
<a name="entering-vocabulary-values-med"></a>

次の情報は、テーブルの 4 つの列の値を指定する方法を示しています。
+ `Phrase` – 認識する必要がある語句。この列には値を入力する必要があります。

  エントリが句の場合、単語はハイフン (-) で区切ります。たとえば、**cerebral autosomal dominant arteriopathy with subcortical infarcts and leukoencephalopathy** を **cerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy** として入力します。

  頭字語、または文字が単一の文字とそれに続くドットとして個別に発音される必要があるその他の単語 (例: **D.N.A.** や **S.T.E.M.I.**) を入力します。「STEMIs」などの頭字語の複数形を入力するには、頭字語と「s」をハイフンで区切ります (**S.T.E.M.I-s**)。頭字語には大文字または小文字を使用できます。

  `Phrase` 列は必須です。入力言語として許可されている文字はいずれも使用できます。使用できる文字については、「[Amazon Transcribe Medical の文字セット](charsets-med.md)」を参照してください。`DisplayAs` 列を指定しない場合、 Amazon Transcribe Medical は出力ファイルの`Phrase`列の内容を使用します。
+ `IPA` (列は必須、値はオプション) – 単語または句の発音を指定するには、[国際音声記号 (IPA)](https://en.wikipedia.org/wiki/International_Phonetic_Alphabet) の文字をこの列に使用することができます。`IPA` 列には、先頭または末尾にスペースを含めることはできません。また、入力の phoneme を区切るには、1 つのスペースを使用する必要があります。たとえば、英語で **acute-respiratory-distress-syndrome** を **ə k j u t ɹ ɛ s p ɪ ɹ ə t ɔ ɹ i d ɪ s t ɹ ɛ s s ɪ n d ɹ oʊ m** と入力したとします。**A.L.L.** には **eɪ ɛ l ɛ l** と入力します。

  `IPA` 列の内容を指定しない場合でも、空白の `IPA` 列を含める必要があります。`IPA` 列に値を含めた場合、`SoundsLike` 列に値を指定することはできません。

  特定の言語で使用できる IPA 文字の一覧については、「[Amazon Transcribe Medical の文字セット](charsets-med.md)」を参照してください。 Amazon Transcribe Medical で使用できる言語は米国英語のみです。
+ `SoundsLike` (列は必須、値はオプション) – 単語や句を小さい断片に分割し、言語の標準的な正書法を使用して各断片の発音を指定することで、単語の発音方法を模倣することができます。たとえば、**cerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy** 句の発音ヒントは **sir-e-brul-aut-o-som-ul-dah-mi-nant-ar-ter-ri-o-pa-thy-with-sub-cor-ti-cul-in-farcts-and-lewk-o-en-ce-phul-ah-pu-thy** のように指定することができます。句 **atrioventricular-nodal-reentrant-tachycardia** のヒントは、**ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia** のようになります。ヒントの各部分はハイフン (-) を使って区切ります。

  `SoundsLike` 列の値を指定しない場合でも、空白の `SoundsLike` 列を含める必要があります。`SoundsLike` 列に値を含めた場合、`IPA` 列に値を指定することはできません。

  入力言語として許可されている文字はいずれも使用できます。許可された文字の一覧については、「[Amazon Transcribe Medical の文字セット](charsets-med.md)」を参照してください。
+ `DisplayAs` (列は必須、値はオプション) : 出力時の単語または句の外観を定義します。たとえば、単語または句が **cerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy** の場合は、ハイフンが表示されないように、`cerebral autosomal dominant arteriopathy with subcortical infarcts and leukoencephalopathy` という形式で表示されるよう指定することができます。また、出力に用語全体ではなく頭字語を表示する場合、`DisplayAs` を `CADASIL` として指定することもできます。

  `DisplayAs` 列を指定しない場合、 Amazon Transcribe Medical は出力の入力ファイルの`Phrase`列を使用します。

  UTF-8 文字はいずれも、`DisplayAs` 列で使用することができます。

`IPA` および `DisplayAs` 列の値にのみスペースを含むことができます。

カスタム語彙のテキストファイルを作成するには、各単語または各語彙を個別の行のテキストファイルに配置します。列はタブ文字で区切ります。`IPA` および `DisplayAs` 列の値にのみスペースを含めます。Medical を使用してカスタム語 Amazon Transcribe 彙を作成する AWS リージョン のと同じ `.txt` の Amazon S3 バケットに、 拡張子が付いたファイルを保存します。

Windows でテキストファイルを編集する場合、ファイルが `CRLF` 形式ではなく `LF` 形式であることを確認してください。そうしないと、カスタム語彙を作成できなくなります。一部のテキストエディタでは、検索コマンドと置換コマンドで書式を変更できます。

次の例は、カスタム語彙の作成に使用できるテキストを示しています。これらの例からカスタム語彙を作成するには、例をテキストエディタにコピーし、`[TAB]` を Tab 文字に置き換えて、保存したテキストファイルを Amazon S3にアップロードします。

```
Phrase[TAB]IPA[TAB]SoundsLike[TAB]DisplayAs
acute-respiratory-distress-syndrome[TAB][TAB][TAB]acute respiratory distress syndrome
A.L.L.[TAB]eɪ ɛ l ɛ l[TAB][TAB]ALL
atrioventricular-nodal-reentrant-tachycardia[TAB][TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB]
```

列は任意の順序で入力できます。次の例は、カスタム語彙入力ファイル の他の有効な構造を 示しています。

```
Phrase[TAB]SoundsLike[TAB]IPA[TAB]DisplayAs
acute-respiratory-distress-syndrome[TAB][TAB][TAB]acute respiratory distress syndrome
A.L.L.[TAB][TAB]eɪ ɛ l ɛ l[TAB]ALL
atrioventricular-nodal-reentrant-tachycardia[TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB][TAB]
```

```
DisplayAs[TAB]SoundsLike[TAB]IPA[TAB]Phrase
acute respiratory distress syndrome[TAB][TAB][TAB]acute-respiratory-distress-syndrome
ALL[TAB][TAB]eɪ ɛ l ɛ l[TAB]A.L.L.
[TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB][TAB]atrioventricular-nodal-reentrant-tachycardia
```

読みやすくするために、次の表は、上記の例をより明確に html 形式で示しています。これらは、例の説明のみが目的です。


| フレーズ | IPA | SoundsLike | DisplayAs | 
| --- | --- | --- | --- | 
| acute-respiratory-distress-syndrome |  |  | acute respiratory distress syndrome | 
| A.L.L. | eɪ ɛ l ɛ l |  | ALL | 
| atrioventricular-nodal-reentrant-tachycardia |  | ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia |  | 


| フレーズ | SoundsLike | IPA | DisplayAs | 
| --- | --- | --- | --- | 
| acute-respiratory-distress-syndrome |  |  | acute respiratory distress syndrome | 
| atrioventricular-nodal-reentrant-tachycardia | ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia |  |  | 
| A.L.L。 |  | eɪ ɛ l ɛ l | すべて | 


| DisplayAs | SoundsLike | IPA | フレーズ | 
| --- | --- | --- | --- | 
| acute respiratory distress syndrome |  |  | acute-respiratory-distress-syndrome | 
| ALL |  | eɪ ɛ l ɛ l | A.L.L。 | 
|  | ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia |  | atrioventricular-nodal-reentrant-tachycardia | 

# テキストファイルを使用して医療用カスタム語彙を作成する
<a name="create-med-custom-vocabulary"></a>

カスタム語彙を作成するには、単語またはフレーズのコレクションを含むテキストファイルを準備しておく必要があります。 Amazon Transcribe Medical はこのテキストファイルを使用して、それらの単語またはフレーズの文字起こし精度を向上させるために使用できるカスタム語彙を作成します。[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateMedicalVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateMedicalVocabulary.html) API または Amazon Transcribe Medical コンソールを使用してカスタム語彙を作成できます。

## AWS マネジメントコンソール
<a name="create-med-custom-vocab-console"></a>

を使用してカスタム語 AWS マネジメントコンソール 彙を作成するには、単語またはフレーズを含むテキストファイルの Amazon S3 URI を指定します。

1. [AWS マネジメントコンソール](https://console.aws.amazon.com/transcribe/) にサインインします。

1. ナビゲーションペインの Amazon Transcribe Medical で、**カスタム語**彙を選択します。

1. **名前** を使用する場合、**語彙の設定**で、カスタム語彙の名前を選択します。

1.  Amazon S3で音声ファイルまたはビデオファイルの場所を指定します。
   + **語彙の設定** の **S3 の語彙入力ファイルの場所**で、カスタムボキャブラリーの作成に使用するテキストファイルを識別する Amazon S3 URI を指定します。
   + **S3 の語彙入力ファイルの場所**については、**S3 の参照** を選択してテキストファイルを参照し、それを選択します。

1. [**語彙の作成**] を選択します。

カスタム語彙の処理ステータスが AWS マネジメントコンソールで確認できます。

## API
<a name="create-med-custom-vocab-api"></a>

**医療用カスタム語彙を作成 (API)するには**
+ [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html) API では、以下のものを指定します。

  1. `LanguageCode` の場合、`en-US` を指定します。

  1. では`VocabularyFileUri`、カスタム語彙の定義に使用するテキストファイル Amazon S3 の場所を指定します。

  1. `VocabularyName` の場合、カスタム語彙の名前を指定します。指定する名前は、 内で一意である必要があります AWS アカウント。

カスタム語彙の処理状況を表示する場合、[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_GetMedicalVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_GetMedicalVocabulary.html) API を使用します。

以下は、 を使用してカスタム語 AWS SDK for Python (Boto3) 彙を作成するリクエストの例です。

```
from __future__ import print_function
import time
import boto3  
transcribe = boto3.client('transcribe', 'us-west-2')
vocab_name = "my-first-vocabulary"
response = transcribe.create_medical_vocabulary(
    VocabularyName = job_name,
    VocabularyFileUri = 's3://amzn-s3-demo-bucket/my-vocabularies/my-vocabulary-table.txt'
    LanguageCode = 'en-US',
  )
  
while True:
    status = transcribe.get_medical_vocabulary(VocabularyName = vocab_name)
    if status['VocabularyState'] in ['READY', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)
```

## AWS CLI
<a name="create-med-custom-vocab-cli"></a>

**バッチ文字起こしジョブ (AWS CLI) で、スピーカーパーティショニングを有効にする**
+ 以下のコードを実行します。

  ```
  aws transcribe create-medical-vocabulary \
  --vocabulary-name my-first-vocabulary \ 
  --vocabulary-file-uri s3://amzn-s3-demo-bucket/my-vocabularies/my-vocabulary-file.txt \
  --language-code en-US
  ```

# 医療用カスタム語彙を使用した音声ファイルの文字起こし
<a name="start-med-custom-vocab-job"></a>

[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html) または を使用して AWS マネジメントコンソール 、文字起こしの精度を向上させるためにカスタム語彙を使用する文字起こしジョブを開始します。

## AWS マネジメントコンソール
<a name="start-med-custom-vocab-job-console"></a>

1. [AWS マネジメントコンソール](https://console.aws.amazon.com/transcribe/) にサインインします。

1. ナビゲーションペインの Amazon Transcribe Medical で、**文字起こしジョブ**を選択します。

1. **[ジョブの作成]** を選択します。

1. [**ジョブの詳細を指定する**] ページで、文字起こしジョブに関する情報を入力します。

1. [**次へ**] を選択します。

1. **カスタマイズ**で、**カスタム語彙**を有効にします。

1. **語彙選択**で、カスタム語彙を選択します。

1. **[作成]** を選択します。

## API
<a name="start-med-custom-vocab-api"></a>

**バッチ文字起こしジョブ (API) を使用して音声ファイル内のスピーカーパーティショニングを有効にするには**
+ [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html) API では、以下のものを指定します。

  1. `MedicalTranscriptionJobName` の場合、 AWS アカウントで一意の名前を指定します。

  1. `LanguageCode` として、音声ファイルで話されている言語と語彙フィルターの言語に対応する言語コードを指定します。

  1. `MediaFileUri` オブジェクトの `Media` パラメータの場合、文字起こしを行う音声ファイルの名前を指定します。

  1. `Specialty` の場合、音声ファイルで話す臨床医の専門分野を指定します。

  1. `Type` の場合、音声ファイルが会話かディクテーションかを指定します。

  1. `OutputBucketName` の場合、文字起こし結果を保存する Amazon S3 バケットを指定します。

  1. `Settings` オブジェクトの場合、以下を指定します。

     1. `VocabularyName` – カスタム語彙の名前です。

次のリクエストでは AWS SDK for Python (Boto3) 、 を使用して、カスタム語彙でバッチ文字起こしジョブを開始します。

```
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
job_name = "my-first-med-transcription-job"
job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
transcribe.start_medical_transcription_job(
   MedicalTranscriptionJobName = job_name,
   Media = {
       'MediaFileUri': job_uri
   },
   OutputBucketName = 'amzn-s3-demo-bucket',
   OutputKey = 'my-output-files/', 
   LanguageCode = 'en-US',
   Specialty = 'PRIMARYCARE',
   Type = 'CONVERSATION',
   Settings = {
       'VocabularyName': 'example-med-custom-vocab'
       }
 )

while True:
   status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name)
   if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)
```

# 医療用カスタム語彙を使用してリアルタイムストリームを文字起こし
<a name="start-med-vocab-stream"></a>

リアルタイムストリームで文字起こしの精度を向上させるために、HTTP/2 ストリームまたは WebSocket ストリームを使用してカスタム語彙を使用できます。HTTP/2 リクエストを開始する場合、[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html) API を使用します。カスタム語彙は、、 [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html) API AWS マネジメントコンソール、または WebSocket プロトコルを使用してリアルタイムで使用できます。

## マイクに話されているディクテーションの文字起こし (AWS マネジメントコンソール)
<a name="streaming-medical-vocabulary-console"></a>

を使用してメディカルディクテーションのストリーミングオーディオを AWS マネジメントコンソール 文字起こしするには、メディカルディクテーションを文字起こししし、ストリームを開始し、マイクで話し始めます。

**メディカルディクテーションの音声ストリームの書き起こし (AWS マネジメントコンソール)**

1. [AWS マネジメントコンソール](https://console.aws.amazon.com/transcribe/) にサインインします。

1. ナビゲーションペインの Amazon Transcribe Medical で、**リアルタイム文字起こし**を選択します。

1. **医療専門分野**の場合、ストリームで話す臨床医の専門分野を選択します。

1. **音声入力タイプ** の場合、**会話** または **ディクテーション** のいずれかを選択します。

1. **追加設定**の場合、**カスタム語彙** を選択します。

   1. **語彙選択**で、カスタム語彙を選択します。

1. [**ストリーミングの開始**] を選択します。

1. マイクに向かって話してください。

## HTTP/2 ストリームでスピーカーパーティションを有効にする
<a name="vocabulary-med-http2"></a>

HTTP/2 リクエストのパラメータのための構文を次に示します。

```
POST /medical-stream-transcription HTTP/2
host: transcribestreaming.us-west-2.amazonaws.com
authorization: Generated value
x-amz-target: com.amazonaws.transcribe.Transcribe.StartMedicalStreamTranscription
x-amz-content-sha256: STREAMING-MED-AWS4-HMAC-SHA256-EVENTS
x-amz-date: 20220208T235959Z
x-amzn-transcribe-session-id: my-first-http2-med-stream
x-amzn-transcribe-language-code: en-US
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000
x-amzn-transcribe-vocabulary-name: my-first-med-vocab
x-amzn-transcribe-specialty: PRIMARYCARE
x-amzn-transcribe-type: CONVERSATION
x-amzn-transcribe-show-speaker-label: true
Content-type: application/vnd.amazon.eventstream
transfer-encoding: chunked
```

パラメータの説明
+ **host**: 呼び出し AWS リージョン ている で AWS リージョン (前の例では「us-west-2」) を更新します。有効な のリストについては AWS リージョン、[AWS リージョン 「」および「エンドポイント](https://docs.aws.amazon.com/general/latest/gr/rande.html#transcribe_region)」を参照してください。
+ **authorization**: これは生成されたフィールドです。署名の作成の詳細については、[「署名バージョン 4 を使用した AWS リクエストの署名](https://docs.aws.amazon.com/general/latest/gr/sigv4_signing.html)」を参照してください。
+ **x-amz-target**: このフィールドは変更しないでください。前の例で示した内容を使用してください。
+ **x-amz-content-sha256**: これは生成されたフィールドです。署名の計算の詳細については、[「署名バージョン 4 を使用した AWS リクエストの署名](https://docs.aws.amazon.com/general/latest/gr/sigv4_signing.html)」を参照してください。
+ **x-amz-date**: 署名が作成された日時。形式は YYYYMMDDTHHMMSSZ で、YYY = 年、MM = 月、DD = 日、HH = 時間、MM = 分、SS = 秒、「T」と「Z」は固定文字です。詳細については、「[署名バージョン 4 で日付を扱う](https://docs.aws.amazon.com/general/latest/gr/sigv4-date-handling.html)」を参照してください。
+ **x-amzn-transcribe-session-id**: ストリーミングセッションの名前。
+ **x-amzn-transcribe-media-encoding**: 入力音声に使用されるエンコード。有効な値のリストについては、「[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html)」または「[サポートされている言語および言語固有の機能](supported-languages.md)」を参照してください。
+ **x-amzn-transcribe-media-encoding**: 入力音声に使用されるエンコード。有効な値は、`pcm`、`ogg-opus`、`flac` です。
+ **x-amzn-transcribe-sample-rate**: 入力オーディオのサンプルレート (ヘルツ単位）。 は 8,000 Hz から 48,000 Hz の範囲 Amazon Transcribe をサポートします。電話音声などの低品質音声は、通常 8,000 Hz 前後です。高品質の音声は、通常 16,000 Hz から 48,000 Hz の範囲です。指定するサンプルレートは音声のサンプルレートと一致する**必要がある**ことに注意してください。
+ **x-amzn-transcribe-vocabulary-name**: 文字起こしに使用したいボキャブラリーの名前。
+ **x-amzn-transcribe-specialty**: 文字起こしの対象となる医療専門分野。
+ **x-amzn-transcribe-type**: ディクテーションにするか会話にするかを選択します。
+ **x-amzn-transcribe-show-speaker-label**: ダイアライゼーションを有効にするには、この値が `true` でなければなりません。
+ **content-type**: このフィールドは変更しないでください。前の例で示した内容を使用してください。

## WebSocket リクエストでスピーカーパーティショニングを有効にする
<a name="vocabulary-websocket"></a>

API による WebSocket ストリーム内のスピーカーをパーティション化する場合、次の形式を使用して WebSocket リクエストをスタートするための署名付き URL を作成し、`vocabulary-name` を カスタム語彙の名前に特定します。

```
GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/medical-stream-transcription-websocket
?language-code=en-US
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=Signature Version 4 signature 
&X-Amz-SignedHeaders=host
&media-encoding=flac
&sample-rate=16000
&session-id=sessionId
&specialty=medicalSpecialty
&type=CONVERSATION
&vocabulary-name=vocabularyName
&show-speaker-label=boolean
```

# Amazon Transcribe Medical の文字セット
<a name="charsets-med"></a>

 Amazon Transcribe Medical でカスタム語彙を使用するには、次の文字セットを使用します。

## 英語の文字セット
<a name="char-english-med"></a>

英語のカスタム語彙の場合、`Phrase` 列および `SoundsLike` 列に次の文字を使用できます。
+ a～z
+ A～Z
+ ' (apostrophe)
+ - (ハイフン)
+ . (ピリオド)

語彙入力ファイルの `IPA` 列には、国際音声記号 (IPA) 文字を使用できます。


| 文字 | コード | 文字 | コード | 
| --- | --- | --- | --- | 
| aʊ | 0061 028A | w | 0077 | 
| aɪ | 0061 026A | z | 007A | 
| b | 0062 | æ | 00E6 | 
| d | 0064 | ð | 00F0 | 
| eɪ | 0065 026A | ŋ | 014B | 
| f | 0066 | ɑ | 0251 | 
| g | 0067 | ɔ | 0254 | 
| h | 0068 | ɔɪ | 0254 026A | 
| i | 0069 | ə | 0259 | 
| j | 006A | ɛ | 025B | 
| k | 006B | ɝ | 025D | 
| I | 006C | ɡ | 0261 | 
| I̩ | 006C 0329 | ɪ | 026A | 
| m | 006D | ɹ | 0279 | 
| n | 006E | ʃ | 0283 | 
| n̩ | 006E 0329 | ʊ | 028A | 
| oʊ | 006F 028A | ʌ | 028C | 
| p | 0070 | ʍ | 028D | 
| s | 0073 | ʒ | 0292 | 
| t | 0074 | ʤ | 02A4 | 
| u | 0075 | ʧ | 02A7 | 
| v | 0076 | θ | 03B8 | 