

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# 医療用カスタム語彙のテキストファイルを作成する
<a name="create-med-vocab-text"></a>

カスタム語彙を作成する場合、UTF-8 形式のテキストファイルを作成します。このファイルでは、4 列のテーブルを作成し、各列がフィールドを指定します。各フィールドは、ドメイン固有の用語がどのように発音されるか、または文字起こしにこれらの用語を表示する方法を Amazon Transcribe Medical に伝えます。これらのフィールドを含むテキストファイルは、 Amazon S3 バケットに保存します。

## テキストファイルのフォーマット方法を理解する
<a name="understand-vocab-formatting"></a>

医療用カスタム語彙を作成するには、列名をヘッダー行として入力します。ヘッダー行の下にある各列の値を入力します。

表の 4 つの列の名前を以下に示します。
+  `Phrase`: 列、値は必要です。
+  `IPA`: 列は必須です。値はオプションでもかまいません。
+  `SoundsLike`: 列は必須です。値はオプションでもかまいません。
+  `DisplayAs`: 列は必須です。値はオプションでもかまいません。

カスタム語彙を作成するときは、次のことを必ず実行してください。
+ 各列を 1 つの Tab character Amazon Transcribe で区切ります。列をスペースまたは複数の Tab 文字で区切ろうとすると、エラーメッセージが表示されます。
+ 列内の各値の後に末尾にスペースや空白がないことを確認してください。

各列に入力する値が以下であることを確認します。
+ 256 文字未満 (ハイフンを含む)
+ 文字セットの文字を使用する場合のみ、「[Amazon Transcribe Medical の文字セット](charsets-med.md)」を参照してください。

## テーブルの列の値を入力する
<a name="entering-vocabulary-values-med"></a>

次の情報は、テーブルの 4 つの列の値を指定する方法を示しています。
+ `Phrase` – 認識する必要がある語句。この列には値を入力する必要があります。

  エントリが句の場合、単語はハイフン (-) で区切ります。たとえば、**cerebral autosomal dominant arteriopathy with subcortical infarcts and leukoencephalopathy** を **cerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy** として入力します。

  頭字語、または文字が単一の文字とそれに続くドットとして個別に発音される必要があるその他の単語 (例: **D.N.A.** や **S.T.E.M.I.**) を入力します。「STEMIs」などの頭字語の複数形を入力するには、頭字語と「s」をハイフンで区切ります (**S.T.E.M.I-s**)。頭字語には大文字または小文字を使用できます。

  `Phrase` 列は必須です。入力言語として許可されている文字はいずれも使用できます。使用できる文字については、「[Amazon Transcribe Medical の文字セット](charsets-med.md)」を参照してください。`DisplayAs` 列を指定しない場合、 Amazon Transcribe Medical は出力ファイルの`Phrase`列の内容を使用します。
+ `IPA` (列は必須、値はオプション) – 単語または句の発音を指定するには、[国際音声記号 (IPA)](https://en.wikipedia.org/wiki/International_Phonetic_Alphabet) の文字をこの列に使用することができます。`IPA` 列には、先頭または末尾にスペースを含めることはできません。また、入力の phoneme を区切るには、1 つのスペースを使用する必要があります。たとえば、英語で **acute-respiratory-distress-syndrome** を **ə k j u t ɹ ɛ s p ɪ ɹ ə t ɔ ɹ i d ɪ s t ɹ ɛ s s ɪ n d ɹ oʊ m** と入力したとします。**A.L.L.** には **eɪ ɛ l ɛ l** と入力します。

  `IPA` 列の内容を指定しない場合でも、空白の `IPA` 列を含める必要があります。`IPA` 列に値を含めた場合、`SoundsLike` 列に値を指定することはできません。

  特定の言語で使用できる IPA 文字の一覧については、「[Amazon Transcribe Medical の文字セット](charsets-med.md)」を参照してください。 Amazon Transcribe Medical で使用できる言語は米国英語のみです。
+ `SoundsLike` (列は必須、値はオプション) – 単語や句を小さい断片に分割し、言語の標準的な正書法を使用して各断片の発音を指定することで、単語の発音方法を模倣することができます。たとえば、**cerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy** 句の発音ヒントは **sir-e-brul-aut-o-som-ul-dah-mi-nant-ar-ter-ri-o-pa-thy-with-sub-cor-ti-cul-in-farcts-and-lewk-o-en-ce-phul-ah-pu-thy** のように指定することができます。句 **atrioventricular-nodal-reentrant-tachycardia** のヒントは、**ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia** のようになります。ヒントの各部分はハイフン (-) を使って区切ります。

  `SoundsLike` 列の値を指定しない場合でも、空白の `SoundsLike` 列を含める必要があります。`SoundsLike` 列に値を含めた場合、`IPA` 列に値を指定することはできません。

  入力言語として許可されている文字はいずれも使用できます。許可された文字の一覧については、「[Amazon Transcribe Medical の文字セット](charsets-med.md)」を参照してください。
+ `DisplayAs` (列は必須、値はオプション) : 出力時の単語または句の外観を定義します。たとえば、単語または句が **cerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy** の場合は、ハイフンが表示されないように、`cerebral autosomal dominant arteriopathy with subcortical infarcts and leukoencephalopathy` という形式で表示されるよう指定することができます。また、出力に用語全体ではなく頭字語を表示する場合、`DisplayAs` を `CADASIL` として指定することもできます。

  `DisplayAs` 列を指定しない場合、 Amazon Transcribe Medical は出力の入力ファイルの`Phrase`列を使用します。

  UTF-8 文字はいずれも、`DisplayAs` 列で使用することができます。

`IPA` および `DisplayAs` 列の値にのみスペースを含むことができます。

カスタム語彙のテキストファイルを作成するには、各単語または各語彙を個別の行のテキストファイルに配置します。列はタブ文字で区切ります。`IPA` および `DisplayAs` 列の値にのみスペースを含めます。Medical を使用してカスタム語 Amazon Transcribe 彙を作成する AWS リージョン のと同じ `.txt` の Amazon S3 バケットに、 拡張子が付いたファイルを保存します。

Windows でテキストファイルを編集する場合、ファイルが `CRLF` 形式ではなく `LF` 形式であることを確認してください。そうしないと、カスタム語彙を作成できなくなります。一部のテキストエディタでは、検索コマンドと置換コマンドで書式を変更できます。

次の例は、カスタム語彙の作成に使用できるテキストを示しています。これらの例からカスタム語彙を作成するには、例をテキストエディタにコピーし、`[TAB]` を Tab 文字に置き換えて、保存したテキストファイルを Amazon S3にアップロードします。

```
Phrase[TAB]IPA[TAB]SoundsLike[TAB]DisplayAs
acute-respiratory-distress-syndrome[TAB][TAB][TAB]acute respiratory distress syndrome
A.L.L.[TAB]eɪ ɛ l ɛ l[TAB][TAB]ALL
atrioventricular-nodal-reentrant-tachycardia[TAB][TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB]
```

列は任意の順序で入力できます。次の例は、カスタム語彙入力ファイル の他の有効な構造を 示しています。

```
Phrase[TAB]SoundsLike[TAB]IPA[TAB]DisplayAs
acute-respiratory-distress-syndrome[TAB][TAB][TAB]acute respiratory distress syndrome
A.L.L.[TAB][TAB]eɪ ɛ l ɛ l[TAB]ALL
atrioventricular-nodal-reentrant-tachycardia[TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB][TAB]
```

```
DisplayAs[TAB]SoundsLike[TAB]IPA[TAB]Phrase
acute respiratory distress syndrome[TAB][TAB][TAB]acute-respiratory-distress-syndrome
ALL[TAB][TAB]eɪ ɛ l ɛ l[TAB]A.L.L.
[TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB][TAB]atrioventricular-nodal-reentrant-tachycardia
```

読みやすくするために、次の表は、上記の例をより明確に html 形式で示しています。これらは、例の説明のみが目的です。


| フレーズ | IPA | SoundsLike | DisplayAs | 
| --- | --- | --- | --- | 
| acute-respiratory-distress-syndrome |  |  | acute respiratory distress syndrome | 
| A.L.L. | eɪ ɛ l ɛ l |  | ALL | 
| atrioventricular-nodal-reentrant-tachycardia |  | ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia |  | 


| フレーズ | SoundsLike | IPA | DisplayAs | 
| --- | --- | --- | --- | 
| acute-respiratory-distress-syndrome |  |  | acute respiratory distress syndrome | 
| atrioventricular-nodal-reentrant-tachycardia | ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia |  |  | 
| A.L.L。 |  | eɪ ɛ l ɛ l | すべて | 


| DisplayAs | SoundsLike | IPA | フレーズ | 
| --- | --- | --- | --- | 
| acute respiratory distress syndrome |  |  | acute-respiratory-distress-syndrome | 
| ALL |  | eɪ ɛ l ɛ l | A.L.L。 | 
|  | ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia |  | atrioventricular-nodal-reentrant-tachycardia | 