

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 为您的医学自定义词汇表创建文本文件
<a name="create-med-vocab-text"></a>

要创建自定义词汇表，请创建 UTF-8 格式的文本文件。在此文件中，您将创建一个包含四列的表，每列指定一个字段。每个字段都告诉 M Amazon Transcribe edical 要么是特定领域的术语是如何发音的，要么是如何在转录中显示这些术语。您将包含这些字段的文本文件存储在 Amazon S3 存储桶中。

## 了解如何格式化文本文件
<a name="understand-vocab-formatting"></a>

要创建医学自定义词汇表，请将列名作为标头行输入。您可以为标头行下方的每列输入值。

以下是该表中四个列的名称：
+  `Phrase` – 列为必填项，值为必填项 
+  `IPA` – 列为必填项，值为可选项 
+  `SoundsLike` – 列为必填项，值为可选项 
+  `DisplayAs` – 列为必填项，值为可选项 

在创建自定义词汇表时，请务必：
+ 使用单个 Tab 字符分隔每列。 Amazon Transcribe 如果您尝试用空格或多个 Tab 字符分隔列，则会抛出错误消息。
+ 确保列中的每个值后面没有尾随空格或空格。

确保您为每列输入的值符合以下条件：
+ 包括连字符在内不超过 256 个字符
+ 仅使用允许的字符集中的字符，请参阅[Amazon Transcribe 医疗字符集](charsets-med.md)。

## 为表的列输入值
<a name="entering-vocabulary-values-med"></a>

以下信息向您展示了如何为表的四个列指定值：
+ `Phrase` – 应识别的单词或短语。您必须在该列中输入值。

  如果条目为短语，请用连字符 (-) 隔开各个单词。例如，以 **cerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy** 形式输入 **cerebral autosomal dominant arteriopathy with subcortical infarcts and leukoencephalopathy**。

  以单个字母后跟圆点的形式（例如 **D.N.A.** 或 **S.T.E.M.I.**），输入字母应单独发音的首字母缩写词或其他单词。要输入首字母缩略词的复数形式，例如 “”STEMIs，请使用连字符将 “s” 与首字母缩略词分开：“**S.T.E.M.I-s**” 您可以使用大写或小写字母作为首字母缩略词。

  `Phrase` 列是必填的。您可以使用输入语言允许的任何字符。有关允许的字符，请参阅[Amazon Transcribe 医疗字符集](charsets-med.md)。如果您未指定该`DisplayAs`列，M Amazon Transcribe edical 将在输出文件中使用该`Phrase`列的内容。
+ `IPA`（列为必填项，值为可选项）– 要指定单词或短语的发音，您可以在该列中包含[国际音标字母 (IPA)](https://en.wikipedia.org/wiki/International_Phonetic_Alphabet) 中的字符。`IPA` 列不能包含前导空格或尾随空格，并且您必须使用单个空格以隔开输入中的每个音素。例如，在英语中，您以 **ə k j u t ɹ ɛ s p ɪ ɹ ə t ɔ ɹ i d ɪ s t ɹ ɛ s s ɪ n d ɹ oʊ m** 形式输入短语 **acute-respiratory-distress-syndrome**。您以 **eɪ ɛ l ɛ l** 形式输入短语 **A.L.L.**。

  即使未指定 `IPA` 列的内容，您也必须包含空白的 `IPA` 列。如果在 `IPA` 列中包含值，则不能为 `SoundsLike` 列提供值。

  有关特定语言允许的 IPA 字符列表，请参阅[Amazon Transcribe 医疗字符集](charsets-med.md)。美国英语是 Amazon Transcribe 医疗领域唯一可用的语言。
+ `SoundsLike`（列为必填项，值为可选项）– 您可以将单词或短语拆分为更小的部分，并使用语言的标准拼写法为每个部分提供发音以模仿单词的发音方式。例如，您可以按以下方式为短语 **cerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy** 提供发音提示：**sir-e-brul-aut-o-som-ul-dah-mi-nant-ar-ter-ri-o-pa-thy-with-sub-cor-ti-cul-in-farcts-and-lewk-o-en-ce-phul-ah-pu-thy**。短语 **atrioventricular-nodal-reentrant-tachycardia** 的提示如下所示：**ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia**。您使用连字符 (-) 分隔提示的每个部分。

  即使没有为 `SoundsLike` 列提供值，您也必须包含空白的 `SoundsLike` 列。如果在 `SoundsLike` 列中包含值，则不能为 `IPA` 列提供值。

  您可以使用输入语言允许的任何字符。有关允许的字符列表，请参阅[Amazon Transcribe 医疗字符集](charsets-med.md)。
+ （列为必填项，值为可选项）– 定义单词或短语在输出时的显示效果。例如，如果单词或短语为 **cerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy**，您可以将显示形式指定为 `cerebral autosomal dominant arteriopathy with subcortical infarcts and leukoencephalopathy`，以便不会显示连字符。如果要在输出中显示首字母缩写词而不是完整术语，您也可以使用 `CADASIL` 形式指定 `DisplayAs`。

  如果您未指定该`DisplayAs`列，M Amazon Transcribe edical `Phrase` 将在输出中使用输入文件中的列。

  您可以在 `DisplayAs` 列中使用任何 UTF-8 字符。

可以在 `IPA` 和 `DisplayAs` 列中包含空格值。

要创建自定义词汇表的文本文件，请将文本文件中的每个单词或短语放在单独的行中。使用制表符分隔列。仅在 `IPA` 和 `DisplayAs` 列中包含空格值。将带有扩展名的`.txt`文件保存在 Amazon S3 存储桶中，与使用 M Amazon Transcribe edical 创建自定义词汇表相同 AWS 区域 。

如果您在 Windows 中编辑文本文件，请确保文件采用 `LF` 格式，而不是 `CRLF` 格式。否则，您无法创建自定义词汇表。通过使用某些文本编辑器，您可以使用查找和替换命令更改格式。

以下示例显示可用于创建自定义词汇表的文本。要从这些示例中创建自定义词汇表，请将一个示例复制到文本编辑器中，将 `[TAB]` 替换为制表符，然后将保存的文本文件上传到 Amazon S3。

```
Phrase[TAB]IPA[TAB]SoundsLike[TAB]DisplayAs
acute-respiratory-distress-syndrome[TAB][TAB][TAB]acute respiratory distress syndrome
A.L.L.[TAB]eɪ ɛ l ɛ l[TAB][TAB]ALL
atrioventricular-nodal-reentrant-tachycardia[TAB][TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB]
```

您可以按任意顺序输入列。以下示例显示了自定义词汇表输入文件的其他有效结构。

```
Phrase[TAB]SoundsLike[TAB]IPA[TAB]DisplayAs
acute-respiratory-distress-syndrome[TAB][TAB][TAB]acute respiratory distress syndrome
A.L.L.[TAB][TAB]eɪ ɛ l ɛ l[TAB]ALL
atrioventricular-nodal-reentrant-tachycardia[TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB][TAB]
```

```
DisplayAs[TAB]SoundsLike[TAB]IPA[TAB]Phrase
acute respiratory distress syndrome[TAB][TAB][TAB]acute-respiratory-distress-syndrome
ALL[TAB][TAB]eɪ ɛ l ɛ l[TAB]A.L.L.
[TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB][TAB]atrioventricular-nodal-reentrant-tachycardia
```

为了便于阅读，下表以 html 格式更清楚地显示上述示例。它们仅用于说明示例。


| Phrase | IPA | SoundsLike | DisplayAs | 
| --- | --- | --- | --- | 
| acute-respiratory-distress-syndrome |  |  | acute respiratory distress syndrome | 
| A.L.L。 | eɪ ɛ l ɛ l |  | ALL | 
| atrioventricular-nodal-reentrant-tachycardia |  | ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia |  | 


| Phrase | SoundsLike | IPA | DisplayAs | 
| --- | --- | --- | --- | 
| acute-respiratory-distress-syndrome |  |  | acute respiratory distress syndrome | 
| atrioventricular-nodal-reentrant-tachycardia | ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia |  |  | 
| A.L.L。 |  | eɪ ɛ l ɛ l | ALL | 


| DisplayAs | SoundsLike | IPA | Phrase | 
| --- | --- | --- | --- | 
| acute respiratory distress syndrome |  |  | acute-respiratory-distress-syndrome | 
| ALL |  | eɪ ɛ l ɛ l | A.L.L。 | 
|  | ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia |  | atrioventricular-nodal-reentrant-tachycardia | 