

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 使用医学自定义词汇表提高转录准确性
<a name="vocabulary-med"></a>

要提高 Medic Amazon Transcribe al 中的转录准确性，请创建并使用一个或多个医学自定义词汇表。*自定义词汇表*是特定领域的单词或短语的集合。该集合有助于提高 Medic Amazon Transcribe al 在转录这些单词或短语方面的表现。

在使用 Medic Amazon Transcribe al 时，您应对自己数据的完整性负责。请勿在自定义词汇表中输入机密信息、个人信息 (PII) 或受保护的健康信息 (PHI)。

为了获得最佳效果，请创建单独的小型自定义词汇表，每个词汇表都有助于转录特定的录音。与创建用于所有录音的大型自定义词汇表相比，在转录准确性方面可以获得更大的改进。

默认情况下，您最多可以有 100 个自定义词汇表。 AWS 账户自定义词汇的大小不能超过 50 KB。有关申请增加可包含的自定义词汇量的信息 AWS 账户，请参阅[AWS 服务配额](https://docs.aws.amazon.com/general/latest/gr/aws_service_limits.html)。

自定义词汇表是美国英语 (en-US) 版本。

**Topics**
+ [为您的医学自定义词汇表创建文本文件](create-med-vocab-text.md)
+ [使用文本文件创建医学自定义词汇表](create-med-custom-vocabulary.md)
+ [使用医学自定义词汇表转录音频文件](start-med-custom-vocab-job.md)
+ [使用医学自定义词汇表转录实时音频流](start-med-vocab-stream.md)
+ [Amazon Transcribe 医疗字符集](charsets-med.md)

# 为您的医学自定义词汇表创建文本文件
<a name="create-med-vocab-text"></a>

要创建自定义词汇表，请创建 UTF-8 格式的文本文件。在此文件中，您将创建一个包含四列的表，每列指定一个字段。每个字段都告诉 M Amazon Transcribe edical 要么是特定领域的术语是如何发音的，要么是如何在转录中显示这些术语。您将包含这些字段的文本文件存储在 Amazon S3 存储桶中。

## 了解如何格式化文本文件
<a name="understand-vocab-formatting"></a>

要创建医学自定义词汇表，请将列名作为标头行输入。您可以为标头行下方的每列输入值。

以下是该表中四个列的名称：
+  `Phrase` – 列为必填项，值为必填项 
+  `IPA` – 列为必填项，值为可选项 
+  `SoundsLike` – 列为必填项，值为可选项 
+  `DisplayAs` – 列为必填项，值为可选项 

在创建自定义词汇表时，请务必：
+ 使用单个 Tab 字符分隔每列。 Amazon Transcribe 如果您尝试用空格或多个 Tab 字符分隔列，则会抛出错误消息。
+ 确保列中的每个值后面没有尾随空格或空格。

确保您为每列输入的值符合以下条件：
+ 包括连字符在内不超过 256 个字符
+ 仅使用允许的字符集中的字符，请参阅[Amazon Transcribe 医疗字符集](charsets-med.md)。

## 为表的列输入值
<a name="entering-vocabulary-values-med"></a>

以下信息向您展示了如何为表的四个列指定值：
+ `Phrase` – 应识别的单词或短语。您必须在该列中输入值。

  如果条目为短语，请用连字符 (-) 隔开各个单词。例如，以 **cerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy** 形式输入 **cerebral autosomal dominant arteriopathy with subcortical infarcts and leukoencephalopathy**。

  以单个字母后跟圆点的形式（例如 **D.N.A.** 或 **S.T.E.M.I.**），输入字母应单独发音的首字母缩写词或其他单词。要输入首字母缩略词的复数形式，例如 “”STEMIs，请使用连字符将 “s” 与首字母缩略词分开：“**S.T.E.M.I-s**” 您可以使用大写或小写字母作为首字母缩略词。

  `Phrase` 列是必填的。您可以使用输入语言允许的任何字符。有关允许的字符，请参阅[Amazon Transcribe 医疗字符集](charsets-med.md)。如果您未指定该`DisplayAs`列，M Amazon Transcribe edical 将在输出文件中使用该`Phrase`列的内容。
+ `IPA`（列为必填项，值为可选项）– 要指定单词或短语的发音，您可以在该列中包含[国际音标字母 (IPA)](https://en.wikipedia.org/wiki/International_Phonetic_Alphabet) 中的字符。`IPA` 列不能包含前导空格或尾随空格，并且您必须使用单个空格以隔开输入中的每个音素。例如，在英语中，您以 **ə k j u t ɹ ɛ s p ɪ ɹ ə t ɔ ɹ i d ɪ s t ɹ ɛ s s ɪ n d ɹ oʊ m** 形式输入短语 **acute-respiratory-distress-syndrome**。您以 **eɪ ɛ l ɛ l** 形式输入短语 **A.L.L.**。

  即使未指定 `IPA` 列的内容，您也必须包含空白的 `IPA` 列。如果在 `IPA` 列中包含值，则不能为 `SoundsLike` 列提供值。

  有关特定语言允许的 IPA 字符列表，请参阅[Amazon Transcribe 医疗字符集](charsets-med.md)。美国英语是 Amazon Transcribe 医疗领域唯一可用的语言。
+ `SoundsLike`（列为必填项，值为可选项）– 您可以将单词或短语拆分为更小的部分，并使用语言的标准拼写法为每个部分提供发音以模仿单词的发音方式。例如，您可以按以下方式为短语 **cerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy** 提供发音提示：**sir-e-brul-aut-o-som-ul-dah-mi-nant-ar-ter-ri-o-pa-thy-with-sub-cor-ti-cul-in-farcts-and-lewk-o-en-ce-phul-ah-pu-thy**。短语 **atrioventricular-nodal-reentrant-tachycardia** 的提示如下所示：**ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia**。您使用连字符 (-) 分隔提示的每个部分。

  即使没有为 `SoundsLike` 列提供值，您也必须包含空白的 `SoundsLike` 列。如果在 `SoundsLike` 列中包含值，则不能为 `IPA` 列提供值。

  您可以使用输入语言允许的任何字符。有关允许的字符列表，请参阅[Amazon Transcribe 医疗字符集](charsets-med.md)。
+ （列为必填项，值为可选项）– 定义单词或短语在输出时的显示效果。例如，如果单词或短语为 **cerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy**，您可以将显示形式指定为 `cerebral autosomal dominant arteriopathy with subcortical infarcts and leukoencephalopathy`，以便不会显示连字符。如果要在输出中显示首字母缩写词而不是完整术语，您也可以使用 `CADASIL` 形式指定 `DisplayAs`。

  如果您未指定该`DisplayAs`列，M Amazon Transcribe edical `Phrase` 将在输出中使用输入文件中的列。

  您可以在 `DisplayAs` 列中使用任何 UTF-8 字符。

可以在 `IPA` 和 `DisplayAs` 列中包含空格值。

要创建自定义词汇表的文本文件，请将文本文件中的每个单词或短语放在单独的行中。使用制表符分隔列。仅在 `IPA` 和 `DisplayAs` 列中包含空格值。将带有扩展名的`.txt`文件保存在 Amazon S3 存储桶中，与使用 M Amazon Transcribe edical 创建自定义词汇表相同 AWS 区域 。

如果您在 Windows 中编辑文本文件，请确保文件采用 `LF` 格式，而不是 `CRLF` 格式。否则，您无法创建自定义词汇表。通过使用某些文本编辑器，您可以使用查找和替换命令更改格式。

以下示例显示可用于创建自定义词汇表的文本。要从这些示例中创建自定义词汇表，请将一个示例复制到文本编辑器中，将 `[TAB]` 替换为制表符，然后将保存的文本文件上传到 Amazon S3。

```
Phrase[TAB]IPA[TAB]SoundsLike[TAB]DisplayAs
acute-respiratory-distress-syndrome[TAB][TAB][TAB]acute respiratory distress syndrome
A.L.L.[TAB]eɪ ɛ l ɛ l[TAB][TAB]ALL
atrioventricular-nodal-reentrant-tachycardia[TAB][TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB]
```

您可以按任意顺序输入列。以下示例显示了自定义词汇表输入文件的其他有效结构。

```
Phrase[TAB]SoundsLike[TAB]IPA[TAB]DisplayAs
acute-respiratory-distress-syndrome[TAB][TAB][TAB]acute respiratory distress syndrome
A.L.L.[TAB][TAB]eɪ ɛ l ɛ l[TAB]ALL
atrioventricular-nodal-reentrant-tachycardia[TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB][TAB]
```

```
DisplayAs[TAB]SoundsLike[TAB]IPA[TAB]Phrase
acute respiratory distress syndrome[TAB][TAB][TAB]acute-respiratory-distress-syndrome
ALL[TAB][TAB]eɪ ɛ l ɛ l[TAB]A.L.L.
[TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB][TAB]atrioventricular-nodal-reentrant-tachycardia
```

为了便于阅读，下表以 html 格式更清楚地显示上述示例。它们仅用于说明示例。


| Phrase | IPA | SoundsLike | DisplayAs | 
| --- | --- | --- | --- | 
| acute-respiratory-distress-syndrome |  |  | acute respiratory distress syndrome | 
| A.L.L。 | eɪ ɛ l ɛ l |  | ALL | 
| atrioventricular-nodal-reentrant-tachycardia |  | ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia |  | 


| Phrase | SoundsLike | IPA | DisplayAs | 
| --- | --- | --- | --- | 
| acute-respiratory-distress-syndrome |  |  | acute respiratory distress syndrome | 
| atrioventricular-nodal-reentrant-tachycardia | ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia |  |  | 
| A.L.L。 |  | eɪ ɛ l ɛ l | ALL | 


| DisplayAs | SoundsLike | IPA | Phrase | 
| --- | --- | --- | --- | 
| acute respiratory distress syndrome |  |  | acute-respiratory-distress-syndrome | 
| ALL |  | eɪ ɛ l ɛ l | A.L.L。 | 
|  | ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia |  | atrioventricular-nodal-reentrant-tachycardia | 

# 使用文本文件创建医学自定义词汇表
<a name="create-med-custom-vocabulary"></a>

要创建自定义词汇表，必须准备好包含单词或短语集合的文本文件。 Amazon Transcribe Medical 使用此文本文件创建自定义词汇表，您可以使用该词汇来提高这些单词或短语的转录准确性。您可以使用 [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateMedicalVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateMedicalVocabulary.html)API 或 Amazon Transcribe 医疗控制台创建自定义词汇表。

## AWS 管理控制台
<a name="create-med-custom-vocab-console"></a>

要使用创建自定义词汇，您需要提供包含您的单词或短语的文本文件的 Amazon S3 URI。 AWS 管理控制台 

1. 登录到 [AWS 管理控制台](https://console.aws.amazon.com/transcribe/)。

1. 在导航窗格的 “ Amazon Transcribe 医疗” 下，选择 “**自定义词汇**”。

1. 在**名称**中的**词汇表设置** 下，为您的自定义词汇表选择一个名称。

1. 指定音频文件或视频文件在 Amazon S3中的位置：
   + 在**词汇表设置**下的 **S3 中的词汇表输入文件位置**中，指定用来标识将用于创建自定义词汇表的文本文件的 Amazon S3 URI。
   + 对于 **S3 中的词汇表输入文件位置**，请选择**浏览 S3**，浏览文本文件并将其选中。

1. 选择**创建词汇表**。

您可以在 AWS 管理控制台中查看自定义词汇表的处理状态。

## API
<a name="create-med-custom-vocab-api"></a>

**创建医学自定义词汇表 (API)**
+ 对于 [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html) API，请指定以下内容。

  1. 对于 `LanguageCode`，请指定 `en-US`。

  1. 对于`VocabularyFileUri`，请指定用于定义自定义词汇表的文本文件 Amazon S3 的位置。

  1. 对于 `VocabularyName`，为您的自定义词汇表指定一个名称。您指定的名称在您的名称中必须是唯一的 AWS 账户。

要查看自定义词汇表的处理状态，请使用 [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_GetMedicalVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_GetMedicalVocabulary.html) API。

以下是使用创建自定义词汇表 适用于 Python (Boto3) 的 AWS SDK 的请求示例。

```
from __future__ import print_function
import time
import boto3  
transcribe = boto3.client('transcribe', 'us-west-2')
vocab_name = "my-first-vocabulary"
response = transcribe.create_medical_vocabulary(
    VocabularyName = job_name,
    VocabularyFileUri = 's3://amzn-s3-demo-bucket/my-vocabularies/my-vocabulary-table.txt'
    LanguageCode = 'en-US',
  )
  
while True:
    status = transcribe.get_medical_vocabulary(VocabularyName = vocab_name)
    if status['VocabularyState'] in ['READY', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)
```

## AWS CLI
<a name="create-med-custom-vocab-cli"></a>

**在批量转录作业中启用发言者划分 (AWS CLI)**
+ 运行以下代码。

  ```
  aws transcribe create-medical-vocabulary \
  --vocabulary-name my-first-vocabulary \ 
  --vocabulary-file-uri s3://amzn-s3-demo-bucket/my-vocabularies/my-vocabulary-file.txt \
  --language-code en-US
  ```

# 使用医学自定义词汇表转录音频文件
<a name="start-med-custom-vocab-job"></a>

使用[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html)或开始使用自定义词汇 AWS 管理控制台 来提高转录准确性的转录作业。

## AWS 管理控制台
<a name="start-med-custom-vocab-job-console"></a>

1. 登录到 [AWS 管理控制台](https://console.aws.amazon.com/transcribe/)。

1. 在导航窗格的 “ Amazon Transcribe 医疗” 下，选择 “**转录作业**”。

1. 请选择**创建任务**。

1. 在**指定作业详细信息**页面上，提供有关您的转录作业的信息。

1. 选择**下一步**。

1. 在**自定义**下，启用**自定义词汇表**。

1. 在**词汇表选择**下，选择一个自定义词汇表。

1. 选择**创建**。

## API
<a name="start-med-custom-vocab-api"></a>

**使用批量转录作业 (API) 在音频文件中启用发言者划分**
+ 对于 [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html) API，请指定以下内容。

  1. 对于 `MedicalTranscriptionJobName`，请指定在您 AWS 账户中是唯一的名称。

  1. 对于 `LanguageCode`，指定与音频文件中所用语言和词汇表筛选条件的语言对应的语言代码。

  1. 在 `Media` 对象的 `MediaFileUri` 参数中，指定要转录的音频文件的名称。

  1. 对于 `Specialty`，请指定音频文件中说话的临床医生的医学专科。

  1. 对于 `Type`，请指定音频文件是对话还是口述。

  1. 对于 `OutputBucketName`，请指定要将转录结果存储到的 Amazon S3 存储桶。

  1. 对于 `Settings` 对象，指定以下内容。

     1. `VocabularyName` – 您的自定义词汇表的名称。

以下请求使用使用自定义词汇启动批量转录作业。 适用于 Python (Boto3) 的 AWS SDK 

```
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
job_name = "my-first-med-transcription-job"
job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
transcribe.start_medical_transcription_job(
   MedicalTranscriptionJobName = job_name,
   Media = {
       'MediaFileUri': job_uri
   },
   OutputBucketName = 'amzn-s3-demo-bucket',
   OutputKey = 'my-output-files/', 
   LanguageCode = 'en-US',
   Specialty = 'PRIMARYCARE',
   Type = 'CONVERSATION',
   Settings = {
       'VocabularyName': 'example-med-custom-vocab'
       }
 )

while True:
   status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name)
   if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)
```

# 使用医学自定义词汇表转录实时音频流
<a name="start-med-vocab-stream"></a>

要提高实时流中的转录准确性，您可以使用 HTTP/2 或直播来使用自定义词汇。 WebSocket 要启动 HTTP/2 请求，请使用 [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html) API。您可以使用 AWS 管理控制台、[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html)API 或使用 WebSocket 协议实时使用自定义词汇表。

## 转录对着麦克风说出的口述 (AWS 管理控制台)
<a name="streaming-medical-vocabulary-console"></a>

要使用转录医疗听写的流式音频，请选择转录医疗听写的选项，开始直播，然后开始对着麦克风说话。 AWS 管理控制台 

**转录医学口述的流式音频（AWS 管理控制台）**

1. 登录到 [AWS 管理控制台](https://console.aws.amazon.com/transcribe/)。

1. 在导航窗格的 “ Amazon Transcribe 医疗” 下，选择 “**实时转录**”。

1. 对于**医学专科**，请选择在音频流中发言的临床医生的医学专科。

1. 对于**音频输入类型**，选择**对话**或**口述**。

1. 对于**其它设置**，请选择**自定义词汇表**。

   1. 对于**词汇表选择**，请选择自定义词汇表。

1. 选择 **Start streaming（开始流式传输）**。

1. 对着麦克风说话。

## 在 HTTP/2 音频流中启用发言者划分
<a name="vocabulary-med-http2"></a>

以下是 HTTP/2 请求的参数的语法。

```
POST /medical-stream-transcription HTTP/2
host: transcribestreaming.us-west-2.amazonaws.com
authorization: Generated value
x-amz-target: com.amazonaws.transcribe.Transcribe.StartMedicalStreamTranscription
x-amz-content-sha256: STREAMING-MED-AWS4-HMAC-SHA256-EVENTS
x-amz-date: 20220208T235959Z
x-amzn-transcribe-session-id: my-first-http2-med-stream
x-amzn-transcribe-language-code: en-US
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000
x-amzn-transcribe-vocabulary-name: my-first-med-vocab
x-amzn-transcribe-specialty: PRIMARYCARE
x-amzn-transcribe-type: CONVERSATION
x-amzn-transcribe-show-speaker-label: true
Content-type: application/vnd.amazon.eventstream
transfer-encoding: chunked
```

参数描述：
+ **主机**：用你正在调用的更新 AWS 区域 （在前面的示例中为'us-west-2'）。 AWS 区域 有关有效内容的列表 AWS 区域，请参阅[AWS 区域 和终端节点](https://docs.aws.amazon.com/general/latest/gr/rande.html#transcribe_region)。
+ **授权**：这是一个生成的字段。要了解有关创建签名的更多信息，请参阅使用[签名版本 4 对 AWS 请求进行签名](https://docs.aws.amazon.com/general/latest/gr/sigv4_signing.html)。
+ **x-amz-target**: 请勿更改此字段；请使用前面示例中显示的内容。
+ **x-amz-content-sha256**：这是一个生成的字段。要了解有关计算签名的更多信息，请参阅使用[签名版本 4 对 AWS 请求进行签名](https://docs.aws.amazon.com/general/latest/gr/sigv4_signing.html)。
+ **x-amz-date**：签名的创建日期和时间。格式为 YYYYMMDDTHHMMSSZ，其中 YYYY=year、MM=month、DD=day、HH=hour、MM=minute、SS=seconds，T 和 Z 是固定字符。有关更多信息，请参阅[处理签名版本 4 中的日期](https://docs.aws.amazon.com/general/latest/gr/sigv4-date-handling.html)。
+ **x-amzn-transcribe-session-id**：您的直播会话的名称。
+ **x-amzn-transcribe-language-code**：用于输入音频的编码。有关有效值的列表，请参阅 [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html) 或[支持的语言和特定语言的特征](supported-languages.md)。
+ **x-amzn-transcribe-media-encod** ing：用于输入音频的编码。有效值包括 `pcm`、`ogg-opus` 和 `flac`。
+ **x-amzn-transcribe-sample-rat** e：输入音频的采样率（以赫兹为单位）。 Amazon Transcribe 支持 8,000 Hz 到 48,000 Hz 的范围。低质量音频（例如电话音频）通常在 8000 Hz 左右。高质量音频的范围通常在 16000 Hz 到 48000 Hz 之间。请注意，您指定的采样率**必须**与音频的采样率相匹配。
+ **x-amzn-transcribe-vocabulary-nam** e：要用于转录的词汇的名称。
+ **x-amzn-transcribe-specialty**: 正在转录的医学专业。
+ **x-amzn-transcribe-type**: 选择这是听写还是对话。
+ **x-amzn-transcribe-show-speaker-label**：要启用二进制，此值必须为。`true`
+ **content-type**：不要更改此字段；请使用前面示例中显示的内容。

## 在请求中启用扬声器分区 WebSocket
<a name="vocabulary-websocket"></a>

要使用 API 对 WebSocket 直播中的演讲者进行分区，请使用以下格式创建用于启动 WebSocket 请求的预签名 URI，并将其设置`vocabulary-name`为自定义词汇表的名称。

```
GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/medical-stream-transcription-websocket
?language-code=en-US
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=Signature Version 4 signature 
&X-Amz-SignedHeaders=host
&media-encoding=flac
&sample-rate=16000
&session-id=sessionId
&specialty=medicalSpecialty
&type=CONVERSATION
&vocabulary-name=vocabularyName
&show-speaker-label=boolean
```

# Amazon Transcribe 医疗字符集
<a name="charsets-med"></a>

要在 Medic Amazon Transcribe al 中使用自定义词汇表，请使用以下字符集。

## 英语字符集
<a name="char-english-med"></a>

对于英语自定义词汇表，您可以在 `Phrase` 和 `SoundsLike` 列中使用以下字符：
+ a - z
+ A - Z
+ '（撇号）
+ - (连字符)
+ .（句点）

您可以在词汇表输入文件的 `IPA` 列中使用以下国际音标字母 (IPA) 字符。


| Character | 代码 | Character | 代码 | 
| --- | --- | --- | --- | 
| aʊ | 0061 028A | w | 0077 | 
| aɪ | 0061 026A | z | 007A | 
| b | 0062 | æ | 00E6 | 
| d | 0064 | ð | 00F0 | 
| eɪ | 0065 026A | ŋ | 014B | 
| f | 0066 | ɑ | 0251 | 
| g | 0067 | ɔ | 0254 | 
| h | 0068 | ɔɪ | 0254 026A | 
| i | 0069 | ə | 0259 | 
| j | 006A | ɛ | 025B | 
| k | 006B | ɝ | 025D | 
| l | 006C | ɡ | 0261 | 
| l̩ | 006C 0329 | ɪ | 026A | 
| m | 006D | ɹ | 0279 | 
| n | 006E | ʃ | 0283 | 
| n̩ | 006E 0329 | ʊ | 028A | 
| oʊ | 006F 028A | ʌ | 028C | 
| p | 0070 | ʍ | 028D | 
| s | 0073 | ʒ | 0292 | 
| t | 0074 | ʤ | 02A4 | 
| u | 0075 | ʧ | 02A7 | 
| v | 0076 | θ | 03B8 | 