

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 為您的醫療自訂詞彙建立文字檔案
<a name="create-med-vocab-text"></a>

若要建立自訂詞彙，您可以建立 UTF-8 格式的文字檔案。在此檔案中，您建立一個四欄表格，每欄指定一個欄位。每個欄位都會告知 Amazon Transcribe Medical 網域特定詞彙的發音方式，或如何在轉錄中顯示這些詞彙。您可以將包含這些欄位的文字檔案存放在 Amazon S3 儲存貯體中。

## 了解如何格式化文字檔案
<a name="understand-vocab-formatting"></a>

若要建立醫療自訂詞彙，請將欄名稱輸入為標題列。您可以在標題列下方輸入每個欄的值。

以下是表格四欄的名稱：
+  `Phrase` – 必填欄，必填值 
+  `IPA` – 必填欄，可選填值 
+  `SoundsLike` – 必填欄，可選填值 
+  `DisplayAs` – 必填欄，可選填值 

建立自訂詞彙時，請確定：
+ 使用單一 Tab 字元分隔每個資料欄。如果您嘗試使用空格或多個 Tab 字元分隔資料欄， 會 Amazon Transcribe 擲回錯誤訊息。
+ 確定欄中的每個值後沒有空格或空白格。

確定您為每一欄輸入的值：
+ 不超過 256 個字元，連字號包括在內
+ 僅使用允許字元集的字元，請參閱 [Amazon Transcribe Medical 的字元集](charsets-med.md)

## 輸入表格欄的值
<a name="entering-vocabulary-values-med"></a>

下列資訊顯示如何為表格的四個欄指定值：
+ `Phrase` – 應可辨識的單字或片語。您必須在此欄中輸入值。

  如果項目是詞組，請以連字號 (-) 區隔字組。例如，​輸入 **cerebral autosomal dominant arteriopathy with subcortical infarcts and leukoencephalopathy** 為 **cerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy**。

  首字母縮寫或其他單字的字母應單獨發音，請在單一字母後面接著輸入點，例如 **D.N.A.** 或 **S.T.E.M.I.**。若要輸入首字母縮寫的複數形式，例如「STEM」，請使用連字號分隔「s」與首字母縮寫：「**S.T.E.M.I-s**」您可以使用大寫或小寫字母作為首字母縮寫。

  `Phrase` 欄是必填欄。您可對輸入語言使用任何允許的字元。如需允許的字元，請參閱 [Amazon Transcribe Medical 的字元集](charsets-med.md)。如果您未指定資料`DisplayAs`欄， Amazon Transcribe Medical 會使用輸出檔案中資料`Phrase`欄的內容。
+ `IPA`(必填欄，可選填值) – 若要指定單字或片語的發音，您可以在此欄中包含[國際音標 (IPA)](https://en.wikipedia.org/wiki/International_Phonetic_Alphabet) 中的字元。`IPA` 欄不能包含前置或結尾空格，而且您必須使用單一空格以區隔輸入中的每個音節。例如，在英文中您可將片語 **acute-respiratory-distress-syndrome** 輸入為 **ə k j u t ɹ ɛ s p ɪ ɹ ə t ɔ ɹ i d ɪ s t ɹ ɛ s s ɪ n d ɹ oʊ m**。亦可將片語 **A.L.L.** 輸入為 **eɪ ɛ l ɛ l**。

  即使您未指定 `IPA` 欄的內容，也必須包含空白 `IPA` 欄。如果您在 `IPA` 欄中包含值，則無法提供 `SoundsLike` 欄的值。

  如需特定語言允許的 IPA 字元清單，請參閱 [Amazon Transcribe Medical 的字元集](charsets-med.md)。美式英文是 Amazon Transcribe Medical 中唯一可用的語言。
+ `SoundsLike`(必填欄，可選填值) – 您可以將單字或片語分成較小的區段，並使用語言的標準正字法，為每個區段提供發音，以模仿單字的發音。例如，在英文中您可以提供片語 **cerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy** 的發音提示，如下所示：**sir-e-brul-aut-o-som-ul-dah-mi-nant-ar-ter-ri-o-pa-thy-with-sub-cor-ti-cul-in-farcts-and-lewk-o-en-ce-phul-ah-pu-thy**。片語 **atrioventricular-nodal-reentrant-tachycardia** 的提示看起來像這樣：**ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia**。您可以使用連字號 (-) 區隔提示的每個部分。

  即使您未提供 `SoundsLike` 欄的值，也必須包含空白 `SoundsLike` 欄。如果您在 `SoundsLike` 欄中包含值，則無法提供 `IPA` 欄的值。

  您可對輸入語言使用任何允許的字元。針對允許使用的字元清單，請參閱 [Amazon Transcribe Medical 的字元集](charsets-med.md)。
+ `DisplayAs` (必填欄，可選填值)– 定義單字或片語輸出時的外觀。例如，如果單字或片語為 **cerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy**，則您可以將顯示形式指定為 `cerebral autosomal dominant arteriopathy with subcortical infarcts and leukoencephalopathy`，使連字號不會出現。如果您想要在輸出中顯示縮寫，而不是完整的術語，您也可以指定 `DisplayAs` 為 `CADASIL`。

  如果您未指定資料`DisplayAs`欄， Amazon Transcribe Medical 會使用輸出中輸入檔案的資料`Phrase`欄。

  您可以在 `DisplayAs` 欄中使用任何 UTF-8 字元。

您僅可在 `IPA` 和 `DisplayAs` 欄中的值納入空格。

若要建立自訂詞彙的文字檔案，請將文字檔案中的每個單字或片語放在不同的行上。請使用 Tab 字元分隔欄。僅在 `IPA` 和 `DisplayAs` 欄中包含值。將副檔名為 的檔案儲存在您使用 Amazon Transcribe Medical 建立自訂詞彙 AWS 區域 的相同 Amazon S3 儲存貯體`.txt`中。

您的自訂詞彙檔案支援 `LF`和 `CRLF`行結尾。

下列範例顯示可用來建立自訂詞彙的文字。若要從這些範例建立自訂詞彙，請將範例複製到文字編輯器中，以 Tab 字元取代 `[TAB]`，然後將儲存的文字檔案上傳到 Amazon S3。

```
Phrase[TAB]IPA[TAB]SoundsLike[TAB]DisplayAs
acute-respiratory-distress-syndrome[TAB][TAB][TAB]acute respiratory distress syndrome
A.L.L.[TAB]eɪ ɛ l ɛ l[TAB][TAB]ALL
atrioventricular-nodal-reentrant-tachycardia[TAB][TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB]
```

您可以按任何順序輸入欄。下列範例顯示自訂詞彙輸入檔案的其他有效結構。

```
Phrase[TAB]SoundsLike[TAB]IPA[TAB]DisplayAs
acute-respiratory-distress-syndrome[TAB][TAB][TAB]acute respiratory distress syndrome
A.L.L.[TAB][TAB]eɪ ɛ l ɛ l[TAB]ALL
atrioventricular-nodal-reentrant-tachycardia[TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB][TAB]
```

```
DisplayAs[TAB]SoundsLike[TAB]IPA[TAB]Phrase
acute respiratory distress syndrome[TAB][TAB][TAB]acute-respiratory-distress-syndrome
ALL[TAB][TAB]eɪ ɛ l ɛ l[TAB]A.L.L.
[TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB][TAB]atrioventricular-nodal-reentrant-tachycardia
```

為了便於閱讀，下表以 html 格式更清楚地顯示前面的例子。它們只是為了描述這些範例。


| 片語 | IPA | SoundsLike | DisplayAs | 
| --- | --- | --- | --- | 
| acute-respiratory-distress-syndrome |  |  | acute respiratory distress syndrome | 
| A.L.L. | eɪ ɛ l ɛ l |  | ALL | 
| atrioventricular-nodal-reentrant-tachycardia |  | ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia |  | 


| 片語 | SoundsLike | IPA | DisplayAs | 
| --- | --- | --- | --- | 
| acute-respiratory-distress-syndrome |  |  | acute respiratory distress syndrome | 
| atrioventricular-nodal-reentrant-tachycardia | ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia |  |  | 
| A.L.L. |  | eɪ ɛ l ɛ l | ALL | 


| DisplayAs | SoundsLike | IPA | 片語 | 
| --- | --- | --- | --- | 
| acute respiratory distress syndrome |  |  | acute-respiratory-distress-syndrome | 
| ALL |  | eɪ ɛ l ɛ l | A.L.L. | 
|  | ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia |  | atrioventricular-nodal-reentrant-tachycardia | 