

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 사용자 지정 의학 어휘를 위한 텍스트 파일 생성
<a name="create-med-vocab-text"></a>

사용자 지정 어휘를 생성하려면 UTF-8 형식의 텍스트 파일을 만듭니다. 이 파일에서는 4열 테이블을 만들고 각 열에서 필드를 지정합니다. 각 필드는 도메인별 용어가 발음되는 방식 또는 트랜스크립션에 이러한 용어를 표시하는 방법을 Amazon Transcribe Medical에 알려줍니다. 이러한 필드가 포함된 텍스트 파일을 Amazon S3 버킷에 저장합니다.

## 텍스트 파일 형식 지정 방법 이해
<a name="understand-vocab-formatting"></a>

사용자 지정 의학 어휘를 생성하려면 열 이름을 머리글 행으로 입력합니다. 머리글 행 아래에 각 열의 값을 입력합니다.

테이블에 있는 4개 열의 이름은 다음과 같습니다.
+  `Phrase` - 열은 필수, 값은 필수 
+  `IPA` - 열은 필수, 값은 선택 사항일 수 있음 
+  `SoundsLike` - 열은 필수, 값은 선택 사항일 수 있음 
+  `DisplayAs` - 열은 필수, 값은 선택 사항일 수 있음 

사용자 지정 어휘를 만드는 경우 다음 사항을 확인하세요.
+ 각 열을 단일 Tab 문자로 구분합니다. 열을 공백 또는 여러 Tab 문자로 구분하려고 하면 오류 메시지가 Amazon Transcribe 표시됩니다.
+ 열 내 각 값 뒤에 후행 공백이나 여백이 없어야 합니다.

각 열에 입력하는 값이 다음과 같은지 확인하세요.
+ 256자 미만(하이픈 포함)
+ 허용된 문자 집합의 문자만 사용하세요([Amazon Transcribe Medical의 문자 집합](charsets-med.md) 섹션 참조).

## 테이블의 열에 대한 값 입력
<a name="entering-vocabulary-values-med"></a>

다음 정보는 테이블의 4개 열에 대한 값을 지정하는 방법을 보여줍니다.
+ `Phrase` - 인식해야 하는 단어 또는 구절. 이 열에 값을 입력해야 합니다.

  구절을 입력할 경우 단어는 하이픈(-)으로 구분합니다. 예를 들면 **cerebral autosomal dominant arteriopathy with subcortical infarcts and leukoencephalopathy**를 **cerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy** 형식으로 입력합니다.

  머리글자어 또는 문자를 개별적으로 발음해야 하는 기타 단어를 점으로 구분된 단일 문자로 입력합니다(예: **D.N.A.** 또는 **S.T.E.M.I.**). “STEMIs”와 같은 복수 형태의 머리글자어를 입력하려면 하이픈을 사용하여 머리글자어에서 “s”를 구분합니다(예: “**S.T.E.M.I-s**”). 머리글자어는 대문자 또는 소문자를 사용할 수 있습니다.

  `Phrase` 열은 필수 항목입니다. 허용되는 모든 문자를 입력 언어로 사용할 수 있습니다. 허용되는 문자는 [Amazon Transcribe Medical의 문자 집합](charsets-med.md) 단원을 참조하세요. `DisplayAs` 열을 지정하지 않으면 Amazon Transcribe Medical은 출력 파일의 `Phrase` 열 내용을 사용합니다.
+ `IPA`(열은 필수, 값은 선택 사항일 수 있음) – 단어나 구절의 발음을 지정하려면 이 열의 [IPA(International Phonetic Alphabet)](https://en.wikipedia.org/wiki/International_Phonetic_Alphabet)에 문자를 포함하면 됩니다. `IPA` 열에는 선행 또는 후행 공백을 포함할 수 없으며 입력에서 단일 공백을 사용하여 각 음소를 구분해야 합니다. 예를 들어 영어에서는 **acute-respiratory-distress-syndrome** 구절을 **ə k j u t ɹ ɛ s p ɪ ɹ ə t ɔ ɹ i d ɪ s t ɹ ɛ s s ɪ n d ɹ oʊ m** 형식으로 입력합니다. **A.L.L.** 구절은 **eɪ ɛ l ɛ l** 형식으로 입력합니다.

  `IPA` 열의 콘텐츠를 지정하지 않아도 빈 `IPA` 열을 포함해야 합니다. `IPA` 열에 값을 포함하는 경우 `SoundsLike` 열의 값을 제공할 수 없습니다.

  특정 언어에 대해 허용되는 IPA 문자 목록은 [Amazon Transcribe Medical의 문자 집합](charsets-med.md) 단원을 참조하세요. 미국 영어는 Amazon Transcribe Medical에서 사용할 수 있는 유일한 언어입니다.
+ `SoundsLike`(열은 필수, 값은 선택 사항일 수 있음) - 단어나 구절을 보다 작은 조각으로 분리하고 언어의 표준 철자법을 사용하여 각 조각의 발음을 제공하여 단어의 소리를 모방할 수 있습니다. 예를 들어 **cerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy** 구절에 대한 발음 힌트는 **sir-e-brul-aut-o-som-ul-dah-mi-nant-ar-ter-ri-o-pa-thy-with-sub-cor-ti-cul-in-farcts-and-lewk-o-en-ce-phul-ah-pu-thy**의 형식으로 제공할 수 있습니다. **atrioventricular-nodal-reentrant-tachycardia** 구절에 대한 힌트는 **ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia**의 형식으로 제공할 수 있습니다. 힌트의 각 부분은 하이픈(-)으로 구분합니다.

  `SoundsLike` 열의 값을 제공하지 않아도 빈 `SoundsLike` 열을 포함해야 합니다. `SoundsLike` 열에 값을 포함하는 경우 `IPA` 열의 값을 제공할 수 없습니다.

  허용되는 모든 문자를 입력 언어로 사용할 수 있습니다. 허용되는 문자 목록은 [Amazon Transcribe Medical의 문자 집합](charsets-med.md) 단원을 참조하세요.
+ `DisplayAs`(열은 필수, 값은 선택 사항일 수 있음) - 출력 시 단어나 구절이 어떻게 보이는지 정의합니다. 예를 들어 단어 또는 구절이 **cerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy**일 경우 표시 형식을 `cerebral autosomal dominant arteriopathy with subcortical infarcts and leukoencephalopathy`로 지정하여 하이픈이 포함되지 않도록 할 수 있습니다. 출력에서 전체 용어 대신 머리글자어를 표시하려는 `DisplayAs`를 `CADASIL` 형식으로 지정할 수도 있습니다.

  `DisplayAs` 열을 지정하지 않으면 Amazon Transcribe Medical은 출력의 입력 파일에서 `Phrase` 열을 사용합니다.

  `DisplayAs` 열에 UTF-8 문자를 사용할 수 있습니다.

`IPA` 및 `DisplayAs` 열의 값에만 공백을 포함할 수 있습니다.

사용자 지정 어휘의 텍스트 파일을 새성하려면 텍스트 파일의 각 단어나 문구를 별도의 줄에 배치하세요. 탭 문자로 열을 구분합니다. `IPA` 및 `DisplayAs` 열의 값에만 공백을 포함합니다. 확장자가 있는 파일을 Amazon Transcribe Medical`.txt`을 사용하여 사용자 지정 어휘를 생성하는 AWS 리전 동일한의 Amazon S3 버킷에 저장합니다.

Windows에서 텍스트 파일을 편집하는 경우 파일 형식이 `LF`가 아닌 `CRLF`인지 확인합니다. 그렇지 않으면 사용자 지정 어휘를 작성할 수 없습니다. 일부 텍스트 편집기에서는 찾기 및 바꾸기 명령을 사용하여 서식을 변경할 수 있습니다.

다음 예시에서는 사용자 지정 어휘를 작성하는 데 사용할 수 있는 텍스트를 보여줍니다. 이러한 예제에서 사용자 정의 어휘를 작성하려면 예시를 텍스트 편집기에 복사하고 `[TAB]`을 탭 문자로 바꾸고 저장된 텍스트 파일을 Amazon S3에 업로드합니다.

```
Phrase[TAB]IPA[TAB]SoundsLike[TAB]DisplayAs
acute-respiratory-distress-syndrome[TAB][TAB][TAB]acute respiratory distress syndrome
A.L.L.[TAB]eɪ ɛ l ɛ l[TAB][TAB]ALL
atrioventricular-nodal-reentrant-tachycardia[TAB][TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB]
```

원하는 순서로 열을 입력할 수 있습니다. 다음 예시에서는 사용자 지정 어휘 입력 파일의 다른 유효한 구조를 보여줍니다.

```
Phrase[TAB]SoundsLike[TAB]IPA[TAB]DisplayAs
acute-respiratory-distress-syndrome[TAB][TAB][TAB]acute respiratory distress syndrome
A.L.L.[TAB][TAB]eɪ ɛ l ɛ l[TAB]ALL
atrioventricular-nodal-reentrant-tachycardia[TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB][TAB]
```

```
DisplayAs[TAB]SoundsLike[TAB]IPA[TAB]Phrase
acute respiratory distress syndrome[TAB][TAB][TAB]acute-respiratory-distress-syndrome
ALL[TAB][TAB]eɪ ɛ l ɛ l[TAB]A.L.L.
[TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB][TAB]atrioventricular-nodal-reentrant-tachycardia
```

읽기 쉽도록 다음 테이블은 위의 예시를 html 형식으로 더 명확하게 보여줍니다. 예시를 설명하기 위한 용도로만 사용됩니다.


| 구절 | IPA | SoundsLike | DisplayAs | 
| --- | --- | --- | --- | 
| acute-respiratory-distress-syndrome |  |  | acute respiratory distress syndrome | 
| A.L.L. | eɪ ɛ l ɛ l |  | ALL | 
| atrioventricular-nodal-reentrant-tachycardia |  | ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia |  | 


| 구절 | SoundsLike | IPA | DisplayAs | 
| --- | --- | --- | --- | 
| acute-respiratory-distress-syndrome |  |  | acute respiratory distress syndrome | 
| atrioventricular-nodal-reentrant-tachycardia | ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia |  |  | 
| A.L.L. |  | eɪ ɛ l ɛ l | ALL | 


| DisplayAs | SoundsLike | IPA | 구절 | 
| --- | --- | --- | --- | 
| acute respiratory distress syndrome |  |  | acute-respiratory-distress-syndrome | 
| ALL |  | eɪ ɛ l ɛ l | A.L.L. | 
|  | ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia |  | atrioventricular-nodal-reentrant-tachycardia | 