

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 사용자 지정 의학 어휘를 통한 트랜스크립션 정확도 향상
<a name="vocabulary-med"></a>

 Amazon Transcribe Medical에서 트랜스크립션 정확도를 높이려면 하나 이상의 의료 사용자 지정 어휘를 생성하고 사용합니다. *사용자 지정 어휘*는 도메인별 단어 또는 구절의 모음입니다. 이 모음은 해당 단어 또는 구문을 트랜스크립션하는 데 있어 Amazon Transcribe Medical의 성능을 개선하는 데 도움이 됩니다.

 Amazon Transcribe Medical을 사용할 때 자체 데이터의 무결성에 대한 책임은 사용자에게 있습니다. 기밀 정보, 개인 정보(PII) 또는 보호 대상 건강 정보(PHI)를 사용자 지정 어휘에 입력하지 마세요.

최상의 결과를 얻으려면 각각 특정 오디오 녹음을 트랜스크립션하는 데 도움이 되는 작은 사용자 지정 어휘를 별도로 만드세요. 모든 녹음에 사용할 큰 사용자 지정 어휘를 하나 생성했을 때보다 필사 정확도가 크게 향상됩니다.

기본적으로 에는 최대 100개의 사용자 지정 어휘가 있을 수 있습니다 AWS 계정. 사용자 지정 어휘의 용량은 50KB를 초과할 수 없습니다. 에 포함할 수 있는 사용자 지정 어휘 수 증가를 요청하는 방법에 대한 자세한 내용은 서비스 할당량을 AWS 계정참조하세요. [AWS](https://docs.aws.amazon.com/general/latest/gr/aws_service_limits.html) 

사용자 지정 어휘는 미국 영어(en-US)로 제공됩니다.

**Topics**
+ [사용자 지정 의학 어휘를 위한 텍스트 파일 생성](create-med-vocab-text.md)
+ [텍스트 파일을 사용하여 사용자 지정 의학 어휘 생성](create-med-custom-vocabulary.md)
+ [사용자 지정 의학 어휘를 사용한 오디오 파일 트랜스크립션](start-med-custom-vocab-job.md)
+ [사용자 지정 의학 어휘를 사용한 실시간 스트림의 트랜스크립션](start-med-vocab-stream.md)
+ [Amazon Transcribe Medical의 문자 집합](charsets-med.md)

# 사용자 지정 의학 어휘를 위한 텍스트 파일 생성
<a name="create-med-vocab-text"></a>

사용자 지정 어휘를 생성하려면 UTF-8 형식의 텍스트 파일을 만듭니다. 이 파일에서는 4열 테이블을 만들고 각 열에서 필드를 지정합니다. 각 필드는 도메인별 용어가 발음되는 방식 또는 트랜스크립션에 이러한 용어를 표시하는 방법을 Amazon Transcribe Medical에 알려줍니다. 이러한 필드가 포함된 텍스트 파일을 Amazon S3 버킷에 저장합니다.

## 텍스트 파일 형식 지정 방법 이해
<a name="understand-vocab-formatting"></a>

사용자 지정 의학 어휘를 생성하려면 열 이름을 머리글 행으로 입력합니다. 머리글 행 아래에 각 열의 값을 입력합니다.

테이블에 있는 4개 열의 이름은 다음과 같습니다.
+  `Phrase` - 열은 필수, 값은 필수 
+  `IPA` - 열은 필수, 값은 선택 사항일 수 있음 
+  `SoundsLike` - 열은 필수, 값은 선택 사항일 수 있음 
+  `DisplayAs` - 열은 필수, 값은 선택 사항일 수 있음 

사용자 지정 어휘를 만드는 경우 다음 사항을 확인하세요.
+ 각 열을 단일 Tab 문자로 구분합니다. 열을 공백 또는 여러 Tab 문자로 구분하려고 하면 오류 메시지가 Amazon Transcribe 표시됩니다.
+ 열 내 각 값 뒤에 후행 공백이나 여백이 없어야 합니다.

각 열에 입력하는 값이 다음과 같은지 확인하세요.
+ 256자 미만(하이픈 포함)
+ 허용된 문자 집합의 문자만 사용하세요([Amazon Transcribe Medical의 문자 집합](charsets-med.md) 섹션 참조).

## 테이블의 열에 대한 값 입력
<a name="entering-vocabulary-values-med"></a>

다음 정보는 테이블의 4개 열에 대한 값을 지정하는 방법을 보여줍니다.
+ `Phrase` - 인식해야 하는 단어 또는 구절. 이 열에 값을 입력해야 합니다.

  구절을 입력할 경우 단어는 하이픈(-)으로 구분합니다. 예를 들면 **cerebral autosomal dominant arteriopathy with subcortical infarcts and leukoencephalopathy**를 **cerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy** 형식으로 입력합니다.

  머리글자어 또는 문자를 개별적으로 발음해야 하는 기타 단어를 점으로 구분된 단일 문자로 입력합니다(예: **D.N.A.** 또는 **S.T.E.M.I.**). “STEMIs”와 같은 복수 형태의 머리글자어를 입력하려면 하이픈을 사용하여 머리글자어에서 “s”를 구분합니다(예: “**S.T.E.M.I-s**”). 머리글자어는 대문자 또는 소문자를 사용할 수 있습니다.

  `Phrase` 열은 필수 항목입니다. 허용되는 모든 문자를 입력 언어로 사용할 수 있습니다. 허용되는 문자는 [Amazon Transcribe Medical의 문자 집합](charsets-med.md) 단원을 참조하세요. `DisplayAs` 열을 지정하지 않으면 Amazon Transcribe Medical은 출력 파일의 `Phrase` 열 내용을 사용합니다.
+ `IPA`(열은 필수, 값은 선택 사항일 수 있음) – 단어나 구절의 발음을 지정하려면 이 열의 [IPA(International Phonetic Alphabet)](https://en.wikipedia.org/wiki/International_Phonetic_Alphabet)에 문자를 포함하면 됩니다. `IPA` 열에는 선행 또는 후행 공백을 포함할 수 없으며 입력에서 단일 공백을 사용하여 각 음소를 구분해야 합니다. 예를 들어 영어에서는 **acute-respiratory-distress-syndrome** 구절을 **ə k j u t ɹ ɛ s p ɪ ɹ ə t ɔ ɹ i d ɪ s t ɹ ɛ s s ɪ n d ɹ oʊ m** 형식으로 입력합니다. **A.L.L.** 구절은 **eɪ ɛ l ɛ l** 형식으로 입력합니다.

  `IPA` 열의 콘텐츠를 지정하지 않아도 빈 `IPA` 열을 포함해야 합니다. `IPA` 열에 값을 포함하는 경우 `SoundsLike` 열의 값을 제공할 수 없습니다.

  특정 언어에 대해 허용되는 IPA 문자 목록은 [Amazon Transcribe Medical의 문자 집합](charsets-med.md) 단원을 참조하세요. 미국 영어는 Amazon Transcribe Medical에서 사용할 수 있는 유일한 언어입니다.
+ `SoundsLike`(열은 필수, 값은 선택 사항일 수 있음) - 단어나 구절을 보다 작은 조각으로 분리하고 언어의 표준 철자법을 사용하여 각 조각의 발음을 제공하여 단어의 소리를 모방할 수 있습니다. 예를 들어 **cerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy** 구절에 대한 발음 힌트는 **sir-e-brul-aut-o-som-ul-dah-mi-nant-ar-ter-ri-o-pa-thy-with-sub-cor-ti-cul-in-farcts-and-lewk-o-en-ce-phul-ah-pu-thy**의 형식으로 제공할 수 있습니다. **atrioventricular-nodal-reentrant-tachycardia** 구절에 대한 힌트는 **ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia**의 형식으로 제공할 수 있습니다. 힌트의 각 부분은 하이픈(-)으로 구분합니다.

  `SoundsLike` 열의 값을 제공하지 않아도 빈 `SoundsLike` 열을 포함해야 합니다. `SoundsLike` 열에 값을 포함하는 경우 `IPA` 열의 값을 제공할 수 없습니다.

  허용되는 모든 문자를 입력 언어로 사용할 수 있습니다. 허용되는 문자 목록은 [Amazon Transcribe Medical의 문자 집합](charsets-med.md) 단원을 참조하세요.
+ `DisplayAs`(열은 필수, 값은 선택 사항일 수 있음) - 출력 시 단어나 구절이 어떻게 보이는지 정의합니다. 예를 들어 단어 또는 구절이 **cerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy**일 경우 표시 형식을 `cerebral autosomal dominant arteriopathy with subcortical infarcts and leukoencephalopathy`로 지정하여 하이픈이 포함되지 않도록 할 수 있습니다. 출력에서 전체 용어 대신 머리글자어를 표시하려는 `DisplayAs`를 `CADASIL` 형식으로 지정할 수도 있습니다.

  `DisplayAs` 열을 지정하지 않으면 Amazon Transcribe Medical은 출력의 입력 파일에서 `Phrase` 열을 사용합니다.

  `DisplayAs` 열에 UTF-8 문자를 사용할 수 있습니다.

`IPA` 및 `DisplayAs` 열의 값에만 공백을 포함할 수 있습니다.

사용자 지정 어휘의 텍스트 파일을 새성하려면 텍스트 파일의 각 단어나 문구를 별도의 줄에 배치하세요. 탭 문자로 열을 구분합니다. `IPA` 및 `DisplayAs` 열의 값에만 공백을 포함합니다. 확장자가 있는 파일을 Amazon Transcribe Medical`.txt`을 사용하여 사용자 지정 어휘를 생성하는 AWS 리전 동일한의 Amazon S3 버킷에 저장합니다.

Windows에서 텍스트 파일을 편집하는 경우 파일 형식이 `LF`가 아닌 `CRLF`인지 확인합니다. 그렇지 않으면 사용자 지정 어휘를 작성할 수 없습니다. 일부 텍스트 편집기에서는 찾기 및 바꾸기 명령을 사용하여 서식을 변경할 수 있습니다.

다음 예시에서는 사용자 지정 어휘를 작성하는 데 사용할 수 있는 텍스트를 보여줍니다. 이러한 예제에서 사용자 정의 어휘를 작성하려면 예시를 텍스트 편집기에 복사하고 `[TAB]`을 탭 문자로 바꾸고 저장된 텍스트 파일을 Amazon S3에 업로드합니다.

```
Phrase[TAB]IPA[TAB]SoundsLike[TAB]DisplayAs
acute-respiratory-distress-syndrome[TAB][TAB][TAB]acute respiratory distress syndrome
A.L.L.[TAB]eɪ ɛ l ɛ l[TAB][TAB]ALL
atrioventricular-nodal-reentrant-tachycardia[TAB][TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB]
```

원하는 순서로 열을 입력할 수 있습니다. 다음 예시에서는 사용자 지정 어휘 입력 파일의 다른 유효한 구조를 보여줍니다.

```
Phrase[TAB]SoundsLike[TAB]IPA[TAB]DisplayAs
acute-respiratory-distress-syndrome[TAB][TAB][TAB]acute respiratory distress syndrome
A.L.L.[TAB][TAB]eɪ ɛ l ɛ l[TAB]ALL
atrioventricular-nodal-reentrant-tachycardia[TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB][TAB]
```

```
DisplayAs[TAB]SoundsLike[TAB]IPA[TAB]Phrase
acute respiratory distress syndrome[TAB][TAB][TAB]acute-respiratory-distress-syndrome
ALL[TAB][TAB]eɪ ɛ l ɛ l[TAB]A.L.L.
[TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB][TAB]atrioventricular-nodal-reentrant-tachycardia
```

읽기 쉽도록 다음 테이블은 위의 예시를 html 형식으로 더 명확하게 보여줍니다. 예시를 설명하기 위한 용도로만 사용됩니다.


| 구절 | IPA | SoundsLike | DisplayAs | 
| --- | --- | --- | --- | 
| acute-respiratory-distress-syndrome |  |  | acute respiratory distress syndrome | 
| A.L.L. | eɪ ɛ l ɛ l |  | ALL | 
| atrioventricular-nodal-reentrant-tachycardia |  | ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia |  | 


| 구절 | SoundsLike | IPA | DisplayAs | 
| --- | --- | --- | --- | 
| acute-respiratory-distress-syndrome |  |  | acute respiratory distress syndrome | 
| atrioventricular-nodal-reentrant-tachycardia | ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia |  |  | 
| A.L.L. |  | eɪ ɛ l ɛ l | ALL | 


| DisplayAs | SoundsLike | IPA | 구절 | 
| --- | --- | --- | --- | 
| acute respiratory distress syndrome |  |  | acute-respiratory-distress-syndrome | 
| ALL |  | eɪ ɛ l ɛ l | A.L.L. | 
|  | ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia |  | atrioventricular-nodal-reentrant-tachycardia | 

# 텍스트 파일을 사용하여 사용자 지정 의학 어휘 생성
<a name="create-med-custom-vocabulary"></a>

사용자 지정 어휘를 생성하려면 단어 또는 문구 모음이 포함된 텍스트 파일을 준비해야 합니다. Amazon Transcribe Medical은이 텍스트 파일을 사용하여 해당 단어 또는 문구의 트랜스크립션 정확도를 개선하는 데 사용할 수 있는 사용자 지정 어휘를 생성합니다. [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateMedicalVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_CreateMedicalVocabulary.html) API 또는 Amazon Transcribe Medical 콘솔을 사용하여 사용자 지정 어휘를 생성할 수 있습니다.

## AWS Management Console
<a name="create-med-custom-vocab-console"></a>

 AWS Management Console 를 사용하여 사용자 지정 어휘를 생성하려면 단어 또는 문구가 포함된 텍스트 파일의 Amazon S3 URI를 제공합니다.

1. [AWS Management Console](https://console.aws.amazon.com/transcribe/)에 로그인합니다.

1. 탐색 창의 Amazon Transcribe Medical에서 **사용자 지정 어휘를** 선택합니다.

1. **이름**의 경우 **어휘 설정**에서 사용자 지정 어휘의 이름을 선택합니다.

1.  Amazon S3에서 오디오 파일 또는 비디오 파일의 위치를 지정합니다.
   + **어휘 설정**의 **S3의 어휘 입력 파일 위치**에서 사용자 지정 어휘를 생성하는 데 사용할 텍스트 파일을 식별하는 Amazon S3 URI를 지정합니다.
   + **S3의 어휘 입력 파일 위치**에서 **Browse S3**를 선택하여 텍스트 파일을 찾아 선택합니다.

1. **어휘 생성**을 선택합니다.

 AWS Management Console에서 사용자 지정 어휘의 처리 상태를 확인할 수 있습니다.

## API
<a name="create-med-custom-vocab-api"></a>

**사용자 지정 의학 어휘를 생성하려면(API)**
+ [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html) API의 경우 다음을 지정하세요.

  1. `LanguageCode`에서 `en-US`를 지정합니다.

  1. 에서 사용자 지정 어휘를 정의하는 데 사용하는 텍스트 파일의 Amazon S3 위치를 `VocabularyFileUri`지정합니다.

  1. `VocabularyName`에서 사용자 지정 어휘의 이름을 지정합니다. 지정하는 이름은 내에서 고유해야 합니다 AWS 계정.

사용자 지정 어휘의 처리 상태를 보려면 [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_GetMedicalVocabulary.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_GetMedicalVocabulary.html) API를 사용하세요.

다음은를 사용하여 사용자 지정 어휘를 AWS SDK for Python (Boto3) 생성하는 요청의 예입니다.

```
from __future__ import print_function
import time
import boto3  
transcribe = boto3.client('transcribe', 'us-west-2')
vocab_name = "my-first-vocabulary"
response = transcribe.create_medical_vocabulary(
    VocabularyName = job_name,
    VocabularyFileUri = 's3://amzn-s3-demo-bucket/my-vocabularies/my-vocabulary-table.txt'
    LanguageCode = 'en-US',
  )
  
while True:
    status = transcribe.get_medical_vocabulary(VocabularyName = vocab_name)
    if status['VocabularyState'] in ['READY', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)
```

## AWS CLI
<a name="create-med-custom-vocab-cli"></a>

**배치 트랜스크립션 작업에서 화자 파티셔닝을 활성화하려면(AWS CLI)**
+ 다음 코드를 실행합니다.

  ```
  aws transcribe create-medical-vocabulary \
  --vocabulary-name my-first-vocabulary \ 
  --vocabulary-file-uri s3://amzn-s3-demo-bucket/my-vocabularies/my-vocabulary-file.txt \
  --language-code en-US
  ```

# 사용자 지정 의학 어휘를 사용한 오디오 파일 트랜스크립션
<a name="start-med-custom-vocab-job"></a>

[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html) 또는를 사용하여 사용자 지정 어휘를 사용하여 트랜스크립션 정확도를 개선하는 트랜스크립션 작업을 AWS Management Console 시작합니다.

## AWS Management Console
<a name="start-med-custom-vocab-job-console"></a>

1. [AWS Management Console](https://console.aws.amazon.com/transcribe/)에 로그인합니다.

1. 탐색 창의 Amazon Transcribe Medical에서 **트랜스크립션 작업을** 선택합니다.

1. **작업 생성**을 선택합니다.

1. **작업 세부 정보 지정** 페이지에서 트랜스크립션 작업에 대한 정보를 제공합니다.

1. **다음**을 선택합니다.

1. **사용자 지정**에서 **사용자 지정 어휘**를 활성화합니다.

1. **어휘 선택**에서 사용자 지정 어휘를 선택합니다.

1. **생성(Create)**을 선택합니다.

## API
<a name="start-med-custom-vocab-api"></a>

**배치 트랜스크립션 작업을 사용하여 오디오 파일의 화자 파티셔닝을 활성화하려면(API)**
+ [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html) API의 경우 다음을 지정하세요.

  1. `MedicalTranscriptionJobName`에서 AWS 계정의 고유한 이름을 지정합니다.

  1. `LanguageCode`에는 오디오 파일에서 사용하는 언어와 어휘 필터의 언어에 해당하는 언어 코드를 지정합니다.

  1. `Media` 객체의 `MediaFileUri` 파라미터에서 트랜스크립션할 오디오 파일의 이름을 지정합니다.

  1. `Specialty`에는 오디오 파일에서 말하는 임상의의 전문 분야를 지정합니다.

  1. `Type`에는 오디오 파일이 대화인지 구술인지를 지정합니다.

  1. `OutputBucketName`에서 트랜스크립션 결과를 저장할 Amazon S3 버킷을 지정합니다.

  1. `Settings` 객체에서 다음을 지정합니다.

     1. `VocabularyName` - 사용자 지정 어휘의 이름.

다음 요청은 AWS SDK for Python (Boto3) 를 사용하여 사용자 지정 어휘로 배치 트랜스크립션 작업을 시작합니다.

```
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
job_name = "my-first-med-transcription-job"
job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
transcribe.start_medical_transcription_job(
   MedicalTranscriptionJobName = job_name,
   Media = {
       'MediaFileUri': job_uri
   },
   OutputBucketName = 'amzn-s3-demo-bucket',
   OutputKey = 'my-output-files/', 
   LanguageCode = 'en-US',
   Specialty = 'PRIMARYCARE',
   Type = 'CONVERSATION',
   Settings = {
       'VocabularyName': 'example-med-custom-vocab'
       }
 )

while True:
   status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name)
   if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)
```

# 사용자 지정 의학 어휘를 사용한 실시간 스트림의 트랜스크립션
<a name="start-med-vocab-stream"></a>

실시간 스트림에서 트랜스크립션 정확도를 높이려면 HTTP/2 또는 WebSocket 스트림을 사용하여 사용자 지정 어휘를 사용할 수 있습니다. HTTP/2 요청을 시작하려면 [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html) API를 사용하세요. 사용자 지정 어휘는 , AWS Management Console[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html) API 또는 WebSocket 프로토콜을 사용하여 실시간으로 사용할 수 있습니다.

## 마이크에 대고 말하는 구술의 트랜스크립션(AWS Management Console)
<a name="streaming-medical-vocabulary-console"></a>

 AWS Management Console 를 사용하여 의료 구술의 스트리밍 오디오를 트랜스크립션하려면 의료 구술을 트랜스크립션하고 스트림을 시작한 다음 마이크에 말하기 시작하는 옵션을 선택합니다.

**의료 구술의 스트리밍 오디오를 트랜스크립션하려면(AWS Management Console)**

1. [AWS Management Console](https://console.aws.amazon.com/transcribe/)에 로그인합니다.

1. 탐색 창의 Amazon Transcribe Medical에서 실시간 트랜스**크**립션을 선택합니다.

1. **의료 전문 분야**에는 스트림에서 말하는 임상의의 의료 전문 분야를 선택합니다.

1. **오디오 입력 유형**에서 **대화** 또는 **구술**을 선택합니다.

1. **추가 설정**에서 **사용자 지정 어휘**를 선택합니다.

   1. **어휘 선택**에서 사용자 지정 어휘를 선택합니다.

1. **스트리밍 시작**을 선택합니다.

1. 마이크에 대고 말합니다.

## HTTP/2 스트림에서 화자 파티셔닝 활성화
<a name="vocabulary-med-http2"></a>

다음은 HTTP/2 요청 파라미터의 구문입니다.

```
POST /medical-stream-transcription HTTP/2
host: transcribestreaming.us-west-2.amazonaws.com
authorization: Generated value
x-amz-target: com.amazonaws.transcribe.Transcribe.StartMedicalStreamTranscription
x-amz-content-sha256: STREAMING-MED-AWS4-HMAC-SHA256-EVENTS
x-amz-date: 20220208T235959Z
x-amzn-transcribe-session-id: my-first-http2-med-stream
x-amzn-transcribe-language-code: en-US
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000
x-amzn-transcribe-vocabulary-name: my-first-med-vocab
x-amzn-transcribe-specialty: PRIMARYCARE
x-amzn-transcribe-type: CONVERSATION
x-amzn-transcribe-show-speaker-label: true
Content-type: application/vnd.amazon.eventstream
transfer-encoding: chunked
```

파라미터 설명:
+ **호스트**: 호출하려는 로 AWS 리전 (이전 예제의 'us-west-2')를 업데이트 AWS 리전 합니다. 유효한 목록은 및 엔드포인트를 AWS 리전참조하세요. [AWS 리전](https://docs.aws.amazon.com/general/latest/gr/rande.html#transcribe_region) 
+ **권한**: 생성된 필드. 서명 생성에 대한 자세한 내용은 [서명 버전 4로 AWS 요청 서명을 참조하세요](https://docs.aws.amazon.com/general/latest/gr/sigv4_signing.html).
+ **x-amz-target**: 이 필드를 변경하지 말고 이전 예시에 표시된 콘텐츠를 사용하세요.
+ **x-amz-content-sha256**: 생성된 필드. 서명 계산에 대한 자세한 내용은 [서명 버전 4로 AWS 요청 서명을 참조하세요](https://docs.aws.amazon.com/general/latest/gr/sigv4_signing.html).
+ **x-amz-date**: 서명이 생성된 날짜 및 시간. 형식은 YYYYMMDDTHHMMSSZ입니다. 여기서 YYYY=년, MM=월, DD=일, HH=시간, MM=분, SS=초이고, 'T'와 'Z'는 고정 문자입니다. 자세한 내용은 [서명 버전 4의 날짜 처리](https://docs.aws.amazon.com/general/latest/gr/sigv4-date-handling.html)를 참조하세요.
+ **x-amzn-transcribe-session-id**: 스트리밍 세션의 이름.
+ **x-amzn-transcribe-language-code**: 입력 오디오에 사용되는 인코딩. 유효한 값 목록은 [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html) 또는 [지원되는 언어 및 언어별 기능](supported-languages.md) 섹션을 참조하세요.
+ **x-amzn-transcribe-media-encoding**: 입력 오디오에 사용되는 인코딩. 유효한 값은 `pcm`, `ogg-opus`, `flac`입니다.
+ **x-amzn-transcribe-sample-rate**: 입력 오디오의 샘플 속도(Hz)입니다.는 8,000Hz\$148,000Hz의 범위를 Amazon Transcribe 지원합니다. 전화 오디오와 같은 저품질 오디오는 일반적으로 약 8,000Hz입니다. 고품질 오디오의 범위는 일반적으로 16,000Hz에서 48,000Hz입니다. 단, 지정하는 샘플 속도는 오디오의 샘플 속도와 **반드시** 일치해야 합니다.
+ **x-amzn-transcribe-vocabulary-name**: 트랜스크립션에 사용하려는 어휘의 이름.
+ **x-amzn-transcribe-specialty**: 트랜스크립션 대상 의료 전문 분야.
+ **x-amzn-transcribe-type**: 구술인지 대화인지를 선택하세요.
+ **x-amzn-transcribe-show-speaker-label**: 분할을 활성화하려면 이 값이 `true`여야 합니다.
+ **content-type**: 이 필드를 변경하지 말고 이전 예시에 표시된 콘텐츠를 사용하세요.

## WebSocket 요청에서 화자 파티셔닝 활성화
<a name="vocabulary-websocket"></a>

API를 사용하여 WebSocket 스트림에서 화자를 분할하려면 다음 형식을 사용하여 미리 서명된 URL을 만들고 WebSocket 요청을 시작하여 `vocabulary-name`을 사용자 지정 어휘의 이름으로 설정하세요.

```
GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/medical-stream-transcription-websocket
?language-code=en-US
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=Signature Version 4 signature 
&X-Amz-SignedHeaders=host
&media-encoding=flac
&sample-rate=16000
&session-id=sessionId
&specialty=medicalSpecialty
&type=CONVERSATION
&vocabulary-name=vocabularyName
&show-speaker-label=boolean
```

# Amazon Transcribe Medical의 문자 집합
<a name="charsets-med"></a>

 Amazon Transcribe Medical에서 사용자 지정 어휘를 사용하려면 다음 문자 집합을 사용합니다.

## 영어 문자 집합
<a name="char-english-med"></a>

영어 사용자 지정 어휘의 경우 `Phrase` 및 `SoundsLike` 열에 다음 문자를 사용할 수 있습니다.
+ a - z
+ A - Z
+ ' (아포스트로피)
+ - (하이픈)
+ . (마침표)

어휘 입력 파일의 `IPA` 열에 다음 IPA(International Phonetic Alphabet) 문자를 사용할 수 있습니다.


| 문자 | 코드 | 문자 | 코드 | 
| --- | --- | --- | --- | 
| aʊ | 0061 028A | w | 0077 | 
| aɪ | 0061 026A | z | 007A | 
| b | 0062 | æ | 00E6 | 
| d | 0064 | ð | 00F0 | 
| eɪ | 0065 026A | ŋ | 014B | 
| f | 0066 | ɑ | 0251 | 
| g | 0067 | ɔ | 0254 | 
| h | 0068 | ɔɪ | 0254 026A | 
| i | 0069 | ə | 0259 | 
| j | 006A | ɛ | 025B | 
| k | 006B | ɝ | 025D | 
| l | 006C | ɡ | 0261 | 
| l̩ | 006C 0329 | ɪ | 026A | 
| m | 006D | ɹ | 0279 | 
| n | 006E | ʃ | 0283 | 
| n̩ | 006E 0329 | ʊ | 028A | 
| oʊ | 006F 028A | ʌ | 028C | 
| p | 0070 | ʍ | 028D | 
| s | 0073 | ʒ | 0292 | 
| t | 0074 | ʤ | 02A4 | 
| u | 0075 | ʧ | 02A7 | 
| v | 0076 | θ | 03B8 | 