

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 转录医学口述
<a name="transcribe-medical-dictation"></a>

您可以使用 Medic Amazon Transcribe al 通过批量转录作业或实时流来转录临床医生口述的医疗记录。批量转录作业让您能够转录音频文件。您可以在转录工作或直播中指定临床医生的医学专业，以确保 Medic Amazon Transcribe al 以尽可能高的准确度生成转录结果。

您可以转录以下专业的医学口述：
+ 心脏科 – 仅在流式转录中可用
+ 神经科 – 仅在流式转录中可用
+ 肿瘤科 – 仅在流式转录中可用
+ 全科 – 包括以下类型的医疗机构：
  + 家庭医疗
  + 内科
  + 妇产科 (OB-GYN)
  + 儿科
+ 放射科 – 仅在流式转录中可用
+ 泌尿外科 – 仅在流式转录中可用

您可以使用自定义词汇表来提高转录的准确性。有关医学自定义词汇表的信息，请参阅[使用医学自定义词汇表提高转录准确性](vocabulary-med.md)。

默认情况下，M Amazon Transcribe edical 会返回置信度最高的转录。如果您想将其配置为返回备选转录，请参阅[生成备选转录](alternative-med-transcriptions.md)。

有关数字和医学测量结果在转录输出中的显示方式的信息，请参阅[转录数值](how-numbers-med.md)和[转录医学术语和测量结果](how-measurements-med.md)。

**Topics**
+ [转录医学口述的音频文件](batch-medical-dictation.md)
+ [在实时音频流中转录医学口述](streaming-medical-dictation.md)

# 转录医学口述的音频文件
<a name="batch-medical-dictation"></a>

使用批量转录作业转录医疗对话的音频文件。您可以用它来转录临床医生与患者的对话。您可以通过 [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html) API 或 AWS 管理控制台来启动批量转录作业。

使用 [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html) API 启动医疗转录作业时，您可以将 `PRIMARYCARE` 指定为 `Specialty` 参数的值。

## AWS 管理控制台
<a name="batch-med-dictation-console"></a>

**转录临床医生与患者的对话（AWS 管理控制台）**

**要使用转录临床医生与患者的对话，请创建转录作业，然后选择**对话**作为音频输入类型。 AWS 管理控制台 **

1. 登录到 [AWS 管理控制台](https://console.aws.amazon.com/transcribe/)。

1. 在导航窗格的 “ Amazon Transcribe 医疗” 下，选择 “**转录作业**”。

1. 请选择**创建任务**。

1. 在**指定作业详细信息**页面上的**作业设置**下，指定以下设置。

   1. **名称** – 转录作业的名称。

   1. **音频输入类型** – **口述**

1. 对于其余字段，请指定音频文件的 Amazon S3 位置以及要存储转录作业输出的位置。

1. 选择**下一步**。

1. 选择**创建**。

## API
<a name="batch-med-dictation-api"></a>

**使用批量转录作业转录医疗谈话 (API)**
+ 对于 [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html) API，请指定以下内容。

  1. 对于 `MedicalTranscriptionJobName`，请指定对于您 AWS 账户而言唯一的名称。

  1. 对于 `LanguageCode`，指定与音频文件中所用语言和词汇表筛选条件的语言对应的语言代码。

  1. 在 `Media` 对象的 `MediaFileUri` 参数中，指定要转录的音频文件的名称。

  1. 对于 `Specialty`，请指定音频文件中说话的临床医生的医学专科。

  1. 对于 `Type`，请指定 `DICTATION`。

  1. 对于 `OutputBucketName`，请指定要将转录结果存储到的 Amazon S3 存储桶。

  以下是一个请求示例，该请求使用 适用于 Python (Boto3) 的 AWS SDK 转录该专业临床医生的医疗听写。`PRIMARYCARE`

  ```
   from __future__ import print_function
   import time
   import boto3
   transcribe = boto3.client('transcribe')
   job_name = "my-first-med-transcription-job"
   job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac"
   transcribe.start_medical_transcription_job(
       MedicalTranscriptionJobName = job_name,
       Media = {
          'MediaFileUri': job_uri
       },     
       OutputBucketName = 'amzn-s3-demo-bucket',                                
       OutputKey = 'my-output-files/', 
       LanguageCode = 'en-US',
       Specialty = 'PRIMARYCARE',
       Type = 'DICTATION'
   )
  while True:
      status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name)
      if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
          break
      print("Not ready yet...")
      time.sleep(5)
  print(status)
  ```

以下示例代码显示了医学口述的转录结果。

```
{
    "jobName": "dictation-medical-transcription-job",
    "accountId": "111122223333",
    "results": {
        "transcripts": [
            {
                "transcript": "... came for a follow up visit today..."
            }
        ],
        "items": [
            {
            ...
                "start_time": "4.85",
                "end_time": "5.12",
                "alternatives": [
                    {
                        "confidence": "1.0",
                        "content": "came"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "start_time": "5.12",
                "end_time": "5.29",
                "alternatives": [
                    {
                        "confidence": "1.0",
                        "content": "for"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "start_time": "5.29",
                "end_time": "5.33",
                "alternatives": [
                    {
                        "confidence": "0.9955",
                        "content": "a"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "start_time": "5.33",
                "end_time": "5.66",
                "alternatives": [
                    {
                        "confidence": "0.9754",
                        "content": "follow"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "start_time": "5.66",
                "end_time": "5.75",
                "alternatives": [
                    {
                        "confidence": "0.9754",
                        "content": "up"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "start_time": "5.75",
                "end_time": "6.02",
                "alternatives": [
                    {
                        "confidence": "1.0",
                        "content": "visit"
                    }
                ]
                ...
    },
    "status": "COMPLETED"
}
```

## AWS CLI
<a name="batch-med-dictation-cli"></a>

**在批量转录作业中启用发言者划分 (AWS CLI)**
+ 运行以下代码。

  ```
                      
  aws transcribe start-medical-transcription-job \
  --region us-west-2 \
  --cli-input-json file://example-start-command.json
  ```

  以下代码显示了 `example-start-command.json` 的内容。

  ```
  {
        "MedicalTranscriptionJobName": "my-first-med-transcription-job",        
        "Media": {
        "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac"
        },
        "OutputBucketName": "amzn-s3-demo-bucket",
        "OutputKey": "my-output-files/", 
        "LanguageCode": "en-US",  
        "Specialty": "PRIMARYCARE",
        "Type": "DICTATION"
  }
  ```

# 在实时音频流中转录医学口述
<a name="streaming-medical-dictation"></a>

使用 WebSocket 直播将医疗听写转录为音频流。您也可以使用将您或其他人直接说话的语音转录到麦克风中。 AWS 管理控制台 

 对于 HTTP/2 或 WebSocket 直播，您可以转录以下医学专业的音频：
+ 心脏科
+ 肿瘤科
+ 神经科
+ 全科
+ 放射科
+ 泌尿外科

每个医学专科都包括许多类型的程序和预约。因此，临床医生会口述多种不同类型的笔记。使用以下示例作为指导，帮助您指定 WebSocket 请求的 `specialty` URI 参数的值或 [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html)API 的`Specialty`参数：
+ 如需电生理学或超声心动图检查后的口述，请选择 `CARDIOLOGY`。
+ 如需肿瘤外科或放射肿瘤科检查后的口述，请选择 `ONCOLOGY`。
+ 如需讲解脑炎诊断情况的医生口述笔记，请选择 `NEUROLOGY`。
+ 如需切开膀胱结石的手术注意事项的口述，请选择 `UROLOGY`。
+ 如需内科咨询后的临床医生笔记口述，请选择 `PRIMARYCARE`。
+ 如需传达 CT 扫描、PET 扫描、MRI 或 X 光片检查结果的医生口述，请选择 `RADIOLOGY`。
+ 如需妇科咨询后的医生笔记口述，请选择 `PRIMARYCARE`。

要提高实时音频流中特定术语的转录准确性，请使用自定义词汇表。要启用自定义词汇表，请将 `vocabulary-name` 的值设置为要使用的自定义词汇表的名称。

## 使用麦克风将听写内容转录到麦克风中 AWS 管理控制台
<a name="streaming-medical-dictation-console"></a>

要使用转录医疗听写的流式音频，请选择转录医疗听写的选项，开始直播，然后开始对着麦克风说话。 AWS 管理控制台 

**转录医学口述的流式音频（AWS 管理控制台）**

1. 登录到 [AWS 管理控制台](https://console.aws.amazon.com/transcribe/)。

1. 在导航窗格的 “ Amazon Transcribe 医疗” 下，选择 “**实时转录**”。

1. 选择**口述**。

1. 对于**医学专科**，请选择在音频流中发言的临床医生的医学专科。

1. 选择 **Start streaming（开始流式传输）**。

1. 对着麦克风说话。

## 在 HTTP/2 音频流中转录口述
<a name="http2-med-dictation-streaming"></a>

要转录医学口述的 HTTP/2 音频流，请使用 [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html)API 并指定以下内容：
+ `LanguageCode` – 语言代码。有效值为 `en-US`
+ `MediaEncoding` – 用于输入音频的编码。有效值包括 `pcm`、`ogg-opus` 和 `flac`。
+ `Specialty` – 医疗专业人员的专科。
+ `Type` – `DICTATION`

有关设置 HTTP/2 音频流以转录医学口述的更多信息，请参阅[设置 HTTP/2 音频流](streaming-setting-up.md#streaming-http2)。

## 使用 WebSocket 直播请求转录医疗听写
<a name="transcribe-medical-dictation-websocket"></a>

要使用 WebSocket请求在实时流中转录医疗听写，请创建预签名 URI。此 URI 包含在您的应用程序和 Medic Amazon Transcribe al 之间设置音频流所需的信息。有关创建 WebSocket 请求的更多信息，请参阅[设置直 WebSocket 播](streaming-setting-up.md#streaming-websocket)。

使用以下模板来创建您的预签名 URI。

```
GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/medical-stream-transcription-websocket
?language-code=languageCode
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=Signature Version 4 signature 
&X-Amz-SignedHeaders=host
&media-encoding=flac
&sample-rate=16000
&session-id=sessionId
&specialty=medicalSpecialty
&type=DICTATION
&vocabulary-name=vocabularyName
&show-speaker-label=boolean
```

有关创建预签名的更多信息 URIs，请参阅[设置直 WebSocket 播](streaming-setting-up.md#streaming-websocket)。