本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 識別音訊檔案中的 PHI
<a name="phi-id-batch"></a>

使用批次轉錄作業以轉錄音訊檔案，並識別其中的個人健康資訊 (PHI)。當您啟用個人健康資訊 (PHI) 識別時， Amazon Transcribe 醫療會標記在轉錄結果中識別的 PHI。如需 Amazon Transcribe Medical 可以識別之 PHI 的相關資訊，請參閱 [識別轉錄中的個人健康資訊 (PHI)](phi-id.md)。

您可以使用 [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html) API 或 AWS 管理主控台，開始批次轉錄作業。

## AWS 管理主控台
<a name="batch-med-phi-console"></a>

若要使用 AWS 管理主控台 轉錄臨床醫生-患者對話，請建立轉錄任務，然後選擇**音訊輸入類型的****對話**。

**轉錄音訊檔案並識別 PHI (AWS 管理主控台)**

1. 登入 [AWS 管理主控台](https://console.aws.amazon.com/transcribe/)。

1. 在導覽窗格的 Amazon Transcribe Medical 下，選擇**轉錄任務**。

1. 選擇**建立作業**。

1. 在**指定作業詳細資訊‭**頁面的**工作設定**下，指定下列項目。

   1. **名稱** – 您的 唯一轉錄任務的名稱 AWS 帳戶。

   1. **音訊輸入類型** — **對話**或**聽寫**。

1. 針對其餘欄位，指定音訊檔案 Amazon S3 的位置，以及您要存放轉錄任務輸出的位置。

1. 選擇**下一步**。

1. 在**音訊設定**下，選擇 **PHI 識別**。

1. 選擇**建立**。

## API
<a name="batch-med-phi-api"></a>

**使用批次轉錄作業 (API) 轉錄音訊檔案並識別 PHI**
+ 對於 [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html) API，請指定以下項目。

  1. 對於 `MedicalTranscriptionJobName`，指定您 AWS 帳戶中唯一的名稱。

  1. 對於 `LanguageCode`，指定與您音訊檔案中所說語言相對應的語言代碼。

  1. 對於 `Media` 物件的 `MediaFileUri` 參數中，指定您要轉錄的音訊檔案名稱。

  1. 對於 `Specialty`，請指定在音訊檔案 `PRIMARYCARE` 中說話的臨床醫生的醫療專科。

  1. 對於 `Type`，指定 `CONVERSATION` 或 `DICTATION`。

  1. 對於 `OutputBucketName`，指定 Amazon S3 儲存貯體以存放轉錄結果。

  以下是使用 適用於 Python (Boto3) 的 AWS SDK 轉錄音訊檔案並識別病患 PHI 的範例請求。

  ```
  from __future__ import print_function
  import time
  import boto3
  transcribe = boto3.client('transcribe')
  job_name = "{{my-first-transcription-job}}"
  job_uri = "s3://{{amzn-s3-demo-bucket}}/{{my-input-files}}/{{my-audio-file}}.{{flac}}"
  transcribe.start_medical_transcription_job(
        MedicalTranscriptionJobName = job_name,
        Media = {'MediaFileUri': job_uri},
        LanguageCode = 'en-US',
        ContentIdentificationType = 'PHI',
        Specialty = 'PRIMARYCARE',
        Type = '{{type}}', # Specify 'CONVERSATION' for a medical conversation. Specify 'DICTATION' for a medical dictation.
        OutputBucketName = '{{amzn-s3-demo-bucket}}'
    )
  while True:
      status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name)
      if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
          break
      print("Not ready yet...")
      time.sleep(5)
  print(status)
  ```

以下範例代碼顯示識別 PHI 患者的轉錄結果。

```
{
    "jobName": "my-medical-transcription-job-name",
    "accountId": "111122223333",
    "results": {
        "transcripts": [{
            "transcript": "The patient's name is Bertrand."
        }],
        "items": [{
                "id": 0,
            "start_time": "0.0",
            "end_time": "0.37",
            "alternatives": [{
                "confidence": "0.9993",
                "content": "The"
            }],
            "type": "pronunciation"
        }, {
                "id": 1,
            "start_time": "0.37",
            "end_time": "0.44",
            "alternatives": [{
                "confidence": "0.9981",
                "content": "patient's"
            }],
            "type": "pronunciation"
        }, {
                "id": 2,
            "start_time": "0.44",
            "end_time": "0.52",
            "alternatives": [{
                "confidence": "1.0",
                "content": "name"
            }],
            "type": "pronunciation"
        }, {
                "id": 3,
            "start_time": "0.52",
            "end_time": "0.92",
            "alternatives": [{
                "confidence": "1.0",
                "content": "is"
            }],
            "type": "pronunciation"
        }, {
                "id": 4,
            "start_time": "0.92",
            "end_time": "0.9989",
            "alternatives": [{
                "confidence": "1.0",
                "content": "Bertrand"
            }],
            "type": "pronunciation"
        }, {
                "id": 5,
            "alternatives": [{
                "confidence": "0.0",
                "content": "."
            }],
            "type": "punctuation"
        }],
        "entities": [{
            "content": "Bertrand",
            "category": "PHI*-Personal*",
            "startTime": 0.92,
            "endTime": 1.2,
            "confidence": 0.9989
        }],
        "audio_segments": [
            {
                "id": 0,
                "transcript": "The patient's name is Bertrand.",
                "start_time": "0.0",
                "end_time": "0.9989",
                "items": [
                    0,
                    1,
                    2,
                    3,
                    4,
                    5
                ]
            }
        ]
    },
    "status": "COMPLETED"
}
```

## AWS CLI
<a name="batch-med-conversation-cli"></a>

**使用批次轉錄作業，轉錄音訊檔案並識別 PHI (AWS CLI)**
+ 執行下列程式碼。

  ```
  aws transcribe start-medical-transcription-job \
  --medical-transcription-job-name {{my-medical-transcription-job-name}}\
  --language-code en-US \
  --media MediaFileUri="s3://{{amzn-s3-demo-bucket}}/{{my-input-files}}/{{my-audio-file}}.{{flac}}" \
  --output-bucket-name {{amzn-s3-demo-bucket}} \
  --specialty PRIMARYCARE \
  --type {{type}} \ # Choose CONVERSATION to transcribe a medical conversation. Choose DICTATION to transcribe a medical dictation.
  --content-identification-type PHI
  ```