

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 트랜스크립션의 개인 건강 정보(PHI) 식별
<a name="phi-id"></a>

*개인 건강 정보 식별*을 사용하여 트랜스크립션 결과의 개인 건강 정보(PHI)에 레이블을 지정합니다. 레이블을 검토하여 환자를 식별하는 데 사용할 수 있는 PHI를 찾을 수 있습니다.

실시간 스트림 또는 배치 트랜스크립션 작업을 사용하여 PHI를 식별할 수 있습니다.

자체 후처리를 사용하여 트랜스크립션 출력에서 확인된 PHI를 수정할 수 있습니다.

개인 건강 정보 식별을 사용하여 다음 유형의 PHI를 확인합니다.
+ 개인 PHI:
  + 이름 – 성명 또는 성 및 이니셜
  + Gender
  + 나이
  + 전화번호
  + 환자와 직접 관련된 날짜(연도 제외)
  + 이메일 주소
+ 지리적 PHI:
  + 실제 주소
  + 우편 번호
  + 의료 센터 또는 진료소 이름
+ 계정 PHI:
  + 팩스 번호
  + 사회 보장 번호(SSN)
  + 건강 보험 수혜자 번호
  + 계정 번호
  + 인증서 또는 면허 번호
+ 차량 PHI:
  + 차량 식별 번호(VIN)
  + 번호판 번호
+ 기타 PHI:
  + 웹 URL(Uniform Resource Location)
  + 인터넷 프로토콜(IP) 주소 번호

Amazon Transcribe Medical은 HIPAA(Health Insurance Portability and Accountability Act of 1996) 적격 서비스입니다. 자세한 내용은 [Amazon Transcribe Medical](transcribe-medical.md) 단원을 참조하십시오. 오디오 파일에서 PHI를 식별하는 방법에 대한 자세한 내용은 [오디오 파일에서 PHI 식별](phi-id-batch.md) 섹션을 참조하세요. 스트림에서 PHI를 식별하는 방법에 대한 자세한 내용은 [실시간 스트림에서 PHI 식별](phi-id-stream.md) 섹션을 참조하세요.

**Topics**
+ [

# 오디오 파일에서 PHI 식별
](phi-id-batch.md)
+ [

# 실시간 스트림에서 PHI 식별
](phi-id-stream.md)

# 오디오 파일에서 PHI 식별
<a name="phi-id-batch"></a>

배치 트랜스크립션 작업을 사용하여 오디오 파일을 트랜스크립션하고 그 안에 있는 개인 건강 정보(PHI)를 식별할 수 있습니다. 개인 건강 정보(PHI) 식별을 활성화하면 Amazon Transcribe Medical은 트랜스크립션 결과에서 식별한 PHI에 레이블을 지정합니다. Amazon Transcribe Medical에서 식별할 수 있는 PHI에 대한 자세한 내용은 섹션을 참조하세요[트랜스크립션의 개인 건강 정보(PHI) 식별](phi-id.md).

[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html) API 또는 AWS Management Console을 사용하여 배치 트랜스크립션 작업을 시작할 수 있습니다.

## AWS Management Console
<a name="batch-med-phi-console"></a>

 AWS Management Console 를 사용하여 임상의-환자 대화를 트랜스크립션하려면 트랜스크립션 작업을 생성하고 **오디오 입력 유형에** 대한 **대화를** 선택합니다.

**오디오 파일을 트랜스크립션하고 해당 PHI를 식별하려면(AWS Management Console)**

1. [AWS Management Console](https://console.aws.amazon.com/transcribe/)에 로그인합니다.

1. 탐색 창의 Amazon Transcribe Medical에서 **트랜스크립션 작업을** 선택합니다.

1. **작업 생성**을 선택합니다.

1. **DB 세부 정보 지정** 페이지의 **작업 설정**에서 다음을 지정합니다.

   1. **이름** - 고유한 트랜스크립션 작업의 이름입니다 AWS 계정.

   1. **오디오 입력 유형** – **대화** 또는 **구술**.

1. 나머지 필드에는 오디오 파일의 Amazon S3 위치와 트랜스크립션 작업의 출력을 저장할 위치를 지정합니다.

1. **다음**을 선택합니다.

1. **오디오 설정**에서 **PHI 식별**을 선택합니다.

1. **생성(Create)**을 선택합니다.

## API
<a name="batch-med-phi-api"></a>

**배치 트랜스크립션 작업을 사용하여 오디오 파일을 트랜스크립션하고 해당 PHI를 식별하려면(API)**
+ [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html) API의 경우 다음을 지정하세요.

  1. `MedicalTranscriptionJobName`에서 AWS 계정의 고유한 이름을 지정합니다.

  1. `LanguageCode`에는 오디오 파일에서 사용하는 언어에 해당하는 언어 코드를 지정합니다.

  1. `Media` 객체의 `MediaFileUri` 파라미터에서 트랜스크립션할 오디오 파일의 이름을 지정합니다.

  1. `Specialty`에는 오디오 파일에서 말하는 임상의의 전문 분야를 `PRIMARYCARE`로 지정합니다.

  1. `Type`에서 `CONVERSATION` 또는 `DICTATION`를 지정합니다.

  1. `OutputBucketName`에서 트랜스크립션 결과를 저장할 Amazon S3 버킷을 지정합니다.

  다음은를 사용하여 오디오 파일을 AWS SDK for Python (Boto3) 트랜스크립션하고 환자의 PHI를 식별하는 요청의 예입니다.

  ```
  from __future__ import print_function
  import time
  import boto3
  transcribe = boto3.client('transcribe')
  job_name = "my-first-transcription-job"
  job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac"
  transcribe.start_medical_transcription_job(
        MedicalTranscriptionJobName = job_name,
        Media = {'MediaFileUri': job_uri},
        LanguageCode = 'en-US',
        ContentIdentificationType = 'PHI',
        Specialty = 'PRIMARYCARE',
        Type = 'type', # Specify 'CONVERSATION' for a medical conversation. Specify 'DICTATION' for a medical dictation.
        OutputBucketName = 'amzn-s3-demo-bucket'
    )
  while True:
      status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name)
      if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
          break
      print("Not ready yet...")
      time.sleep(5)
  print(status)
  ```

다음 예시 코드는 환자 PHI를 식별한 트랜스크립션 결과를 보여줍니다.

```
{
    "jobName": "my-medical-transcription-job-name",
    "accountId": "111122223333",
    "results": {
        "transcripts": [{
            "transcript": "The patient's name is Bertrand."
        }],
        "items": [{
                "id": 0,
            "start_time": "0.0",
            "end_time": "0.37",
            "alternatives": [{
                "confidence": "0.9993",
                "content": "The"
            }],
            "type": "pronunciation"
        }, {
                "id": 1,
            "start_time": "0.37",
            "end_time": "0.44",
            "alternatives": [{
                "confidence": "0.9981",
                "content": "patient's"
            }],
            "type": "pronunciation"
        }, {
                "id": 2,
            "start_time": "0.44",
            "end_time": "0.52",
            "alternatives": [{
                "confidence": "1.0",
                "content": "name"
            }],
            "type": "pronunciation"
        }, {
                "id": 3,
            "start_time": "0.52",
            "end_time": "0.92",
            "alternatives": [{
                "confidence": "1.0",
                "content": "is"
            }],
            "type": "pronunciation"
        }, {
                "id": 4,
            "start_time": "0.92",
            "end_time": "0.9989",
            "alternatives": [{
                "confidence": "1.0",
                "content": "Bertrand"
            }],
            "type": "pronunciation"
        }, {
                "id": 5,
            "alternatives": [{
                "confidence": "0.0",
                "content": "."
            }],
            "type": "punctuation"
        }],
        "entities": [{
            "content": "Bertrand",
            "category": "PHI*-Personal*",
            "startTime": 0.92,
            "endTime": 1.2,
            "confidence": 0.9989
        }],
        "audio_segments": [
            {
                "id": 0,
                "transcript": "The patient's name is Bertrand.",
                "start_time": "0.0",
                "end_time": "0.9989",
                "items": [
                    0,
                    1,
                    2,
                    3,
                    4,
                    5
                ]
            }
        ]
    },
    "status": "COMPLETED"
}
```

## AWS CLI
<a name="batch-med-conversation-cli"></a>

**배치 트랜스크립션 작업을 사용하여 오디오 파일을 트랜스크립션하고 PHI를 식별하려면(AWS CLI)**
+ 다음 코드를 실행합니다.

  ```
  aws transcribe start-medical-transcription-job \
  --medical-transcription-job-name my-medical-transcription-job-name\
  --language-code en-US \
  --media MediaFileUri="s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac" \
  --output-bucket-name amzn-s3-demo-bucket \
  --specialty PRIMARYCARE \
  --type type \ # Choose CONVERSATION to transcribe a medical conversation. Choose DICTATION to transcribe a medical dictation.
  --content-identification-type PHI
  ```

# 실시간 스트림에서 PHI 식별
<a name="phi-id-stream"></a>

HTTP/2 또는 WebSocket 스트림에서 개인 건강 정보(PHI)를 식별할 수 있습니다. PHI 식별을 활성화하면 Amazon Transcribe Medical은 트랜스크립션 결과에서 식별하는 PHI에 레이블을 지정합니다. Amazon Transcribe Medical에서 식별할 수 있는 PHI에 대한 자세한 내용은 섹션을 참조하세요[트랜스크립션의 개인 건강 정보(PHI) 식별](phi-id.md).



## 마이크에 대고 말하는 구술로 PHI 식별하기
<a name="console-stream-phi"></a>

를 사용하여 마이크가 선택한 음성 AWS Management Console 을 트랜스크립션하고 PHI를 식별하려면 오디오 입력 유형으로 **구술**을 선택하고 스트림을 시작한 다음 컴퓨터의 마이크에 대고 말하기 시작합니다.

**를 사용하여 구술에서 PHI를 식별하려면 AWS Management Console**

1. [AWS Management Console](https://console.aws.amazon.com/transcribe/)에 로그인합니다.

1. 탐색 창에서 **실시간 트랜스크립션**을 선택합니다.

1. **오디오 입력 유형**에서 **구술**을 선택합니다.

1. **추가 설정**에서 **PHI 식별**을 선택합니다.

1. **스트리밍 시작**을 선택하고 마이크에 대고 말합니다.

1. 구술을 종료하려면 **스트리밍 중지**를 선택합니다.

## HTTP/2 스트림에서 PHI 식별하기
<a name="http2-stream-phi"></a>

PHI 식별이 활성화된 상태에서 HTTP/2 스트림을 시작하려면 [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html) API를 사용하고 다음을 지정하세요.
+ `LanguageCode`에는 스트림에서 사용하는 언어에 대한 언어 코드를 지정합니다. 미국 영어의 경우에는 `en-US`를 지정합니다.
+ `MediaSampleHertz`에서 오디오의 샘플 속도를 지정합니다.
+ `content-identification-type`에서 `PHI`를 지정합니다.

## WebSocket 스트림에서 PHI 식별하기
<a name="websocket-phi-id"></a>

 PHI 식별이 활성화된 WebSocket 스트림을 시작하려면 다음 형식을 사용하여 미리 서명된 URL을 만드세요.

```
GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/medical-stream-transcription-websocket?
&X-Amz-Algorithm=AWS4-HMAC-SHA256 
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request 
&X-Amz-Date=20220208T235959Z 
&X-Amz-Expires=300 
&X-Amz-Security-Token=security-token 
&X-Amz-Signature=Signature Version 4 signature 
&X-Amz-SignedHeaders=host 
&language-code=en-US
&media-encoding=flac 
&sample-rate=16000 
&specialty=medical-specialty
&content-identification-type=PHI
```

파라미터 정의는 [API 참조](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Reference.html)에서 찾을 수 있습니다. 모든 AWS API 작업에 공통적인 파라미터는 [공통 파라미터](https://docs.aws.amazon.com/transcribe/latest/APIReference/CommonParameters.html) 섹션에 나열되어 있습니다.