

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# 個人を特定できる情報の編集または特定
<a name="pii-redaction"></a>

リダクションは、トランスクリプトから個人を特定できる情報 (PII) という形で、機密性の高いコンテンツをマスキングまたは消去するために使用されます。バッチ文字起こしとストリーミング文字起こしでは、編集できる PII Amazon Transcribe のタイプが異なります。各文字起こしの PII リストを確認するには、「[バッチジョブで PII を編集する](pii-redaction-batch.md)」および「[リアルタイムストリームの PII の編集または識別](pii-redaction-stream.md)」を参照してください。ストリーミング文字起こしでは、PII を編集せずにフラグを立てるオプションもあります。出力例については、「[PII 識別の出力例](pii-redaction-output.md#pii-redaction-output-id)」を参照してください。

リダクションが有効になっている場合、編集済みのトランスクリプトのみを生成するか、または編集済みのトランスクリプトと未編集のトランスクリプトの両方を生成するオプションがあります。編集したトランスクリプトのみを生成することを選択した場合は、会話全体の保存先がメディアだけであることに注意してください。オリジナルのメディアを削除した場合、未編集の PII の記録は残りません。このため、編集されたトランスクリプトに加えて、未編集のトランスクリプトを生成することが賢明な場合があります。

バッチ文字起こしを使用した PII リダクションの詳細については、「[バッチジョブで PII を編集する](pii-redaction-batch.md)」を参照してください。

ストリーミング文字起こしによる PII リダクションまたは識別の詳細については、「[リアルタイムストリームの PII の編集または識別](pii-redaction-stream.md)」を参照してください。

**重要**  
リダクション機能は、機密データを識別して削除するように設計されています。ただし、機械学習が持つ予測的な性質の関係上、Amazon Transcribe は、トランスクリプト内の機密データのすべてのインスタンスを特定し削除しない場合があります。編集された出力がお客様のニーズを満たすものであることを確認するために、出力内容を見直すことを強くおすすめします。  
リダクション機能は、1996 年に米国で制定された、医療保険の相互運用性と説明責任に関する法律 (HIPAA) 等の医療プライバシー法に基づく匿名性の要件を満たすものではありません。

PII の編集と識別に関する動画チュートリアルについては、以下を参照してください。

[![AWS Videos](http://img.youtube.com/vi/https://www.youtube.com/embed/4H8dQoeLkyM/0.jpg)](http://www.youtube.com/watch?v=https://www.youtube.com/embed/4H8dQoeLkyM)


# バッチジョブで PII を編集する
<a name="pii-redaction-batch"></a>

バッチ文字起こしジョブ中に文字起こしから個人を特定できる情報 (PII) を編集すると、 は、識別された PII の各インスタンスを文字起こしの本文`[PII]`の Amazon Transcribe に置き換えます。また、文字起こし出力の単語ごとの部分で、編集された PII の種類を表示することもできます。出力サンプルについては、「[編集された出力例 (バッチ)](pii-redaction-output.md#pii-redaction-output-batch)」を参照してください。

米国英語 (`en-US`) および英国スペイン語 (`es-US`) では、バッチ文字起こしによるリダクションが可能です。リダクションは[言語識別](lang-id-batch.md)と互換性がありません。

秘匿化されたトランスクリプトと秘匿化されていないトランスクリプトの両方が同じ出力 Amazon S3 バケットに保存されます。 は、指定したバケット、またはサービスによって管理されるデフォルトの Amazon S3 バケットにトランスクリプト Amazon Transcribe を保存します。


**バッチ文字起こしで認識 Amazon Transcribe できる PII のタイプ**  

| PII タイプ | 説明 | 
| --- | --- | 
| ADDRESS | 実際の住所、*米国、エニータウン市。メインストリート 100 番地*や、*ビル 123 番、スイート 12 番*など。住所には、通り、ビル、場所、市区町村、州、国、郡、郵便番号、管区、近隣などを含めることができます。  | 
| ALL | この表に記載されているすべての PII のタイプを編集または特定します。 | 
| BANK\$1ACCOUNT\$1NUMBER | 米国の銀行口座番号 この番号は通常 10～12 桁の長さですが、 Amazon Transcribe は下 4 桁のみの銀行口座番号も認識します。 | 
| BANK\$1ROUTING | 米国の銀行口座の支店コード この番号は通常 9 桁の長さですが、 Amazon Transcribe は下 4 桁のみの支店コードも認識します。 | 
| CREDIT\$1DEBIT\$1CVV | VISA、MasterCard、Discover のクレジットカードとデビットカードに記載されている 3 桁のカード確認コード (CVV)。American Express のクレジットカードまたはデビットカードでは、4 桁の数字コードです。 | 
| CREDIT\$1DEBIT\$1EXPIRY | クレジットカードまたはデビットカードの有効期限日 この番号は通常 4 桁で、「月/年」または「MM/YY」という形式になっています。たとえば、 は *01/21*、*01/2021*、Jan *202*1 などの有効期限を認識 Amazon Transcribe できます。 | 
| CREDIT\$1DEBIT\$1NUMBER | クレジットカードまたはデビットカードの番号。これらの番号の長さは 13 桁から 16 桁までさまざまですが、最後の 4 桁のみが存在する場合はクレジットカード番号またはデビットカード番号 Amazon Transcribe も認識されます。 | 
| EMAIL | *efua.owusu@email.com* などのメールアドレス。 | 
| NAME | 個人の名前。このエンティティタイプには、Mr.、Mrs.、Miss、Dr. Amazon Transcribe などのタイトルは含まれません。このエンティティタイプは、組織または住所の一部である名前には適用されません。例えば、 は *John Doe Organization* を組織として認識し、*Jane Doe Street* を住所として Amazon Transcribe 認識します。 | 
| PHONE | 電話番号 このエンティティタイプには、ファックス番号とポケットベル番号も含まれます。 | 
| PIN | 銀行口座情報へのアクセスを可能にする 4 桁の個人識別番号 (PIN)。 | 
| SSN | 社会保障番号 (SSN) は、米国市民、永住者、一時的な労働居住者に発行される 9 桁の番号です。 は、最後の 4 桁のみが存在する場合に社会保障番号 Amazon Transcribe も認識します。 | 

バッチ文字起こしジョブは AWS マネジメントコンソール、、 AWS CLI、または AWS SDK を使用して開始できます。

## AWS マネジメントコンソール
<a name="redaction-console-batch"></a>

1. [AWS マネジメントコンソール](https://console.aws.amazon.com/transcribe/) にサインインします。

1. ナビゲーションペインで、[**文字起こしジョブ**] を選択後、[**ジョブの作成**] (右上) を選択します。これにより、**ジョブの詳細を指定** ページが開きます。

1. **ジョブの詳細を指定する** ページで必要な項目を入力したら、[**次へ**] を選択して、**ジョブの設定 - *オプション*** ページに進みます。ここには **PII リダクション**切り替えが付いた**コンテンツ削除**パネルがあります。  
![\[Amazon Transcribe コンソールのスクリーンショット: 「ジョブの設定」ページの「コンテンツ削除ペイン」。\]](http://docs.aws.amazon.com/ja_jp/transcribe/latest/dg/images/content-redact.png)

1. [**PII リダクション**] を選択すると、編集したいすべての PII タイプを選択するオプションがあります。「**未編集のトランスクリプトをジョブ出力に含める**」ボックスを選択した場合は、未編集のトランスクリプトを選択することもできます。  
![\[Amazon Transcribe コンソールのスクリーンショット: PII オプションを示す「コンテンツの削除」ペイン。\]](http://docs.aws.amazon.com/ja_jp/transcribe/latest/dg/images/content-redact-select.png)

1. **[ジョブの作成]** を選択して、文字起こしジョブを実行します。

## AWS CLI
<a name="redaction-cli"></a>

この例では、[start-transcription-job](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/transcribe/start-transcription-job.html) コマンドと `content-redaction` パラメータを使用します。詳細については、「[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html)」および「[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_ContentRedaction.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_ContentRedaction.html)」を参照してください。

```
aws transcribe start-transcription-job \
--region us-west-2 \
--transcription-job-name my-first-transcription-job \
--media MediaFileUri=s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac \
--output-bucket-name amzn-s3-demo-bucket \
--output-key my-output-files/ \
--language-code en-US \
--content-redaction  RedactionType=PII,RedactionOutput=redacted,PiiEntityTypes=NAME,ADDRESS,BANK_ACCOUNT_NUMBER
```

以下は [start-transcription-job](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/transcribe/start-transcription-job.html) メソッドを使用した別の例で、リクエストボディはそのジョブの PII を編集します。

```
aws transcribe start-transcription-job \
--region us-west-2 \
--cli-input-json file://filepath/my-first-redaction-job.json
```

ファイル *my-first-redaction-job.json* には、次のリクエストボディが含まれています。

```
{
  "TranscriptionJobName": "my-first-transcription-job",
  "Media": {
      "MediaFileUri":  "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
  },
  "OutputBucketName": "amzn-s3-demo-bucket",
  "OutputKey": "my-output-files/", 
  "LanguageCode": "en-US",
  "ContentRedaction": {
      "RedactionOutput":"redacted",
      "RedactionType":"PII",
      "PiiEntityTypes": [
           "NAME",
           "ADDRESS",
           "BANK_ACCOUNT_NUMBER"	
      ]
  }
}
```

## AWS SDK for Python (Boto3)
<a name="redaction-python-batch"></a>

この例では AWS SDK for Python (Boto3) 、 を使用して[、start\$1transcription\$1job](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/transcribe.html#TranscribeService.Client.start_transcription_job) メソッドの `ContentRedaction`引数を使用してコンテンツを編集します。詳細については、「[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html)」および「[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_ContentRedaction.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_ContentRedaction.html)」を参照してください。

機能固有の例、シナリオ例、クロスサービス例など、 AWS SDKs[SDK を使用した Amazon Transcribe のコード例 AWS SDKs](service_code_examples.md)「」の章を参照してください。

```
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
job_name = "my-first-transcription-job"
job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
transcribe.start_transcription_job(
    TranscriptionJobName = job_name,
    Media = {
        'MediaFileUri': job_uri
    },
    OutputBucketName = 'amzn-s3-demo-bucket',
    OutputKey = 'my-output-files/', 
    LanguageCode = 'en-US', 
    ContentRedaction = { 
        'RedactionOutput':'redacted',
        'RedactionType':'PII', 
        'PiiEntityTypes': [
            'NAME','ADDRESS','BANK_ACCOUNT_NUMBER'
        ]
    }
)

while True:
    status = transcribe.get_transcription_job(TranscriptionJobName = job_name)
    if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)
```

**注記**  
バッチジョブの PII リダクションは、アジア AWS リージョンパシフィック (香港）、アジアパシフィック (ムンバイ）、アジアパシフィック (ソウル）、アジアパシフィック (シンガポール）、アジアパシフィック (シドニー）、アジアパシフィック (東京）、 GovCloud (米国西部）、カナダ (中部）、欧州 (フランクフルト）、欧州 (アイルランド）、欧州 (ロンドン）、欧州 (パリ）、中東 (バーレーン）、南米 (サンパウロ）、米国東部 (バージニア北部）、米国東部 (オハイオ）、米国西部 (オレゴン）、および米国西部 (北カリフォルニア) でのみサポートされています。

# リアルタイムストリームの PII の編集または識別
<a name="pii-redaction-stream"></a>

ストリーミング文字起こしから個人を特定できる情報 (PII) を編集する場合、 Amazon Transcribe は、お客様のトランスクリプトに特定された PII の各インスタンスを `[PII]` に置き換えます。

ストリーミング文字起こしに使用できる追加オプションとして、*PII 識別*があります。PII 識別をアクティブ化すると、 は`Entities`オブジェクトの文字起こし結果で PII に Amazon Transcribe ラベルを付けます。出力サンプルについては、「[編集済みストリーミング出力の例](pii-redaction-output.md#pii-redaction-output-stream)」と「[PII 識別の出力例](pii-redaction-output.md#pii-redaction-output-id)」を参照してください。

ストリーミング文字起こしによる PII の編集と識別は、スコットランド語 (`en-AB`)、オーストラリア (`en-AU`)、カナダ (`en-CA`)、英国 (`en-GB`)、アイルランド (`en-IE`)、インド (`en-IN`)、ニュージーランド (`en-NZ`)、米国 (`en-US`)、ウェールズ (`en-WL`)、南アフリカ (`en-ZA`)、スペイン語方言: 米国 (`es-US`)、スペイン (`es-ES`)、フランス語方言: フランス語 (`fr-FR`)、カナダ (`fr-CA`)、ポルトガル方言: ポルトガル (`pt-PT`)、ブラジル (`pt-BR`)、イタリア方言: イタリア (`it-IT`)、ドイツ方言: ドイツ (`de-DE`)、スイス (`de-CH`) で利用できます。

ストリーミングジョブの PII 識別とリダクションは、音声セグメントの完全な文字起こし時にのみ実行されます。


**ストリーミング文字起こしで認識 Amazon Transcribe できる PII のタイプ**  

| PII タイプ | 説明 | 
| --- | --- | 
| ADDRESS | 実際の住所、*米国、エニータウン市。メインストリート 100 番地*や、*ビル 123 番、スイート 12 番*など。住所には、通り、ビル、場所、市区町村、州、国、郡、郵便番号、管区、近隣などを含めることができます。  | 
| ALL | この表に記載されているすべての PII のタイプを編集または特定します。 | 
| BANK\$1ACCOUNT\$1NUMBER | 米国の銀行口座番号 この番号は通常 10～12 桁の長さですが、 Amazon Transcribe は下 4 桁のみの銀行口座番号も認識します。 | 
| BANK\$1ROUTING | 米国の銀行口座の支店コード この番号は通常 9 桁の長さですが、 Amazon Transcribe は下 4 桁のみの支店コードも認識します。 | 
| CREDIT\$1DEBIT\$1CVV | VISA、MasterCard、Discover のクレジットカードとデビットカードに記載されている 3 桁のカード確認コード (CVV)。American Express のクレジットカードまたはデビットカードでは、4 桁の数字コードです。 | 
| CREDIT\$1DEBIT\$1EXPIRY | クレジットカードまたはデビットカードの有効期限日 この番号は通常 4 桁で、「月/年」または「MM/YY」という形式になっています。たとえば、 は *01/21*、*01/2021*、Jan *202*1 などの有効期限を認識 Amazon Transcribe できます。 | 
| CREDIT\$1DEBIT\$1NUMBER | クレジットカードまたはデビットカードの番号。これらの番号の長さは 13 桁から 16 桁までさまざまですが、最後の 4 桁のみが存在する場合はクレジットカード番号またはデビットカード番号 Amazon Transcribe も認識されます。 | 
| EMAIL | *efua.owusu@email.com* などのメールアドレス。 | 
| NAME | 個人の名前。このエンティティタイプには、Mr.、Mrs.、Miss、Dr. Amazon Transcribe などのタイトルは含まれません。このエンティティタイプは、組織または住所の一部である名前には適用されません。例えば、 は *John Doe Organization* を組織として認識し、*Jane Doe Street* を住所として Amazon Transcribe 認識します。 | 
| PHONE | 電話番号 このエンティティタイプには、ファックス番号とポケットベル番号も含まれます。 | 
| PIN | 銀行口座情報へのアクセスを可能にする 4 桁の個人識別番号 (PIN)。 | 
| SSN | 社会保障番号 (SSN) は、米国市民、永住者、一時的な労働居住者に発行される 9 桁の番号です。 は、最後の 4 桁のみが存在する場合に社会保障番号 Amazon Transcribe も認識します。 | 
| AGE | 個人の年齢 (時間の数値や単位を含む)。例えば、「40 歳」というフレーズでは、「40 歳」を年齢として Amazon Transcribe 認識しています。 | 
| DATE\$1TIME | 日付には、年、月、日、曜日、または時刻を含めることができます。たとえば、 は「2020 年 1 月 19 日」または「午前 11 時」を日付として Amazon Transcribe 認識します。 Amazon Transcribe は部分的な日付、日付範囲、および時間間隔を認識します。また「the 1990s（1990 年代）」などの 10 年間も認識されます。 | 
| LICENSE\$1PLATE | 車両のナンバープレートは、車両が登録されている州または国によって発行されます。乗用車の形式は通常 5 ～ 8 桁で、大文字と数字で構成されます。形式は発行国または国の所在地によって異なります。 | 
| PASSPORT\$1NUMBER | 個人のパスポートに割り当てられた一意の識別子。形式は通常、文字と数字の組み合わせを含み、国によって異なります。 | 
| PASSWORD | パスワードとして使用される英数字の文字列 (「\$1very20special\$1pass\$1」など)。 | 
| USERNAME | ログイン名、スクリーンネーム、ニックネーム、ハンドル名など、アカウントを識別するユーザー名。 | 
| VEHICLE\$1IDENTIFICATION\$1NUMBER | 車両識別番号 (VIN) は、車両を一意に識別します。VIN の内容と形式は ISO 3779 仕様で定義されています。VIN のコードと形式は国ごとに異なります。 | 

ストリーミング文字起こしは AWS マネジメントコンソール、、WebSocket、または HTTP/2 を使用して開始できます。

## AWS マネジメントコンソール
<a name="redaction-console-stream"></a>

1. [AWS マネジメントコンソール](https://console.aws.amazon.com/transcribe/) にサインインします。

1. ナビゲーションペインで、[**リアルタイム文字起こし**] を選択します。**コンテンツ削除の設定** にスクロールして、最小化されている場合はこのフィールドを展開します。  
![\[Amazon Transcribe コンソールのスクリーンショット：「リアルタイム文字起こし」ページ。\]](http://docs.aws.amazon.com/ja_jp/transcribe/latest/dg/images/redaction-stream1.png)

1. 「**PII の識別とリダクション**」をオンに切り替えます。  
![\[Amazon Transcribe コンソールのスクリーンショット: 展開された「コンテンツ削除設定」パネル。\]](http://docs.aws.amazon.com/ja_jp/transcribe/latest/dg/images/redaction-stream2.png)

1. 「**識別のみ**」または「**識別とリダクション**」を選択し、トランスクリプトで識別または編集したい PII エンティティタイプを選択します。  
![\[Amazon Transcribe コンソールのスクリーンショット: 選択できる PII タイプのリスト。\]](http://docs.aws.amazon.com/ja_jp/transcribe/latest/dg/images/redaction-stream3.png)

1. これで、ストリームを書き起こす準備ができました。[**ストリーミングを開始する**] を選択し、話し始めます。ディクテーションを終了するには、[**ストリーミングを停止する**] を選択します。

## WebSocket ストリーム
<a name="redaction-websocket"></a>

この例では、WebSocket ストリームで PII リダクション (または PII 識別) を使用する署名付き URL を作成します。読みやすくするために、改行が追加されています。で WebSocket ストリームを使用する方法の詳細については Amazon Transcribe、「」を参照してください[WebSocket ストリームの設定](streaming-setting-up.md#streaming-websocket)。パラメータの詳細については、「[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html)」を参照してください。

```
GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket?
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=string
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date
&language-code=en-US
&media-encoding=flac
&sample-rate=16000    
&pii-entity-types=NAME,ADDRESS
&content-redaction-type=PII (or &content-identification-type=PII)
```

同じリクエストで `content-identification-type` と `content-redaction-type` 両方を使用することはできません。

パラメータ定義は [API リファレンス](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Reference.html)にあります。すべての AWS API オペレーションに共通のパラメータは、[「共通パラメータ](https://docs.aws.amazon.com/transcribe/latest/APIReference/CommonParameters.html)」セクションに記載されています。

## HTTP/2 ストリーミング
<a name="redaction-http2"></a>

この例では、PII 識別または PII リダクションを有効にした状態で HTTP/2 リクエストを作成します。での HTTP/2 ストリーミングの使用の詳細については Amazon Transcribe、「」を参照してください[HTTP/2 ストリームの設定](streaming-setting-up.md#streaming-http2)。固有のパラメータとヘッダーの詳細については Amazon Transcribe、「」を参照してください[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html)。

```
POST /stream-transcription HTTP/2
host: transcribestreaming.us-west-2.amazonaws.com
X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription
Content-Type: application/vnd.amazon.eventstream
X-Amz-Content-Sha256: string
X-Amz-Date: 20220208T235959Z
Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string
x-amzn-transcribe-language-code: en-US
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000      
x-amzn-transcribe-content-identification-type: PII (or x-amzn-transcribe-content-redaction-type: PII)
x-amzn-transcribe-pii-entity-types: NAME,ADDRESS
transfer-encoding: chunked
```

同じリクエストで `content-identification-type` と `content-redaction-type` 両方を使用することはできません。

パラメータ定義は [API リファレンス](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Reference.html)にあります。すべての AWS API オペレーションに共通のパラメータは、[「共通パラメータ](https://docs.aws.amazon.com/transcribe/latest/APIReference/CommonParameters.html)」セクションに記載されています。

**注記**  
ストリーミングの PII リダクションは、 AWS リージョンアジアパシフィック (ソウル）、アジアパシフィック (シドニー）、アジアパシフィック (東京）、カナダ (中部）、欧州 (フランクフルト）、欧州 (アイルランド）、欧州 (ロンドン）、米国東部 (バージニア北部）、米国東部 (オハイオ）、および米国西部 (オレゴン) の でのみサポートされています。

# PII リダクションと識別の出力例
<a name="pii-redaction-output"></a>

次の例は、バッチジョブおよびストリーミングジョブからの編集された出力、およびストリーミングジョブからの PII 識別を示しています。

コンテンツリダクションを使用する文字起こしジョブでは、2 種類の `confidence` 値を生成します。自動音声認識 (ASR) 信頼度は、`pronunciation` の `type` または `punctuation` である項目が特定の発話であることを示します。次の文字起こしの出力では、単語 `Good` には `1.0` の `confidence` があります。この信頼度の値は、Amazon Transcribe はこのトランスクリプトで発話された単語が「良い」であると 100% 確信していることを示します。`[PII]` タグの `confidence` 値は、リダクションのフラグを付けた発話が確実に PII であるという信頼度を示します。次のトランスクリプトの出力で、`confidence` が `0.9999` になっているのは、Amazon Transcribe がトランスクリプトで編集したエンティティが PII であると 99.99% 確信していることを示します。

## 編集された出力例 (バッチ)
<a name="pii-redaction-output-batch"></a>

```
{
    "jobName": "my-first-transcription-job",
    "accountId": "111122223333",
    "isRedacted": true,
    "results": {
        "transcripts": [
            {
                "transcript": "Good morning, everybody. My name is [PII], and today I feel like
                sharing a whole lot of personal information with you. Let's start with my Social 
                Security number [PII]. My credit card number is [PII] and my C V V code is [PII].
                I hope that Amazon Transcribe is doing a good job at redacting that personal 
                information away. Let's check."
            }
        ],
        "items": [
            {
                "id": 0,
                "start_time": "2.86",
                "end_time": "3.35",
                "alternatives": [
                    {
                        "confidence": "1.0",
                        "content": "Good"
                    }
                ],
                "type": "pronunciation"
            },
            Items removed for brevity
            {
                "id": 8,
                "start_time": "5.56",
                "end_time": "6.25",
                "alternatives": [
                    {
                        "content": "[PII]",
                        "redactions": [
                            {
                                "confidence": "0.9999",
                                "type": "NAME",
                                "category": "PII"
                            }
                        ]
                    }
                ],
                "type": "pronunciation"
            },
            Items removed for brevity
        ],
    },
    "status": "COMPLETED"
}
```

比較のための未編集のトランスクリプトは次のとおりです。

```
{
    "jobName": "job id",
    "accountId": "111122223333",
    "isRedacted": false,
    "results": {
        "transcripts": [
            {
                "transcript": "Good morning, everybody. My name is Mike, and today I feel like
                sharing a whole lot of personal information with you. Let's start with my Social 
                Security number 000000000. My credit card number is 5555555555555555 
                and my C V V code is 000. I hope that Amazon Transcribe is doing a good job 
                at redacting that personal information away. Let's check."
            }
        ],
        "items": [
            {
                "id": 0,
                "start_time": "2.86",
                "end_time": "3.35",
                "alternatives": [
                    {
                        "confidence": "1.0",
                        "content": "Good"
                    }
                ],
                "type": "pronunciation"
            },
            Items removed for brevity
            {
                "id": 8,
                "start_time": "5.56",
                "end_time": "6.25",
                "alternatives": [
                    {
                        "confidence": "0.9999",
                        "content": "Mike",
                     {                        
                ],
                "type": "pronunciation"
            },
            Items removed for brevity
        ],
    },
    "status": "COMPLETED"
}
```

## 編集済みストリーミング出力の例
<a name="pii-redaction-output-stream"></a>

```
{
    "TranscriptResultStream": {
        "TranscriptEvent": {
            "Transcript": {
                "Results": [
                    {
                        "Alternatives": [
                            {
                                "Transcript": "my name is [NAME]",
                                "Items": [
                                    {
                                        "Content": "my",
                                        "EndTime": 0.3799375,
                                        "StartTime": 0.0299375,
                                        "Type": "pronunciation"
                                    },
                                    {
                                        "Content": "name",
                                        "EndTime": 0.5899375,
                                        "StartTime": 0.3899375,
                                        "Type": "pronunciation"
                                    },
                                    {
                                        "Content": "is",
                                        "EndTime": 0.7899375,
                                        "StartTime": 0.5999375,
                                        "Type": "pronunciation"
                                    },
                                    {
                                        "Content": "[NAME]",
                                        "EndTime": 1.0199375,
                                        "StartTime": 0.7999375,
                                        "Type": "pronunciation"
                                    }
                                ],
                                "Entities": [
                                    {
                                        "Content": "[NAME]",
                                        "Category": "PII",
                                        "Type": "NAME",
                                        "StartTime" : 0.7999375,
                                        "EndTime" : 1.0199375,
                                        "Confidence": 0.9989
                                    }
                                ]
                            }
                        ],
                        "EndTime": 1.02,
                        "IsPartial": false,
                        "ResultId": "12345a67-8bc9-0de1-2f34-a5b678c90d12",
                        "StartTime": 0.0199375
                    }
                ]
            }
        }
    }
}
```

## PII 識別の出力例
<a name="pii-redaction-output-id"></a>

PII 識別は、ストリーミング文字起こしジョブで使用できる追加機能です。特定された PII は、各セグメントの `Entities` セクションに記載されています。

```
{
    "TranscriptResultStream": {
        "TranscriptEvent": {
            "Transcript": {
                "Results": [
                    {
                        "Alternatives": [
                            {
                                "Transcript": "my name is mike",
                                "Items": [
                                    {
                                        "Content": "my",
                                        "EndTime": 0.3799375,
                                        "StartTime": 0.0299375,
                                        "Type": "pronunciation"
                                    },
                                    {
                                        "Content": "name",
                                        "EndTime": 0.5899375,
                                        "StartTime": 0.3899375,
                                        "Type": "pronunciation"
                                    },
                                    {
                                        "Content": "is",
                                        "EndTime": 0.7899375,
                                        "StartTime": 0.5999375,
                                        "Type": "pronunciation"
                                    },
                                    {
                                        "Content": "mike",
                                        "EndTime": 0.9199375,
                                        "StartTime": 0.7999375,
                                        "Type": "pronunciation"                                    
                                    }
                                ],
                                "Entities": [
                                    {
                                        "Content": "mike",
                                        "Category": "PII",
                                        "Type": "NAME",
                                        "StartTime" : 0.7999375,
                                        "EndTime" : 1.0199375,
                                        "Confidence": 0.9989
                                    }
                                ]
                            }
                        ],
                        "EndTime": 1.02,
                        "IsPartial": false,
                        "ResultId": "12345a67-8bc9-0de1-2f34-a5b678c90d12",
                        "StartTime": 0.0199375
                    }
                ]
            }
        }
    }
}
```