

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Expurgation ou identification des données d’identification personnelle
<a name="pii-redaction"></a>

L’expurgation permet de masquer ou de supprimer le contenu sensible, appelé données d’identification personnelle (PII), de vos transcriptions. Les types de données personnelles que Amazon Transcribe vous pouvez supprimer varient entre les transcriptions par lots et les transcriptions en streaming. Pour consulter la liste des PII pour chaque méthode de transcription, consultez les sections [Expurgation des PII (données d’identification personnelle) dans votre tâche par lots](pii-redaction-batch.md) et [Expurgation ou identification des données d’identification personnelle (PII) dans un flux en temps réel](pii-redaction-stream.md). Avec les transcriptions en streaming, vous avez également la possibilité de signaler des PII sans les expurger. Consultez la section [Exemple de sortie d’identification des PII](pii-redaction-output.md#pii-redaction-output-id) pour un exemple de sortie.

Lorsque l’expurgation est activée, vous avez la possibilité de générer uniquement une transcription expurgée ou à la fois une transcription expurgée et une transcription non expurgée. Si vous choisissez de générer uniquement une transcription expurgée, notez que votre média est le seul emplacement où la conversation complète est stockée. Si vous supprimez votre média d’origine, il n’y a aucune trace des PII non expurgées. Pour cette raison, il peut être prudent de générer une transcription non expurgée en plus d’une transcription expurgée.

Pour en savoir plus sur l’expurgation des PII à l’aide de transcriptions par lots, consultez la section : [Expurgation des PII (données d’identification personnelle) dans votre tâche par lots](pii-redaction-batch.md).

Pour en savoir plus sur l’expurgation ou l’identification des PII à l’aide de transcriptions en streaming, consultez la section : [Expurgation ou identification des données d’identification personnelle (PII) dans un flux en temps réel](pii-redaction-stream.md).

**Important**  
La fonctionnalité d’expurgation est conçue pour identifier et supprimer les données sensibles. Cependant, en raison de la nature prédictive de l'apprentissage automatique, il est Amazon Transcribe possible que vous ne puissiez pas identifier et supprimer toutes les instances de données sensibles de votre transcription. Nous vous recommandons vivement de passer en revue toute sortie expurgée pour vous assurer qu’elle répond à vos besoins.  
La fonctionnalité d’expurgation ne répond pas aux exigences de désidentification prévues par les lois sur la confidentialité médicale, comme la loi américaine de 1996 sur la portabilité et la responsabilité en matière d’assurance maladie (HIPAA).

Pour une présentation vidéo de l’expurgation et de l’identification des PII, voir :

[![AWS Videos](http://img.youtube.com/vi/https://www.youtube.com/embed/4H8dQoeLkyM/0.jpg)](http://www.youtube.com/watch?v=https://www.youtube.com/embed/4H8dQoeLkyM)


# Expurgation des PII (données d’identification personnelle) dans votre tâche par lots
<a name="pii-redaction-batch"></a>

Lorsque vous supprimez des informations personnelles identifiables (PII) d'une transcription lors d'un travail de transcription par lots, remplacez Amazon Transcribe chaque instance identifiée de PII par le corps du texte principal de votre transcription. `[PII]` Vous pouvez également afficher le type de PII qui est expurgé dans la word-for-word partie de la sortie de transcription. Pour un exemple de sortie, consultez la section [Exemple de sortie expurgée (lot)](pii-redaction-output.md#pii-redaction-output-batch).

La rédaction avec transcriptions par lots est disponible en anglais américain (`en-US`) et en espagnol américain (`es-US`). L’expurgation n’est pas compatible avec l’[identification des langues](lang-id-batch.md).

Les transcriptions expurgées et non expurgées sont stockées dans le même compartiment de sortie. Amazon S3 Amazon Transcribe les stocke dans un compartiment que vous spécifiez ou dans le Amazon S3 compartiment par défaut géré par le service.


**Les types de données personnelles que Amazon Transcribe vous pouvez reconnaître pour les transcriptions par lots**  

| Type de PII | Description | 
| --- | --- | 
| ADDRESS | Adresse physique, telle que *100 Main Street, Anytown, États-Unis* ou *Suite n°12, bâtiment 123*. Une adresse peut inclure une rue, un bâtiment, un emplacement, une ville, un état, un pays, un comté, un code postal, une circonscription, un quartier, etc.  | 
| ALL | Expurgez ou identifiez tous les types de PII répertoriés dans ce tableau. | 
| BANK\$1ACCOUNT\$1NUMBER | Numéro du compte bancaire aux États-Unis. Il s’agit généralement d’un numéro composé de 10 à 12 chiffres, mais Amazon Transcribe reconnaît également les numéros de compte bancaire lorsque seuls les 4 derniers chiffres sont présents. | 
| BANK\$1ROUTING | Numéro d’acheminement du compte bancaire aux États-Unis. Il s’agit généralement d’un numéro à 9 chiffres, mais Amazon Transcribe reconnaît également les numéros de routage lorsque seuls les 4 derniers chiffres sont présents. | 
| CREDIT\$1DEBIT\$1CVV | Code de vérification de carte (CVV) à 3 chiffres présent sur les cartes de crédit et de débit VISA et Discover. MasterCard Sur les cartes de crédit ou de débit American Express, il s’agit d’un code numérique à 4 chiffres. | 
| CREDIT\$1DEBIT\$1EXPIRY | Date d’expiration d’une carte de crédit ou de débit. Ce numéro comporte généralement 4 chiffres et est formaté au format month/year MM/YY. Par exemple, Amazon Transcribe peut reconnaître des dates d'expiration telles que le *21/01*, le *01/2021* et le 1er *janvier* 2021. | 
| CREDIT\$1DEBIT\$1NUMBER | Numéro de carte de crédit ou de débit. La longueur de ces numéros peut varier de 13 à 16 chiffres, mais ils reconnaissent Amazon Transcribe également les numéros de carte de crédit ou de débit lorsque seuls les 4 derniers chiffres sont présents. | 
| EMAIL | Adresse e-mail, telle que *efua.owusu@email.com*. | 
| NAME | Nom d’une personne. Ce type d'entité n'inclut pas les titres, tels que M., Mme, Miss ou Dr. Il Amazon Transcribe n'applique pas ce type d'entité aux noms qui font partie d'organisations ou d'adresses. Par exemple, Amazon Transcribe reconnaît l'*organisation John Doe* en tant qu'organisation et *Jane Doe Street* en tant qu'adresse. | 
| PHONE | Numéro de téléphone. Ce type d’entité inclut également les numéros de télécopieur et de pager. | 
| PIN | Numéro d’identification personnel (PIN) à 4 chiffres qui permet à une personne d’accéder aux informations de son compte bancaire. | 
| SSN | Un numéro de sécurité sociale (SSN) est un numéro à 9 chiffres délivré aux citoyens américains, aux résidents permanents et aux résidents actifs temporaires. Amazon Transcribe reconnaît également les numéros de sécurité sociale lorsque seuls les 4 derniers chiffres sont présents. | 

Vous pouvez démarrer une tâche de transcription par lots à l'aide du AWS Management Console ou du AWS SDK. AWS CLI

## AWS Management Console
<a name="redaction-console-batch"></a>

1. Connectez-vous à la [AWS Management Console](https://console.aws.amazon.com/transcribe/).

1. Dans le volet de navigation, choisissez **Tâches de transcription**, puis sélectionnez **Créer une tâche** (en haut à droite). La page **Spécifier les détails de la tâche** s’ouvre.

1. Après avoir rempli les champs souhaités sur la page **Spécifier les détails de la tâche**, sélectionnez **Suivant** pour accéder à la page **Configurer la tâche - *facultatif***. Vous y trouverez le volet **Suppression de contenu** avec le bouton à bascule **Expurgation des PII**.  
![\[Amazon Transcribe capture d'écran de la console : le « volet de suppression de contenu » sur la page « configurer le travail ».\]](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/images/content-redact.png)

1. Une fois que vous avez sélectionné **Expurgation des PII**, vous pouvez sélectionner tous les types de PII que vous souhaitez expurger. Vous pouvez également choisir d’avoir une transcription non expurgée si vous sélectionnez la zone **Inclure la transcription non expurgée dans la sortie de la tâche**.  
![\[Amazon Transcribe capture d'écran de la console : le volet « suppression de contenu » affichant les options PII.\]](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/images/content-redact-select.png)

1. Sélectionnez **Créer une tâche** pour exécuter votre tâche de transcription.

## AWS CLI
<a name="redaction-cli"></a>

Cet exemple utilise la [start-transcription-job](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/transcribe/start-transcription-job.html)commande et le `content-redaction` paramètre. Pour plus d’informations, consultez [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html) et [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_ContentRedaction.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_ContentRedaction.html).

```
aws transcribe start-transcription-job \
--region us-west-2 \
--transcription-job-name my-first-transcription-job \
--media MediaFileUri=s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac \
--output-bucket-name amzn-s3-demo-bucket \
--output-key my-output-files/ \
--language-code en-US \
--content-redaction  RedactionType=PII,RedactionOutput=redacted,PiiEntityTypes=NAME,ADDRESS,BANK_ACCOUNT_NUMBER
```

Voici un autre exemple d'utilisation de la [start-transcription-job](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/transcribe/start-transcription-job.html)méthode, et le corps de la demande expédie les informations personnelles pour cette tâche.

```
aws transcribe start-transcription-job \
--region us-west-2 \
--cli-input-json file://filepath/my-first-redaction-job.json
```

Le fichier *my-first-redaction-job.json* contient le corps de requête suivant.

```
{
  "TranscriptionJobName": "my-first-transcription-job",
  "Media": {
      "MediaFileUri":  "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
  },
  "OutputBucketName": "amzn-s3-demo-bucket",
  "OutputKey": "my-output-files/", 
  "LanguageCode": "en-US",
  "ContentRedaction": {
      "RedactionOutput":"redacted",
      "RedactionType":"PII",
      "PiiEntityTypes": [
           "NAME",
           "ADDRESS",
           "BANK_ACCOUNT_NUMBER"	
      ]
  }
}
```

## AWS SDK pour Python (Boto3)
<a name="redaction-python-batch"></a>

Cet exemple utilise le AWS SDK pour Python (Boto3) pour supprimer du contenu à l'aide de l'`ContentRedaction`argument de la méthode [start\$1transcription\$1job](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/transcribe.html#TranscribeService.Client.start_transcription_job). Pour plus d’informations, consultez [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html) et [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_ContentRedaction.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_ContentRedaction.html).

Pour des exemples supplémentaires utilisant le AWS SDKs, notamment des exemples spécifiques aux fonctionnalités, des scénarios et des exemples multiservices, reportez-vous au chapitre. [Exemples de code pour Amazon Transcribe à l'aide de AWS SDKs](service_code_examples.md)

```
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
job_name = "my-first-transcription-job"
job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
transcribe.start_transcription_job(
    TranscriptionJobName = job_name,
    Media = {
        'MediaFileUri': job_uri
    },
    OutputBucketName = 'amzn-s3-demo-bucket',
    OutputKey = 'my-output-files/', 
    LanguageCode = 'en-US', 
    ContentRedaction = { 
        'RedactionOutput':'redacted',
        'RedactionType':'PII', 
        'PiiEntityTypes': [
            'NAME','ADDRESS','BANK_ACCOUNT_NUMBER'
        ]
    }
)

while True:
    status = transcribe.get_transcription_job(TranscriptionJobName = job_name)
    if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)
```

**Note**  
La rédaction d'informations personnelles pour les jobs par lots n'est prise en charge que dans les pays suivants Régions AWS : Asie-Pacifique (Hong Kong), Asie-Pacifique (Mumbai), Asie-Pacifique (Séoul), Asie-Pacifique (Sydney), Asie-Pacifique (Tokyo), (USA Ouest), Canada (Centre), UE GovCloud (Francfort), UE (Irlande), UE (Londres), UE (Paris), Moyen-Orient (Bahreïn)), en Amérique du Sud (Sao Paulo), à l'est des États-Unis (Virginie du Nord), à l'est des États-Unis (Ohio), à l'ouest des États-Unis (Oregon) et à l'ouest des États-Unis (Californie du Nord).

# Expurgation ou identification des données d’identification personnelle (PII) dans un flux en temps réel
<a name="pii-redaction-stream"></a>

Lorsque vous expurgez des données d’identification personnelle (PII) d’une transcription en streaming, Amazon Transcribe remplace chaque instance identifiée de PII par `[PII]` dans votre transcription.

L’*identification des PII* est une autre option disponible pour les transcriptions en streaming. Lorsque vous activez l'identification des informations personnelles, les Amazon Transcribe étiquette dans vos résultats de transcription sous un `Entities` objet. Pour un exemple de sortie, consultez les sections [Exemple de sortie de streaming expurgée](pii-redaction-output.md#pii-redaction-output-stream) et [Exemple de sortie d’identification des PII](pii-redaction-output.md#pii-redaction-output-id).

La rédaction et l'identification des informations personnelles à l'aide de transcriptions en streaming sont disponibles dans les dialectes anglais suivants : écossais ()`en-AB`, Australie ()`en-AU`, Canada (`en-CA`), britannique ()`en-GB`, Irlande (`en-IE`), Inde (), Nouvelle-Zélande (`en-IN`), `en-US` États-Unis `en-NZ` (), Pays de Galles () et Afrique `en-ZA` du Sud (`en-WL`) ; dialectes espagnols : `es-US` États-Unis (), `es-ES` Espagne () ; Dialectes français : français (), `fr-CA` Canada () ; dialectes `fr-FR` portugais : Portugal (), Brésil () ; dialecte italien : Italie `pt-PT` `pt-BR` (`it-IT`) ; et dialectes allemands : Allemagne (`de-DE`), Suisse (`de-CH`).

L’identification et l’expurgation des PII pour les tâches en streaming ne sont effectuées qu’après transcription complète des segments audio.


**Les types de données personnelles que Amazon Transcribe vous pouvez reconnaître pour les transcriptions en streaming**  

| Type de PII | Description | 
| --- | --- | 
| ADDRESS | Adresse physique, telle que *100 Main Street, Anytown, États-Unis* ou *Suite n°12, bâtiment 123*. Une adresse peut inclure une rue, un bâtiment, un emplacement, une ville, un état, un pays, un comté, un code postal, une circonscription, un quartier, etc.  | 
| ALL | Expurgez ou identifiez tous les types de PII répertoriés dans ce tableau. | 
| BANK\$1ACCOUNT\$1NUMBER | Numéro du compte bancaire aux États-Unis. Il s’agit généralement d’un numéro composé de 10 à 12 chiffres, mais Amazon Transcribe reconnaît également les numéros de compte bancaire lorsque seuls les 4 derniers chiffres sont présents. | 
| BANK\$1ROUTING | Numéro d’acheminement du compte bancaire aux États-Unis. Il s’agit généralement d’un numéro à 9 chiffres, mais Amazon Transcribe reconnaît également les numéros de routage lorsque seuls les 4 derniers chiffres sont présents. | 
| CREDIT\$1DEBIT\$1CVV | Code de vérification de carte (CVV) à 3 chiffres présent sur les cartes de crédit et de débit VISA et Discover. MasterCard Sur les cartes de crédit ou de débit American Express, il s’agit d’un code numérique à 4 chiffres. | 
| CREDIT\$1DEBIT\$1EXPIRY | Date d’expiration d’une carte de crédit ou de débit. Ce numéro comporte généralement 4 chiffres et est formaté au format month/year MM/YY. Par exemple, Amazon Transcribe peut reconnaître des dates d'expiration telles que le *21/01*, le *01/2021* et le 1er *janvier* 2021. | 
| CREDIT\$1DEBIT\$1NUMBER | Numéro de carte de crédit ou de débit. La longueur de ces numéros peut varier de 13 à 16 chiffres, mais ils reconnaissent Amazon Transcribe également les numéros de carte de crédit ou de débit lorsque seuls les 4 derniers chiffres sont présents. | 
| EMAIL | Adresse e-mail, telle que *efua.owusu@email.com*. | 
| NAME | Nom d’une personne. Ce type d'entité n'inclut pas les titres, tels que M., Mme, Miss ou Dr. Il Amazon Transcribe n'applique pas ce type d'entité aux noms qui font partie d'organisations ou d'adresses. Par exemple, Amazon Transcribe reconnaît l'*organisation John Doe* en tant qu'organisation et *Jane Doe Street* en tant qu'adresse. | 
| PHONE | Numéro de téléphone. Ce type d’entité inclut également les numéros de télécopieur et de pager. | 
| PIN | Numéro d’identification personnel (PIN) à 4 chiffres qui permet à une personne d’accéder aux informations de son compte bancaire. | 
| SSN | Un numéro de sécurité sociale (SSN) est un numéro à 9 chiffres délivré aux citoyens américains, aux résidents permanents et aux résidents actifs temporaires. Amazon Transcribe reconnaît également les numéros de sécurité sociale lorsque seuls les 4 derniers chiffres sont présents. | 
| AGE | Âge d’une personne. Par exemple, dans la phrase « J'ai 40 ans », Amazon Transcribe reconnaît « 40 ans » comme un âge. | 
| DATE\$1TIME | Une date peut inclure une année, un mois, un jour, un jour de la semaine ou une heure de la journée. Par exemple, Amazon Transcribe reconnaît le « 19 janvier 2020 » ou « 11 h » comme des dates. Amazon Transcribe reconnaîtra les dates partielles, les plages de dates et les intervalles de dates. Il reconnaîtra également des décennies, telles que « les années 1990 ». | 
| LICENSE\$1PLATE | La plaque d’immatriculation d’un véhicule est délivrée par l’État ou le pays où le véhicule est immatriculé. Le format des véhicules de tourisme est généralement composé de cinq à huit caractères, composés de lettres majuscules et de chiffres. Le format varie en fonction de la localisation de l’État ou du pays émetteur. | 
| PASSPORT\$1NUMBER | Identifiant unique attribué au passeport d'un individu. Le format comprend généralement une combinaison de lettres et de chiffres et varie selon les pays. | 
| PASSWORD | Chaîne alphanumérique utilisée comme mot de passe, telle que « \$1very20special\$1pass\$1 ». | 
| USERNAME | Nom d’utilisateur qui identifie un compte, tel qu’un nom de connexion, un pseudonyme ou un surnom. | 
| VEHICLE\$1IDENTIFICATION\$1NUMBER | Un numéro d’identification de véhicule (VIN) identifie un véhicule de manière unique. Le contenu et le format du VIN sont définis dans la spécification ISO 3779. Chaque pays possède des codes et des formats spécifiques pour VINs. | 

Vous pouvez démarrer une transcription en streaming en utilisant le AWS Management Console WebSocket, ou HTTP/2.

## AWS Management Console
<a name="redaction-console-stream"></a>

1. Connectez-vous au [AWS Management Console](https://console.aws.amazon.com/transcribe/).

1. Dans le panneau de navigation, choisissez **Transcription en temps réel**. Faites défiler jusqu’à **Paramètres de suppression de contenu** et développez ce champ s’il est réduit.  
![\[Amazon Transcribe capture d'écran de la console : la page « transcription en temps réel ».\]](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/images/redaction-stream1.png)

1. Activez l’**identification et l’expurgation des PII**.  
![\[Amazon Transcribe capture d'écran de la console : le panneau étendu des « paramètres de suppression de contenu ».\]](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/images/redaction-stream2.png)

1. Sélectionnez **Identification uniquement** ou **Identification et expurgation**, puis sélectionnez les types d’entités de PII que vous souhaitez identifier ou expurger dans votre transcription.  
![\[Amazon Transcribe capture d'écran de la console : liste des types d'informations personnelles pouvant être sélectionnés.\]](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/images/redaction-stream3.png)

1. Vous êtes prêt à transcrire votre flux. Sélectionnez **Démarrer le streaming** et commencez à parler. Pour mettre fin à votre dictée, sélectionnez **Arrêter le streaming**.

## WebSocket flux
<a name="redaction-websocket"></a>

Cet exemple crée une URL présignée qui utilise la rédaction des informations personnelles (ou identification des informations personnelles) dans un flux. WebSocket Les sauts de ligne ont été ajoutés pour faciliter la lecture. Pour plus d'informations sur l'utilisation WebSocket des flux avec Amazon Transcribe, consultez[Configuration d'un WebSocket stream](streaming-setting-up.md#streaming-websocket). Pour plus de détails sur les paramètres, consultez la section [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html).

```
GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket?
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=string
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date
&language-code=en-US
&media-encoding=flac
&sample-rate=16000    
&pii-entity-types=NAME,ADDRESS
&content-redaction-type=PII (or &content-identification-type=PII)
```

Vous ne pouvez pas utiliser à la fois `content-identification-type` et `content-redaction-type` dans la même demande.

Les définitions des paramètres se trouvent dans la [référence d'API](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Reference.html) ; les paramètres communs à toutes les opérations d' AWS API sont répertoriés dans la section [Paramètres communs](https://docs.aws.amazon.com/transcribe/latest/APIReference/CommonParameters.html).

## Flux HTTP/2
<a name="redaction-http2"></a>

Cet exemple crée une requête HTTP/2 avec l’identification ou l’expurgation des PII activée. Pour plus d'informations sur l'utilisation du streaming HTTP/2 avec Amazon Transcribe, consultez[Configuration d’un flux HTTP/2](streaming-setting-up.md#streaming-http2). Pour plus de détails sur les paramètres et les en-têtes spécifiques à Amazon Transcribe, voir [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html).

```
POST /stream-transcription HTTP/2
host: transcribestreaming.us-west-2.amazonaws.com
X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription
Content-Type: application/vnd.amazon.eventstream
X-Amz-Content-Sha256: string
X-Amz-Date: 20220208T235959Z
Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string
x-amzn-transcribe-language-code: en-US
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000      
x-amzn-transcribe-content-identification-type: PII (or x-amzn-transcribe-content-redaction-type: PII)
x-amzn-transcribe-pii-entity-types: NAME,ADDRESS
transfer-encoding: chunked
```

Vous ne pouvez pas utiliser à la fois `content-identification-type` et `content-redaction-type` dans la même demande.

Les définitions des paramètres se trouvent dans la [référence d'API](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Reference.html) ; les paramètres communs à toutes les opérations d' AWS API sont répertoriés dans la section [Paramètres communs](https://docs.aws.amazon.com/transcribe/latest/APIReference/CommonParameters.html).

**Note**  
La rédaction d'informations personnelles pour le streaming n'est prise en charge que dans les pays suivants Régions AWS : Asie-Pacifique (Séoul), Asie-Pacifique (Sydney), Asie-Pacifique (Tokyo), Canada (centre), UE (Francfort), UE (Irlande), UE (Londres), États-Unis est (Virginie du Nord), États-Unis est (Ohio) et États-Unis ouest (Oregon).

# Exemple de sortie d’expurgation et d’identification des PII (données d’identification personnelle)
<a name="pii-redaction-output"></a>

Les exemples suivants montrent la sortie expurgée des tâches de traitement par lots et en streaming, ainsi que l’identification des PII d’une tâche en streaming.

Les tâches de transcription qui utilisent l’expurgation génèrent deux types de valeurs `confidence`. La confiance ASR (Automatic Speech Recognition) indique les éléments avec le type `type` `punctuation` ou `pronunciation`, ou qui correspondent à un énoncé spécifique. Dans la sortie de transcription suivante, le mot `Good` a un score de `confidence` de `1.0`. Cette valeur de confiance indique qu'il Amazon Transcribe est sûr à 100 % que le mot prononcé dans cette transcription est « bon ». La valeur `confidence` d’une balise `[PII]` indique le niveau de confiance selon lequel le discours marqué pour l’expurgation correspond vraiment à des informations personnelles identifiables. Dans la sortie de transcription suivante, le `0.9999` signe `confidence` de indique qu'il Amazon Transcribe est certain à 99,99 % que l'entité expurgée dans la transcription est une PII.

## Exemple de sortie expurgée (lot)
<a name="pii-redaction-output-batch"></a>

```
{
    "jobName": "my-first-transcription-job",
    "accountId": "111122223333",
    "isRedacted": true,
    "results": {
        "transcripts": [
            {
                "transcript": "Good morning, everybody. My name is [PII], and today I feel like
                sharing a whole lot of personal information with you. Let's start with my Social 
                Security number [PII]. My credit card number is [PII] and my C V V code is [PII].
                I hope that Amazon Transcribe is doing a good job at redacting that personal 
                information away. Let's check."
            }
        ],
        "items": [
            {
                "id": 0,
                "start_time": "2.86",
                "end_time": "3.35",
                "alternatives": [
                    {
                        "confidence": "1.0",
                        "content": "Good"
                    }
                ],
                "type": "pronunciation"
            },
            Items removed for brevity
            {
                "id": 8,
                "start_time": "5.56",
                "end_time": "6.25",
                "alternatives": [
                    {
                        "content": "[PII]",
                        "redactions": [
                            {
                                "confidence": "0.9999",
                                "type": "NAME",
                                "category": "PII"
                            }
                        ]
                    }
                ],
                "type": "pronunciation"
            },
            Items removed for brevity
        ],
    },
    "status": "COMPLETED"
}
```

Voici la transcription non expurgée pour comparaison :

```
{
    "jobName": "job id",
    "accountId": "111122223333",
    "isRedacted": false,
    "results": {
        "transcripts": [
            {
                "transcript": "Good morning, everybody. My name is Mike, and today I feel like
                sharing a whole lot of personal information with you. Let's start with my Social 
                Security number 000000000. My credit card number is 5555555555555555 
                and my C V V code is 000. I hope that Amazon Transcribe is doing a good job 
                at redacting that personal information away. Let's check."
            }
        ],
        "items": [
            {
                "id": 0,
                "start_time": "2.86",
                "end_time": "3.35",
                "alternatives": [
                    {
                        "confidence": "1.0",
                        "content": "Good"
                    }
                ],
                "type": "pronunciation"
            },
            Items removed for brevity
            {
                "id": 8,
                "start_time": "5.56",
                "end_time": "6.25",
                "alternatives": [
                    {
                        "confidence": "0.9999",
                        "content": "Mike",
                     {                        
                ],
                "type": "pronunciation"
            },
            Items removed for brevity
        ],
    },
    "status": "COMPLETED"
}
```

## Exemple de sortie de streaming expurgée
<a name="pii-redaction-output-stream"></a>

```
{
    "TranscriptResultStream": {
        "TranscriptEvent": {
            "Transcript": {
                "Results": [
                    {
                        "Alternatives": [
                            {
                                "Transcript": "my name is [NAME]",
                                "Items": [
                                    {
                                        "Content": "my",
                                        "EndTime": 0.3799375,
                                        "StartTime": 0.0299375,
                                        "Type": "pronunciation"
                                    },
                                    {
                                        "Content": "name",
                                        "EndTime": 0.5899375,
                                        "StartTime": 0.3899375,
                                        "Type": "pronunciation"
                                    },
                                    {
                                        "Content": "is",
                                        "EndTime": 0.7899375,
                                        "StartTime": 0.5999375,
                                        "Type": "pronunciation"
                                    },
                                    {
                                        "Content": "[NAME]",
                                        "EndTime": 1.0199375,
                                        "StartTime": 0.7999375,
                                        "Type": "pronunciation"
                                    }
                                ],
                                "Entities": [
                                    {
                                        "Content": "[NAME]",
                                        "Category": "PII",
                                        "Type": "NAME",
                                        "StartTime" : 0.7999375,
                                        "EndTime" : 1.0199375,
                                        "Confidence": 0.9989
                                    }
                                ]
                            }
                        ],
                        "EndTime": 1.02,
                        "IsPartial": false,
                        "ResultId": "12345a67-8bc9-0de1-2f34-a5b678c90d12",
                        "StartTime": 0.0199375
                    }
                ]
            }
        }
    }
}
```

## Exemple de sortie d’identification des PII
<a name="pii-redaction-output-id"></a>

L’identification des PII est une fonctionnalité supplémentaire que vous pouvez utiliser dans le cadre de votre tâche de transcription en streaming. Les PII identifiées sont répertoriées dans la section `Entities` de chaque segment.

```
{
    "TranscriptResultStream": {
        "TranscriptEvent": {
            "Transcript": {
                "Results": [
                    {
                        "Alternatives": [
                            {
                                "Transcript": "my name is mike",
                                "Items": [
                                    {
                                        "Content": "my",
                                        "EndTime": 0.3799375,
                                        "StartTime": 0.0299375,
                                        "Type": "pronunciation"
                                    },
                                    {
                                        "Content": "name",
                                        "EndTime": 0.5899375,
                                        "StartTime": 0.3899375,
                                        "Type": "pronunciation"
                                    },
                                    {
                                        "Content": "is",
                                        "EndTime": 0.7899375,
                                        "StartTime": 0.5999375,
                                        "Type": "pronunciation"
                                    },
                                    {
                                        "Content": "mike",
                                        "EndTime": 0.9199375,
                                        "StartTime": 0.7999375,
                                        "Type": "pronunciation"                                    
                                    }
                                ],
                                "Entities": [
                                    {
                                        "Content": "mike",
                                        "Category": "PII",
                                        "Type": "NAME",
                                        "StartTime" : 0.7999375,
                                        "EndTime" : 1.0199375,
                                        "Confidence": 0.9989
                                    }
                                ]
                            }
                        ],
                        "EndTime": 1.02,
                        "IsPartial": false,
                        "ResultId": "12345a67-8bc9-0de1-2f34-a5b678c90d12",
                        "StartTime": 0.0199375
                    }
                ]
            }
        }
    }
}
```