

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Partitionnement des locuteurs (diarisation)
<a name="diarization"></a>

Grâce à la diarisation des haut-parleurs, vous pouvez faire la distinction entre les différents locuteurs dans votre sortie de transcription. Amazon Transcribe peut différencier un maximum de 30 locuteurs uniques et étiqueter le texte de chaque locuteur avec une valeur unique (`spk_0`jusqu'à`spk_9`).

Outre les [sections de transcription standard](how-input.md#how-it-works-output) (`transcripts` et `items`), les demandes pour lesquelles le partitionnement des locuteurs est activé incluent une section `speaker_labels`. Cette section est regroupée par locuteur et contient des informations sur chaque énoncé, notamment l’étiquette du locuteur et des horodatages.

```
"speaker_labels": {
    "channel_label": "ch_0",
    "speakers": 2,
    "segments": [
         {
            "start_time": "4.87",
            "speaker_label": "spk_0",
            "end_time": "6.88",
            "items": [                                                 
                {
                    "start_time": "4.87",
                    "speaker_label": "spk_0",
                    "end_time": "5.02"
                },
        {{...}}
        {
            "start_time": "8.49",
            "speaker_label": "spk_1",
            "end_time": "9.24",
            "items": [
                {
                    "start_time": "8.49",
                    "speaker_label": "spk_1",
                    "end_time": "8.88"
                },
```

Pour consulter un exemple de transcription complet avec partitionnement des locuteurs (pour deux locuteurs), consultez la section [Exemple de sortie de diarisation (lot)](diarization-output-batch.md).

## Partitionnement des locuteurs dans une transcription par lots
<a name="diarization-batch"></a>

Pour partitionner des locuteurs dans une transcription par lots, consultez les exemples suivants :

### AWS Management Console
<a name="diarization-console-batch"></a>

1. Connectez-vous à la [AWS Management Console](https://console.aws.amazon.com/transcribe/).

1. Dans le volet de navigation, choisissez **Tâches de transcription**, puis sélectionnez **Créer une tâche** (en haut à droite). La page **Spécifier les détails de la tâche** s’ouvre.  
![Amazon Transcribe page « Spécifier les détails de la tâche » de la console. Dans le volet « Paramètres de la tâche », vous pouvez définir un nom pour votre tâche de transcription, sélectionner un type de modèle et définir vos paramètres de langue.](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/images/console-batch-job-details-1.png)

1. Renseignez les champs que vous souhaitez inclure sur la page **Spécifier les détails de la tâche**, puis sélectionnez **Suivant**. Vous accédez alors à la page **Configurer la tâche - *facultatif***.

   Pour activer le partitionnement des haut-parleurs, dans **les paramètres audio**, choisissez **Identification audio**. Choisissez ensuite **Partitionnement des haut-parleurs** et spécifiez le nombre de haut-parleurs.  
![Amazon Transcribe page « Configurer le travail » de la console. Dans le volet « Paramètres audio », vous pouvez activer « Partitionnement des locuteurs ».](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/images/diarization-batch.png)

1. Sélectionnez **Créer une tâche** pour exécuter votre tâche de transcription. 

### AWS CLI
<a name="diarization-cli"></a>

Cet exemple utilise la commande [start-transcription-job](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/transcribe/start-transcription-job.html). Pour de plus amples informations, veuillez consulter [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html).

```
aws transcribe start-transcription-job \
--region {{us-west-2}} \
--transcription-job-name {{my-first-transcription-job}} \
--media MediaFileUri=s3://{{amzn-s3-demo-bucket}}/{{my-input-files}}/{{my-media-file}}.{{flac}} \
--output-bucket-name {{amzn-s3-demo-bucket}} \
--output-key {{my-output-files}}/ \
--language-code {{en-US}} \
--settings ShowSpeakerLabels={{true}},MaxSpeakerLabels={{3}}
```

Voici un autre exemple utilisant la commande [start-transcription-job](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/transcribe/start-transcription-job.html), et un corps de requête qui permet le partitionnement de locuteurs avec cette tâche.

```
aws transcribe start-transcription-job \
--region {{us-west-2}} \
--cli-input-json file://{{my-first-transcription-job}}.json
```

Le fichier *my-first-transcription-job.json* contient le corps de requête suivant.

```
{
  "TranscriptionJobName": "{{my-first-transcription-job}}",
  "Media": {
        "MediaFileUri": "s3://{{amzn-s3-demo-bucket}}/{{my-input-files}}/{{my-media-file}}.{{flac}}"
  },
  "OutputBucketName": "{{amzn-s3-demo-bucket}}",
  "OutputKey": "{{my-output-files}}/", 
  "LanguageCode": "{{en-US}}",
  "ShowSpeakerLabels": 'TRUE',    
  "MaxSpeakerLabels": {{3}}
 }
```

### AWS SDK pour Python (Boto3)
<a name="diarization-python-batch"></a>

Cet exemple utilise le AWS SDK pour Python (Boto3) pour identifier les canaux à l'aide de la méthode [start\_transcription\_job](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/transcribe.html#TranscribeService.Client.start_transcription_job). Pour de plus amples informations, veuillez consulter [StartTranscriptionJob](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html).

```
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', '{{us-west-2}}')
job_name = "{{my-first-transcription-job}}"
job_uri = "s3://{{amzn-s3-demo-bucket}}/{{my-input-files}}/{{my-media-file}}.{{flac}}"
transcribe.start_transcription_job(
    TranscriptionJobName = job_name,
    Media = {
        'MediaFileUri': job_uri
    },
    OutputBucketName = '{{amzn-s3-demo-bucket}}',
    OutputKey = '{{my-output-files}}/', 
    LanguageCode = '{{en-US}}', 
    Settings = {
        'ShowSpeakerLabels': True,
        'MaxSpeakerLabels': {{3}}
    }    
)

while True:
    status = transcribe.get_transcription_job(TranscriptionJobName = job_name)
    if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)
```

## Partitionnement des locuteurs dans une transcription en streaming
<a name="diarization-stream"></a>

Pour partitionner des locuteurs dans une transcription en streaming, consultez les exemples suivants :

### Transcriptions en streaming
<a name="diarization-console-stream"></a>

1. Connectez-vous à la [AWS Management Console](https://console.aws.amazon.com/transcribe/).

1. Dans le volet de navigation, choisissez **Real-time Transcription**. Faites défiler jusqu’à **Paramètres audio** et développez ce champ s’il est réduit.  
![Amazon Transcribe capture d'écran de la console : l'onglet « paramètres audio » sur la page « transcription en temps réel ».](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/images/diarization-streaming1.png)

1. Activez **Partitionnement des locuteurs**.  
![Amazon Transcribe capture d'écran de la console : onglet « paramètres audio » étendu avec le partitionnement des haut-parleurs activé.](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/images/diarization-streaming2.png)

1. Vous êtes prêt à transcrire votre flux. Sélectionnez **Démarrer le streaming** et commencez à parler. Pour mettre fin à votre dictée, sélectionnez **Arrêter le streaming**.

### HTTP/2 flux
<a name="diarization-http2"></a>

Cet exemple crée une HTTP/2 demande qui partitionne les haut-parleurs dans votre sortie de transcription. Pour plus d'informations sur l'utilisation du HTTP/2 streaming avec Amazon Transcribe, consultez[Configuration d'un HTTP/2 stream](streaming-setting-up.md#streaming-http2). Pour plus de détails sur les paramètres et les en-têtes spécifiques à Amazon Transcribe, consultez la section [StartStreamTranscription](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html).

```
POST /stream-transcription HTTP/2
host: transcribestreaming.{{us-west-2}}.amazonaws.com
X-Amz-Target: com.amazonaws.transcribe.Transcribe.{{StartStreamTranscription}}
Content-Type: application/vnd.amazon.eventstream
X-Amz-Content-Sha256: {{string}}
X-Amz-Date: {{20220208}}T{{235959}}Z
Authorization: AWS4-HMAC-SHA256 Credential={{access-key}}/{{20220208}}/{{us-west-2}}/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature={{string}}
x-amzn-transcribe-language-code: {{en-US}}
x-amzn-transcribe-media-encoding: {{flac}}
x-amzn-transcribe-sample-rate: {{16000}}             
x-amzn-transcribe-show-speaker-label: true
transfer-encoding: chunked
```

Les définitions des paramètres se trouvent dans la [référence d'API](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Reference.html) ; les paramètres communs à toutes les opérations d' AWS API sont répertoriés dans la section [Paramètres communs](https://docs.aws.amazon.com/transcribe/latest/APIReference/CommonParameters.html).

### WebSocket flux
<a name="diarization-websocket"></a>

Cet exemple crée une URL présignée qui sépare les locuteurs dans votre sortie de transcription. Les sauts de ligne ont été ajoutés pour faciliter la lecture. Pour plus d'informations sur l'utilisation WebSocket des flux avec Amazon Transcribe, consultez[Configuration d'un WebSocket stream](streaming-setting-up.md#streaming-websocket). Pour plus de détails sur les paramètres, consultez la section [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html).

```
GET wss://transcribestreaming.{{us-west-2}}.amazonaws.com:8443/stream-transcription-websocket?
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential={{AKIAIOSFODNN7EXAMPLE}}%2F{{20220208}}%2F{{us-west-2}}%2F{{transcribe}}%2Faws4_request
&X-Amz-Date={{20220208}}T{{235959}}Z
&X-Amz-Expires={{300}}
&X-Amz-Security-Token={{security-token}}
&X-Amz-Signature={{string}}
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date
&language-code=en-US
&specialty={{PRIMARYCARE}}
&type={{DICTATION}}
&media-encoding={{flac}}
&sample-rate={{16000}}        
&show-speaker-label=true
```

Les définitions des paramètres se trouvent dans la [référence d'API](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Reference.html) ; les paramètres communs à toutes les opérations d' AWS API sont répertoriés dans la section [Paramètres communs](https://docs.aws.amazon.com/transcribe/latest/APIReference/CommonParameters.html).