

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Identification des langues dominantes dans vos médias
<a name="lang-id"></a>

Amazon Transcribe est capable d'identifier automatiquement les langues parlées dans vos médias sans que vous ayez à spécifier de code de langue.

L’[identification des langues par lots](lang-id-batch.md) permet d’identifier la langue dominante parlée dans votre fichier multimédia ou, si votre média contient plusieurs langues, elle peut identifier toutes les langues parlées. Pour améliorer la précision de l’identification des langues, vous pouvez éventuellement fournir une liste d’au moins deux langues que vous pensez être présentes dans votre média.

L’[identification de la langue de diffusion](lang-id-stream.md) peut identifier une langue par canal (deux canaux au maximum sont pris en charge) ou, si le flux contient plusieurs langues, elle peut identifier toutes les langues parlées. Les demandes de streaming doivent comporter au moins deux options de langue supplémentaires dans votre demande. La sélection d’options de langue permet une identification plus rapide des langues. Plus la langue Amazon Transcribe est identifiée rapidement, moins il y a de perte de données dans les premières secondes de votre stream.

**Important**  
Les transcriptions par lots et en streaming prennent en charge différentes langues. Reportez-vous à la colonne **Entrée de données** du [tableau des langues prises en charge](supported-languages.md) pour plus de détails. Notez que le suédois et le vietnamien ne sont actuellement pas pris en charge pour l’identification des langues.

Pour en savoir plus sur la surveillance et les événements associés à l’identification des langues, consultez la section [Événements d’identification des langues](monitoring-events.md#lang-id-event).

# Identification des langues avec des tâches de transcription par lots
<a name="lang-id-batch"></a>

Utilisez l’identification des langues par lots pour identifier automatiquement la ou les langues de votre fichier multimédia.

Si votre fichier multimédia ne contient qu’une seule langue, vous pouvez activer l’[identification d’une langue unique](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html#transcribe-StartTranscriptionJob-request-IdentifyLanguage), qui identifie la langue dominante parlée dans votre fichier multimédia et crée votre transcription en utilisant uniquement cette langue.

Si votre fichier multimédia contient plusieurs langues, vous pouvez activer l’[identification multilingue](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html#transcribe-StartTranscriptionJob-request-IdentifyMultipleLanguages), qui identifie toutes les langues parlées dans votre fichier multimédia et crée votre transcription en utilisant chaque langue identifiée. Notez qu’une transcription multilingue est produite. Vous pouvez utiliser d'autres services Amazon Translate, tels que la traduction de votre relevé de notes.

Reportez-vous au tableau des [langues prises en charge](supported-languages.md) pour obtenir la liste complète des langues prises en charge et des codes de langue associés.

Pour de meilleurs résultats, assurez-vous que votre fichier multimédia contient au moins 30 secondes de parole.

Pour des exemples d'utilisation avec le SDK AWS Management Console AWS CLI,, et AWS Python, consultez[Utilisation de l’identification des langues avec des transcriptions par lots](#lang-id-batch-examples).

## Identification des langues dans un audio multilingue
<a name="lang-id-batch-multi-language"></a>

L’identification multilingue est destinée aux fichiers multimédias multilingues. Elle fournit une transcription qui reflète toutes les [langues prises en charge](supported-languages.md) parlées dans votre média. Cela signifie que si les locuteurs changent de langue en cours de conversation, ou si chaque participant parle une langue différente, votre sortie de transcription détecte et transcrit correctement chaque langue. Par exemple, si votre média contient un locuteur bilingue qui alterne entre l’anglais américain (`en-US`) et l’hindi (`hi-IN`), l’identification multilingue peut identifier et transcrire l’anglais américain comme `en-US` et l’hindi parlé comme `hi-IN`.

Cela diffère de l’identification dans d’une seule langue, où une seule langue dominante est utilisée pour créer une transcription. Dans ce cas, toute langue parlée qui n’est pas la langue dominante est incorrectement transcrite.

**Note**  
L’expurgation et les modèles de langue personnalisés ne sont actuellement pas pris en charge avec l’identification multilingue.

**Note**  
Les langues suivantes sont actuellement prises en charge avec une identification multilingue : en-AB, en-AU, en-GB, en-IE, en-NZ, en-US, en-WL, en-ZA, es-ES, es-US, fr-CA, fr-FR, zh-CN, zh-TW, pt-BR, pt-PT, de-CH, de-DE, af-ZA, ar-AE, da-DK, he-IL, hi-in, ID-ID, Fa-ir, It-it, Ja-JP, Ko-KR, MS-My, NL-NL, Ru-ru, Ta-in, Te-in, Th-TH, TR-TR 

Les transcriptions multilingues fournissent un récapitulatif des langues détectées et le temps total pendant lequel chaque langue est parlée dans vos médias. Voici un exemple :

```
"results": {
        "transcripts": [
            {
                "transcript": "welcome to Amazon transcribe. ये तो उदाहरण हैं क्या कैसे कर सकते हैं ।一つのファイルに複数の言語を書き写す"
            }
        ],

    ...

        "language_codes": [
            {
                "language_code": "en-US",
                "duration_in_seconds": 2.45
            },
            {
                "language_code": "hi-IN",
                "duration_in_seconds": 5.325
            },
            {
                "language_code": "ja-JP",
                "duration_in_seconds": 4.15
            }
        ]
}
```

## Amélioration de la précision de l’identification des langues
<a name="lang-id-batch-improve-accuracy"></a>

L’identification des langues vous permet d’inclure la liste des langues que vous pensez être présentes dans vos médias. L'inclusion des options de langue (`LanguageOptions`) limite Amazon Transcribe l'utilisation des seules langues que vous spécifiez lorsque vous associez votre audio à la bonne langue, ce qui peut accélérer l'identification de la langue et améliorer la précision associée à l'attribution du dialecte linguistique approprié.

Si vous choisissez d’inclure des codes de langue, vous devez en inclure au moins deux. Il n’y a aucune limite quant au nombre de codes de langue que vous pouvez inclure, mais nous vous recommandons d’en utiliser entre deux et cinq pour une efficacité et une précision optimales.

**Note**  
Si vous incluez des codes de langue dans votre demande et qu'aucun des codes de langue que vous fournissez ne correspond à la langue ou aux langues identifiées dans votre audio, Amazon Transcribe sélectionne la langue la plus proche parmi les codes de langue que vous avez spécifiés. Une transcription dans cette langue est ensuite générée. Par exemple, si votre contenu multimédia est en anglais américain (`en-US`) et que vous Amazon Transcribe fournissez les codes de langue`zh-CN`, et `fr-FR``de-DE`, Amazon Transcribe il est probable que votre contenu corresponde à l'allemand (`de-DE`) et produira une transcription en allemand. La non-concordance entre les codes de langue et les langues parlées peut entraîner une transcription inexacte. Nous vous recommandons donc de faire preuve de prudence lorsque vous incluez des codes de langue.

## Combiner l'identification de la langue avec d'autres Amazon Transcribe fonctionnalités
<a name="lang-id-batch-features"></a>

Vous pouvez utiliser l’identification des langues par lots en combinaison avec toute autre fonctionnalité Amazon Transcribe . Si vous associez l’identification des langues à d’autres fonctionnalités, vous êtes limité aux langues prises en charge par ces fonctionnalités. Par exemple, si vous utilisez l'identification de la langue pour la rédaction de contenu, vous êtes limité à l'anglais américain (`en-US`) ou à l'espagnol américain (`es-US`), car il s'agit de la seule langue disponible pour la rédaction. Pour plus d’informations, consultez la section [Langues prises en charge et fonctionnalités spécifiques aux langues](supported-languages.md).

**Important**  
Si vous utilisez l'identification automatique de la langue avec la rédaction de contenu activée et que votre fichier audio contient des langues autres que l'anglais américain (`en-US`) ou l'espagnol américain (`es-US`), seul le contenu en anglais américain ou en espagnol américain est expurgé dans votre transcription. Les autres langues ne peuvent pas être expurgées et il n’y a aucun avertissement ni échec de la tâche.



**Modèles de langue personnalisés, vocabulaires personnalisés et filtres de vocabulaires personnalisés**

Si vous souhaitez ajouter un ou plusieurs modèles de langue personnalisés, vocabulaires personnalisés ou filtres de vocabulaires personnalisés à votre demande d’identification des langues, vous devez inclure le paramètre [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_LanguageIdSettings.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_LanguageIdSettings.html). Vous pouvez ensuite spécifier un code de langue avec un modèle de langue personnalisé, un vocabulaire personnalisé et un filtre de vocabulaire personnalisé correspondants. Notez que l’identification multilingue ne prend pas en charge les modèles de langue personnalisés.

Il est recommandé d’inclure `LanguageOptions` lorsque vous utilisez [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_LanguageIdSettings.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_LanguageIdSettings.html) pour vous assurer que le bon dialecte linguistique est identifié. Par exemple, si vous spécifiez un vocabulaire `en-US` personnalisé, mais que vous Amazon Transcribe déterminez que c'est la langue parlée dans vos médias`en-AU`, votre vocabulaire personnalisé *n'est pas* appliqué à votre transcription. Si vous incluez `LanguageOptions` et spécifiez `en-US` comme seul dialecte de langue anglaise, votre vocabulaire personnalisé *est* appliqué à votre transcription.

Pour des exemples [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_LanguageIdSettings.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_LanguageIdSettings.html)dans une demande, reportez-vous à l'option 2 dans les panneaux **AWS SDKs**déroulants **AWS CLI**et dans la [Utilisation de l’identification des langues avec des transcriptions par lots](#lang-id-batch-examples) section.

## Utilisation de l’identification des langues avec des transcriptions par lots
<a name="lang-id-batch-examples"></a>

Vous pouvez utiliser l'identification automatique de la langue dans une tâche de transcription par lots à l'aide du **AWS Management Console**AWS CLI****, ou **AWS SDKs**; consultez les exemples suivants :

### AWS Management Console
<a name="lang-id-console-batch"></a>

1. Connectez-vous à la [AWS Management Console](https://console.aws.amazon.com/transcribe/).

1. Dans le volet de navigation, choisissez **Tâches de transcription**, puis sélectionnez **Créer une tâche** (en haut à droite). La page **Spécifier les détails de la tâche** s’ouvre.

1. Dans le volet **Paramètres de la tâche**, recherchez la section **Paramètres de langue** et sélectionnez **Identification automatique des langues** ou **Identification automatique de plusieurs langues**.

   Vous pouvez sélectionner plusieurs options de langue (dans la liste déroulante *Sélectionner les langues*) si vous connaissez les langues présentes dans votre fichier audio. La sélection d’options de langue peut améliorer la précision, mais n’est pas obligatoire.  
![\[Amazon Transcribe capture d'écran de la console : le volet « paramètres de la tâche » sur la page « Spécifier les détails de la tâche ».\]](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/images/lang-id-batch1.png)

1. Renseignez les autres champs que vous souhaitez inclure sur la page **Spécifier les détails de la tâche**, puis sélectionnez **Suivant**. Vous accédez alors à la page **Configurer la tâche - *facultatif***.  
![\[Amazon Transcribe capture d'écran de la console : la page « configurer le travail ».\]](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/images/lang-id-configure-batch.png)

1. Sélectionnez **Créer une tâche** pour exécuter votre tâche de transcription. 

### AWS CLI
<a name="lang-id-cli"></a>

Cet exemple utilise la [start-transcription-job](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/transcribe/start-transcription-job.html)commande et le `IdentifyLanguage` paramètre. Pour plus d’informations, consultez [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html) et [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_LanguageIdSettings.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_LanguageIdSettings.html).

**Option 1** : Sans le paramètre `language-id-settings`. Utilisez cette option si vous **n’incluez pas** de modèle de langue personnalisé, de vocabulaire personnalisé ou de filtre de vocabulaire personnalisé dans votre demande. `language-options` est facultative, mais recommandée.

```
aws transcribe start-transcription-job \
--region us-west-2 \
--transcription-job-name my-first-transcription-job \
--media MediaFileUri=s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac \
--output-bucket-name amzn-s3-demo-bucket \
--output-key my-output-files/ \    
--identify-language \  (or --identify-multiple-languages) \
--language-options "en-US" "hi-IN"
```

**Option 2** : Avec le paramètre `language-id-settings`. Utilisez cette option si vous **incluez** un modèle de langue personnalisé, un vocabulaire personnalisé ou un filtre de vocabulaire personnalisé dans votre demande.

```
aws transcribe start-transcription-job \
--region us-west-2 \
--transcription-job-name my-first-transcription-job \
--media MediaFileUri=s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac \
--output-bucket-name amzn-s3-demo-bucket \
--output-key my-output-files/ \
--identify-language \  (or --identify-multiple-languages)
--language-options "en-US" "hi-IN" \
--language-id-settings en-US=VocabularyName=my-en-US-vocabulary,en-US=VocabularyFilterName=my-en-US-vocabulary-filter,en-US=LanguageModelName=my-en-US-language-model,hi-IN=VocabularyName=my-hi-IN-vocabulary,hi-IN=VocabularyFilterName=my-hi-IN-vocabulary-filter
```

Voici un autre exemple d'utilisation de la [start-transcription-job](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/transcribe/start-transcription-job.html)commande et d'un corps de requête identifiant la langue.

```
aws transcribe start-transcription-job \
--region us-west-2 \
--cli-input-json file://filepath/my-first-language-id-job.json
```

Le fichier *my-first-language-id-job.json* contient le corps de requête suivant.

**Option 1** : Sans le paramètre `LanguageIdSettings`. Utilisez cette option si vous **n’incluez pas** de modèle de langue personnalisé, de vocabulaire personnalisé ou de filtre de vocabulaire personnalisé dans votre demande. `LanguageOptions` est facultative, mais recommandée.

```
{
  "TranscriptionJobName": "my-first-transcription-job",  
  "Media": {
        "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
   },
  "OutputBucketName": "amzn-s3-demo-bucket",
  "OutputKey": "my-output-files/", 
  "IdentifyLanguage": true,  (or "IdentifyMultipleLanguages": true),
  "LanguageOptions": [
        "en-US", "hi-IN"  
  ]
}
```

**Option 2** : Avec le paramètre `LanguageIdSettings`. Utilisez cette option si vous **incluez** un modèle de langue personnalisé, un vocabulaire personnalisé ou un filtre de vocabulaire personnalisé dans votre demande.

```
{
   "TranscriptionJobName": "my-first-transcription-job",  
   "Media": {
        "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
   },
   "OutputBucketName": "amzn-s3-demo-bucket",
   "OutputKey": "my-output-files/", 
   "IdentifyLanguage": true,  (or "IdentifyMultipleLanguages": true)
   "LanguageOptions": [
        "en-US", "hi-IN"  
   ],
   "LanguageIdSettings": { 
         "en-US" : { 
            "LanguageModelName": "my-en-US-language-model",
            "VocabularyFilterName": "my-en-US-vocabulary-filter",
            "VocabularyName": "my-en-US-vocabulary"
         },
         "hi-IN": {
             "VocabularyName": "my-hi-IN-vocabulary",
             "VocabularyFilterName": "my-hi-IN-vocabulary-filter"
         }
    }
}
```

### AWS SDK pour Python (Boto3)
<a name="lang-id-python-batch"></a>

Cet exemple utilise le AWS SDK pour Python (Boto3) pour identifier la langue de votre fichier à l'aide de l'`IdentifyLanguage`argument de la méthode [start\$1transcription\$1job](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/transcribe.html#TranscribeService.Client.start_transcription_job). Pour plus d’informations, consultez [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html) et [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_LanguageIdSettings.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_LanguageIdSettings.html).

Pour des exemples supplémentaires utilisant le AWS SDKs, notamment des exemples spécifiques aux fonctionnalités, des scénarios et des exemples multiservices, reportez-vous au chapitre. [Exemples de code pour Amazon Transcribe à l'aide de AWS SDKs](service_code_examples.md)

**Option 1** : Sans le paramètre `LanguageIdSettings`. Utilisez cette option si vous **n’incluez pas** de modèle de langue personnalisé, de vocabulaire personnalisé ou de filtre de vocabulaire personnalisé dans votre demande. `LanguageOptions` est facultative, mais recommandée.

```
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
job_name = "my-first-transcription-job"
job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
transcribe.start_transcription_job(
    TranscriptionJobName = job_name,
    Media = {
        'MediaFileUri': job_uri
    },
    OutputBucketName = 'amzn-s3-demo-bucket',
    OutputKey = 'my-output-files/',
    MediaFormat = 'flac',
    IdentifyLanguage = True,  (or IdentifyMultipleLanguages = True),
    LanguageOptions = [
        'en-US', 'hi-IN'
    ]
)

while True:
    status = transcribe.get_transcription_job(TranscriptionJobName = job_name)
    if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)
```

**Option 2** : Avec le paramètre `LanguageIdSettings`. Utilisez cette option si vous **incluez** un modèle de langue personnalisé, un vocabulaire personnalisé ou un filtre de vocabulaire personnalisé dans votre demande.

```
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe')
job_name = "my-first-transcription-job"
job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
transcribe.start_transcription_job(
    TranscriptionJobName = job_name,
    Media = {
        'MediaFileUri': job_uri
    },
    OutputBucketName = 'amzn-s3-demo-bucket',
    OutputKey = 'my-output-files/', 
    MediaFormat='flac',
    IdentifyLanguage=True,  (or IdentifyMultipleLanguages=True)
    LanguageOptions = [
        'en-US', 'hi-IN'
    ],
    LanguageIdSettings={
        'en-US': {
            'VocabularyName': 'my-en-US-vocabulary',
            'VocabularyFilterName': 'my-en-US-vocabulary-filter',
            'LanguageModelName': 'my-en-US-language-model'
        },
        'hi-IN': {
            'VocabularyName': 'my-hi-IN-vocabulary',
            'VocabularyFilterName': 'my-hi-IN-vocabulary-filter'
        }   
    }
)

while True:
    status = transcribe.get_transcription_job(TranscriptionJobName = job_name)
    if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)
```

# Identification des langues avec des transcriptions en streaming
<a name="lang-id-stream"></a>

L'identification de la langue de diffusion permet d'identifier la langue dominante parlée dans votre flux multimédia. Amazon Transcribe nécessite un minimum d'une seconde de parole pour identifier la langue.

Si votre flux ne contient qu’une seule langue, vous pouvez activer l’identification d’une langue unique, qui identifie la langue dominante parlée dans votre fichier multimédia et crée une transcription en utilisant uniquement cette langue.

Si le flux contient plusieurs langues, vous pouvez activer l’identification multilingue, qui identifie toutes les langues parlées dans votre flux et crée votre transcription en utilisant chaque langue identifiée. Notez qu’une transcription multilingue est produite. Vous pouvez utiliser d'autres services Amazon Transcribe, tels que la traduction de votre relevé de notes.

Pour utiliser l’identification des langues en streaming, vous devez fournir au moins deux codes de langue et vous ne pouvez sélectionner qu’un seul dialecte par langue par flux. Cela signifie que vous ne pouvez pas sélectionner `en-US` et `en-AU` comme options de langue pour la même transcription.

Vous pouvez également sélectionner une langue préférée parmi les codes de langue que vous fournissez. L’ajout d’une langue préférée peut accélérer le processus d’identification des langues, ce qui est utile pour les clips audio courts.

**Important**  
Si aucun des codes de langue que vous fournissez ne correspond à la langue ou aux langues identifiées dans votre audio, Amazon Transcribe sélectionne la langue la plus proche parmi les codes de langue que vous avez spécifiés. Une transcription dans cette langue est ensuite générée. Par exemple, si votre contenu multimédia est en anglais américain (`en-US`) et que vous Amazon Transcribe fournissez les codes de langue`zh-CN`, et `fr-FR``de-DE`, Amazon Transcribe il est probable que votre contenu corresponde à l'allemand (`de-DE`) et produira une transcription en allemand. La non-concordance entre les codes de langue et les langues parlées peut entraîner une transcription inexacte. Nous vous recommandons donc de faire preuve de prudence lorsque vous incluez des codes de langue.

Si votre média contient deux chaînes, Amazon Transcribe vous pouvez identifier la langue dominante parlée dans chaque chaîne. Dans ce cas, définissez le paramètre [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html#transcribe-Type-Settings-ChannelIdentification](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Settings.html#transcribe-Type-Settings-ChannelIdentification) sur `true` et chaque canal est transcrit séparément. Notez que la valeur par défaut de ce paramètre est `false`. Si vous ne le modifiez pas, seul le premier canal est transcrit et une seule langue est identifiée.

L’identification des langues en streaming ne peut pas être combinée à des modèles de langue personnalisés ou à l’expurgation. Si vous associez l’identification des langues à d’autres fonctionnalités, vous êtes limité aux langues prises en charge par ces fonctionnalités, ainsi qu’aux transcriptions en streaming. Reportez-vous à la section [Langues prises en charge](supported-languages.md).

**Note**  
PCM et FLAC sont les seuls formats audio pris en charge pour l’identification des langues en streaming. Pour l'identification multilingue, seul le PCM est pris en charge.

## Identification des langues dans un audio multilingue
<a name="multi-language-streaming"></a>

L’identification multilingue est destinée aux flux multilingues. Elle fournit une transcription qui reflète toutes les langues prises en charge parlées dans le flux. Cela signifie que si les locuteurs changent de langue en cours de conversation, ou si chaque participant parle une langue différente, votre sortie de transcription détecte et transcrit correctement chaque langue.

Par exemple, si le flux contient un locuteur bilingue qui alterne entre l’anglais américain (`en-US`) et l’hindi (`hi-IN`), l’identification multilingue peut identifier et transcrire l’anglais américain en tant que `en-US` et l’hindi parlé en tant que `hi-IN`. Cela diffère de l’identification dans d’une seule langue, où une seule langue dominante est utilisée pour créer une transcription. Dans ce cas, toute langue parlée qui n’est pas la langue dominante est incorrectement transcrite.

**Note**  
L’expurgation et les modèles de langue personnalisés ne sont actuellement pas pris en charge avec l’identification multilingue.

## Utilisation de l’identification des langues avec les médias en streaming
<a name="lang-id-stream-examples"></a>

Vous pouvez utiliser l'identification automatique de la langue dans une transcription en streaming à l'**AWS Management Console**aide de **HTTP/2** ou **WebSockets**; consultez les exemples suivants :

### AWS Management Console
<a name="lang-id-console-stream"></a>

1. Connectez-vous à la [AWS Management Console](https://console.aws.amazon.com/transcribe/).

1. Dans le panneau de navigation, choisissez **Transcription en temps réel**. Faites défiler jusqu’à **Paramètres de langue** et développez ce champ s’il est réduit.  
![\[Amazon Transcribe capture d'écran de la console : l'onglet « paramètres linguistiques » réduit sur la page « transcription en temps réel ».\]](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/images/lang-id-stream1.png)

1. Sélectionnez **Identification automatique de la langue** ou **Identification automatique de plusieurs langues**.  
![\[Amazon Transcribe capture d'écran de la console : l'onglet « paramètres linguistiques » étendu.\]](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/images/lang-id-stream2.png)

1. Fournissez au moins deux codes de langue pour votre transcription. Notez que vous ne pouvez fournir qu’un seul dialecte par langue. Par exemple, vous ne pouvez pas sélectionner à la fois `en-US` et `en-GB` comme options de langue pour la même transcription.  
![\[Amazon Transcribe capture d'écran de la console : le menu déroulant de sélection du code de langue.\]](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/images/lang-id-stream3.png)

1. (Facultatif) Dans le sous-ensemble de langues que vous avez sélectionné à l’étape précédente, vous pouvez choisir une langue préférée pour votre transcription.  
![\[Amazon Transcribe capture d'écran de la console : le panneau « paramètres de langue » avec les options de langue préférées.\]](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/images/lang-id-stream4.png)

1. Vous êtes prêt à transcrire votre flux. Sélectionnez **Démarrer le streaming** et commencez à parler. Pour mettre fin à votre dictée, sélectionnez **Arrêter le streaming**.

### Flux HTTP/2
<a name="lang-id-http2"></a>

Cet exemple crée une requête HTTP/2 avec l’identification des langues activée. Pour plus d'informations sur l'utilisation du streaming HTTP/2 avec Amazon Transcribe, consultez[Configuration d’un flux HTTP/2](streaming-setting-up.md#streaming-http2). Pour plus de détails sur les paramètres et les en-têtes spécifiques à Amazon Transcribe, voir [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html).

```
POST /stream-transcription HTTP/2
host: transcribestreaming.us-west-2.amazonaws.com
X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription
Content-Type: application/vnd.amazon.eventstream
X-Amz-Content-Sha256: string
X-Amz-Date: 20220208T235959Z
Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000    
x-amzn-transcribe-identify-language: true
x-amzn-transcribe-language-options: en-US,de-DE
x-amzn-transcribe-preferred-language: en-US
transfer-encoding: chunked
```

Cet exemple crée une requête HTTP/2 avec l’identification de plusieurs langues activée. Pour plus d'informations sur l'utilisation du streaming HTTP/2 avec Amazon Transcribe, consultez[Configuration d’un flux HTTP/2](streaming-setting-up.md#streaming-http2). Pour plus de détails sur les paramètres et les en-têtes spécifiques à Amazon Transcribe, voir [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html).

```
POST /stream-transcription HTTP/2
host: transcribestreaming.us-west-2.amazonaws.com
X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription
Content-Type: application/vnd.amazon.eventstream
X-Amz-Content-Sha256: string
X-Amz-Date: 20220208T235959Z
Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000    
x-amzn-transcribe-identify-multiple-languages: true
x-amzn-transcribe-language-options: en-US,de-DE
x-amzn-transcribe-preferred-language: en-US
transfer-encoding: chunked
```

Si vous utilisez `identify-language` ou `identify-multiple-languages` dans la demande, vous devez également inclure `language-options`. Vous ne pouvez pas utiliser à la fois `language-code` et `identify-language` dans la même demande.

Les définitions des paramètres se trouvent dans la [référence d'API](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Reference.html) ; les paramètres communs à toutes les opérations d' AWS API sont répertoriés dans la section [Paramètres communs](https://docs.aws.amazon.com/transcribe/latest/APIReference/CommonParameters.html).

### WebSocket flux
<a name="lang-id-websocket"></a>

Cet exemple crée une URL présignée qui utilise l'identification de la langue dans un WebSocket flux. Les sauts de ligne ont été ajoutés pour faciliter la lecture. Pour plus d'informations sur l'utilisation WebSocket des flux avec Amazon Transcribe, consultez[Configuration d'un WebSocket stream](streaming-setting-up.md#streaming-websocket). Pour plus de détails sur les paramètres, consultez la section [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html).

```
GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket?
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=string
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date
&media-encoding=flac
&sample-rate=16000
&identify-language=true
&language-options=en-US,de-DE
&preferred-language=en-US
```

Cet exemple crée une URL présignée qui utilise l'identification de plusieurs langues dans un WebSocket flux. Les sauts de ligne ont été ajoutés pour faciliter la lecture. Pour plus d'informations sur l'utilisation WebSocket des flux avec Amazon Transcribe, consultez[Configuration d'un WebSocket stream](streaming-setting-up.md#streaming-websocket). Pour plus de détails sur les paramètres, consultez la section [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html).

```
GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket?
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=string
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date
&media-encoding=flac
&sample-rate=16000
&identify-multiple-languages=true
&language-options=en-US,de-DE
&preferred-language=en-US
```

Si vous utilisez `identify-language` ou `identify-multiple-languages` dans la demande, vous devez également inclure `language-options`. Vous ne pouvez pas utiliser à la fois `language-code` et `identify-language` dans la même demande.

Les définitions des paramètres se trouvent dans la [référence d'API](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Reference.html) ; les paramètres communs à toutes les opérations d' AWS API sont répertoriés dans la section [Paramètres communs](https://docs.aws.amazon.com/transcribe/latest/APIReference/CommonParameters.html).