

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Comment Amazon Transcribe fonctionne
<a name="how-it-works"></a>

Amazon Transcribe utilise des modèles d'apprentissage automatique pour convertir la parole en texte.

Outre le texte transcrit, les transcriptions contiennent des données sur le contenu transcrit, notamment les scores de confiance et les horodatages pour chaque mot ou signe de ponctuation. Pour voir un exemple de sortie, consultez la section [Entrée et sortie des données](how-input.md#how-output). Pour obtenir la liste complète des fonctionnalités que vous pouvez appliquer à votre transcription, reportez-vous au [récapitulatif des fonctionnalités](feature-matrix.md).

Les méthodes de transcription se répartissent en deux catégories principales :
+ **Transcriptions par lots** : Transcrivez les fichiers multimédia qui ont été téléchargés dans Amazon S3 un bucket. Vous pouvez utiliser le [AWS CLI[AWS Management Console](getting-started-console.md)](getting-started-cli.md), et divers [AWS SDKs](getting-started-sdk.md)pour les transcriptions par lots.
+ **Transcriptions en streaming** : transcrivez des flux multimédias en temps réel. Vous pouvez utiliser le [AWS Management Console](getting-started-console.md)[HTTP/2](streaming-setting-up.md#streaming-http2) et divers [AWS SDKs](getting-started-sdk.md)pour [WebSockets](streaming-setting-up.md#streaming-websocket)les transcriptions en streaming.

Notez que la prise en charge des fonctionnalités et des langues diffère pour les transcriptions par lots et en streaming. Pour de plus amples informations, consultez les sections [Amazon Transcribe features](feature-matrix.md) et [Langues prises en charge](supported-languages.md).

**Topics**
+ [Entrée et sortie des données](how-input.md)
+ [Transcription des nombres et de la ponctuation](how-numbers.md)

**Opérations d’API pour démarrer**  
Par lots : [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html)  
Diffusion en continu : [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartStreamTranscription.html), StartStreamTranscriptionWebSocket

# Entrée et sortie des données
<a name="how-input"></a>

Amazon Transcribe prend des données audio, sous forme de fichier multimédia dans un Amazon S3 bucket ou un flux multimédia, et les convertit en données texte.

Si vous transcrivez des fichiers multimédia stockés dans un Amazon S3 bucket, vous effectuez des **transcriptions par lots**. Si vous transcrivez des flux multimédia, vous effectuez des **transcriptions en streaming**. Ces deux processus ont des règles et des exigences différentes.

Avec des transcriptions par lots, vous pouvez utiliser la [Mise en file d’attente des tâches](job-queueing.md) si vous n’avez pas besoin de traiter toutes vos tâches de transcription simultanément. Cela permet Amazon Transcribe de suivre vos tâches de transcription et de les traiter lorsque des créneaux sont disponibles.

**Note**  
Amazon Transcribe peut stocker temporairement votre contenu afin d'améliorer continuellement la qualité de ses modèles d'analyse. Veuillez consulter le [FAQ Amazon Transcribe](https://aws.amazon.com/transcribe/faqs/) pour en savoir plus. Pour demander la suppression d'un contenu qui aurait pu être stocké par Amazon Transcribe, ouvrez un dossier auprès de [Support](https://aws.amazon.com/contact-us/).

**Topics**
+ [Formats des médias](#how-input-audio)
+ [Canaux audio](#how-input-channels)
+ [Fréquences d’échantillonnage](#how-input-sample-rates)
+ [Sortie](#how-output)

## Formats des médias
<a name="how-input-audio"></a>

Les types de média pris en charge diffèrent entre les transcriptions par lots et les transcriptions en streaming, bien que les formats sans perte soient recommandés pour les deux. Consultez le tableau suivant pour plus d’informations :


|  | Par lots | Streaming | 
| --- | --- | --- | 
| Formats pris en charge |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/how-input.html)  |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/how-input.html)  | 
| Formats recommandés |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/how-input.html)  |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/fr_fr/transcribe/latest/dg/how-input.html)  | 

Pour un résultat optimal, utilisez un format sans perte tel que FLAC ou WAV, avec un encodage PCM 16 bits.

**Note**  
Les transcriptions en streaming ne sont pas prises en charge dans toutes les langues. Reportez-vous à la colonne « Entrée de données » du [tableau des langues prises en charge](supported-languages.md) pour plus de détails.

## Canaux audio
<a name="how-input-channels"></a>

Amazon Transcribe prend en charge les supports monocanaux et bicanaux. Les médias comportant plus de deux canaux ne sont actuellement pas pris en charge.

Si votre fichier audio contient plusieurs locuteurs sur un canal et que vous souhaitez partitionner et étiqueter chaque locuteur dans votre sortie de transcription, vous pouvez utiliser [le partitionnement de locuteurs (diarisation)](diarization.md).

Si votre audio contient de la parole sur deux canaux distincts, vous pouvez utiliser l’[identification des canaux](channel-id.md) pour transcrire chaque canal séparément dans votre transcription.

Ces deux options produisent un seul fichier de transcription.

**Note**  
Si vous n’activez pas le [partitionnement des locuteurs](diarization.md) ou l’[identification des canaux](channel-id.md), le texte de votre transcription est fourni sous la forme d’une section continue.

## Fréquences d’échantillonnage
<a name="how-input-sample-rates"></a>

Dans le cas des tâches de transcription par lots, vous pouvez choisir de fournir une fréquence d’échantillonnage, bien que ce paramètre soit facultatif. Si vous l’incluez dans votre demande, assurez-vous que la valeur que vous fournissez correspond à la fréquence d’échantillonnage réelle de votre audio. Si vous fournissez une fréquence d’échantillonnage qui ne correspond pas à votre audio, votre tâche risque d’échouer.

Pour les transcriptions en streaming, vous devez inclure une fréquence d’échantillonnage dans votre demande. Comme pour les tâches de transcription par lots, assurez-vous que la valeur que vous fournissez correspond à la fréquence d’échantillonnage réelle de votre audio.

Les fréquences d’échantillonnage pour le son basse fidélité, tel que les enregistrements téléphoniques, utilisent généralement 8 000 Hz. Pour un son haute fidélité, Amazon Transcribe prend en charge des valeurs comprises entre 16 000 Hz et 48 000 Hz.

## Sortie
<a name="how-output"></a>

La sortie de transcription est au format JSON. La première partie de votre transcription contient la transcription elle-même sous forme de paragraphe, suivie de données supplémentaires pour chaque mot et chaque signe de ponctuation. Les données fournies dépendent des fonctionnalités que vous incluez dans votre demande. Votre transcription contient au minimum l’heure de début, l’heure de fin et le score de confiance pour chaque mot. La [section suivante](#how-it-works-output) montre un exemple de sortie d’une demande de transcription de base qui n’incluait aucune option ou fonctionnalité supplémentaire.

Toutes les **transcriptions par lots** sont stockées dans des Amazon S3 compartiments. Vous pouvez choisir d'enregistrer votre transcription dans votre propre Amazon S3 compartiment ou d' Amazon Transcribe utiliser un compartiment sécurisé par défaut. Pour en savoir plus sur la création et l’utilisation de compartiments Amazon S3 , consultez la section [Utilisation des compartiments](https://docs.aws.amazon.com/AmazonS3/latest/userguide/creating-buckets-s3.html).

Si vous souhaitez que votre transcription soit stockée dans un Amazon S3 compartiment dont vous êtes le propriétaire, spécifiez l'URI du compartiment dans votre demande de transcription. Assurez-vous de donner des autorisations Amazon Transcribe d'écriture pour ce bucket avant de commencer votre travail de transcription par lots. Si vous spécifiez votre propre compartiment, votre transcription reste dans ce compartiment jusqu’à ce que vous le supprimiez. 

Si vous ne spécifiez pas de Amazon S3 compartiment, utilisez Amazon Transcribe un compartiment géré par un service sécurisé et vous fournissez une URI temporaire que vous pouvez utiliser pour télécharger votre transcription. Notez que URIs les temporaires sont valides pendant 15 minutes. Si un message d’erreur `AccessDenied` s’affiche lorsque vous utilisez l’URI fourni, faites une demande `GetTranscriptionJob` pour obtenir un nouvel URI temporaire pour votre transcription.

Si vous optez pour un compartiment par défaut, votre transcription est supprimée à l’expiration de votre tâche (90 jours). Si vous souhaitez conserver votre transcription au-delà de cette date d’expiration, vous devez la télécharger.

Les **transcriptions en streaming** sont renvoyées selon la même méthode que celle que vous utilisez pour votre flux.

**Astuce**  
Si vous souhaitez convertir votre sortie JSON en une turn-by-turn transcription au format Word, consultez cet [GitHub exemple (pour Python3](https://github.com/aws-samples/amazon-transcribe-output-word-document)). Ce script fonctionne avec les transcriptions d’analyse après-appel et les transcriptions par lots standard avec la diarisation activée.

### Exemple de sortie
<a name="how-it-works-output"></a>

Les transcriptions fournissent une transcription complète sous forme de paragraphe, suivie d'une word-for-word ventilation, qui fournit des données pour chaque mot et chaque signe de ponctuation. Cela inclut l’heure de début, l’heure de fin, un score de confiance et un type (`pronunciation` ou `punctuation`).

L’exemple suivant provient d’une tâche de transcription par lots simple qui n’incluait aucune [fonctionnalité supplémentaire](feature-matrix.md). Avec chaque fonctionnalité supplémentaire que vous appliquez à votre demande de transcription, vous obtenez des données supplémentaires dans votre fichier de sortie de transcription.

Les transcriptions par lots de base contiennent deux sections principales :

1. `transcripts` : contient la transcription complète dans un bloc de texte.

1. `items` : contient des informations sur chaque mot et chaque signe de ponctuation de la section `transcripts`.

1. `audio_segments`: Un segment audio est une partie spécifique d'un enregistrement audio qui contient une langue parlée ininterrompue, avec un minimum de pauses ou de pauses. Ce segment capture un flux vocal naturel et est capturé `audio_segments` avec une heure de début et une heure de fin. L'`items`élément d'un segment audio est une séquence d'identifiants correspondant à chaque élément du segment.

Chaque fonctionnalité supplémentaire que vous incluez dans votre demande de transcription produit des informations supplémentaires dans votre transcription.

```
{
    "jobName": "my-first-transcription-job",
    "accountId": "111122223333",
    "results": {
        "transcripts": [
            {
                "transcript": "Welcome to Amazon Transcribe."
            }
        ],
        "items": [
            {
                "id": 0,
                "start_time": "0.64",
                "end_time": "1.09",
                "alternatives": [
                    {
                        "confidence": "1.0",
                        "content": "Welcome"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "id": 1,
                "start_time": "1.09",
                "end_time": "1.21",
                "alternatives": [
                    {
                        "confidence": "1.0",
                        "content": "to"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "id": 2,
                "start_time": "1.21",
                "end_time": "1.74",
                "alternatives": [
                    {
                        "confidence": "1.0",
                        "content": "Amazon"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "id": 3,
                "start_time": "1.74",
                "end_time": "2.56",
                "alternatives": [
                    {
                        "confidence": "1.0",
                        "content": "Transcribe"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "id": 4,
                "alternatives": [
                    {
                        "confidence": "0.0",
                        "content": "."
                    }
                ],
                "type": "punctuation"
            }
        ],
        "audio_segments": [
            {
                "id": 0,
                "transcript": "Welcome to Amazon Transcribe.",
                "start_time": "0.64",
                "end_time": "2.56",
                "items": [
                    0,
                    1,
                    2,
                    3,
                    4
                ]
            }
        ]
    },
    "status": "COMPLETED"
}
```

# Transcription des nombres et de la ponctuation
<a name="how-numbers"></a>

Amazon Transcribe ajoute automatiquement la ponctuation à toutes les langues prises en charge et met les mots en majuscules de manière appropriée pour les langues qui utilisent la distinction majuscules et minuscules dans leurs systèmes d'écriture.

Dans la plupart des langues, les nombres sont transcrits dans leur forme littérale. Toutefois, pour les langues prenant en charge la transcription des nombres, Amazon Transcribe traitez les nombres différemment selon le contexte dans lequel ils sont utilisés.

Par exemple, si un orateur dit »*Retrouvez-moi le 1er juin à huit heures trente du matin au cent rue principale avec des three-dollars-and-fifty cents et des tablettes de chocolat one-point-five*», ceci est transcrit comme suit :
+ Langues prises en charge de la transcription numérique : Meet me at 8:30 a.m. on June 1st at 100 Main Street with \$13.50 and 1.5 chocolate bars
+ Toutes les autres langues : Meet me at eight thirty a m on June first at one hundred Main Street with three dollars and fifty cents and one point five chocolate bars

Pour voir les langues compatibles avec la transcription des nombres, reportez-vous à[Langues prises en charge et fonctionnalités spécifiques aux langues](supported-languages.md).