Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Wie Amazon Transcribe funktioniert
<a name="how-it-works"></a>

Amazon Transcribe verwendet Modelle für maschinelles Lernen, um Sprache in Text umzuwandeln.

Zusätzlich zum transkribierten Text enthalten die Transkripte Daten über den transkribierten Inhalt, einschließlich Konfidenzwerte und Zeitstempel für jedes Wort oder Satzzeichen. Ein Beispiel für die Ausgabe finden Sie im Abschnitt [Dateneingabe und -ausgabe](how-input.md#how-output). Eine vollständige Liste der Features, die Sie auf Ihre Transkription anwenden können, finden Sie in der [Featureübersicht](feature-matrix.md).

Die Transkriptionsmethoden lassen sich in zwei Hauptkategorien einteilen:
+ **Batch-Transkriptionen**: Transcribe Sie Mediendateien, die in einen Bucket hochgeladen wurden. Amazon S3 Sie können die [AWS CLI](getting-started-cli.md), und various [AWS SDKs](getting-started-sdk.md)für [AWS-Managementkonsole](getting-started-console.md)Batch-Transkriptionen verwenden.
+ **Streaming-Transkriptionen**: Medien-Streams in Echtzeit transkribieren. Sie können die [AWS-Managementkonsole](getting-started-console.md), [HTTP/2](streaming-setting-up.md#streaming-http2), und verschiedene [AWS SDKs](getting-started-sdk.md)zum Streamen von [WebSockets](streaming-setting-up.md#streaming-websocket)Transkriptionen verwenden.

Beachten Sie, dass sich die Unterstützung von Features und Sprachen bei Batch- und Streaming-Transkriptionen unterscheidet. Weitere Informationen finden Sie unter [Amazon Transcribe features](feature-matrix.md) und [Unterstützte Sprachen](supported-languages.md).

**Topics**
+ [Dateneingabe und -ausgabe](how-input.md)
+ [Transkribieren von Zahlen und Interpunktion](how-numbers.md)

**API-Vorgänge für den Einstieg**  
Batch: [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html)  
Streaming:, [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartStreamTranscription.html) StartStreamTranscriptionWebSocket

# Dateneingabe und -ausgabe
<a name="how-input"></a>

Amazon Transcribe nimmt Audiodaten als Mediendatei in einem Amazon S3 Bucket oder als Medienstream auf und konvertiert sie in Textdaten.

Wenn Sie Mediendateien transkribieren, die in einem Amazon S3 Bucket gespeichert sind, führen Sie **Batch-Transkriptionen** durch. Wenn Sie Medien-Streams transkribieren, führen Sie **Streaming-Transkriptionen** durch. Für diese beiden Verfahren gelten unterschiedliche Regeln und Anforderungen.

Bei Batch-Transkriptionen können Sie [Auftragswarteschlangen](job-queueing.md) verwenden, wenn Sie nicht alle Ihre Transkriptionsaufträge gleichzeitig bearbeiten müssen. Auf diese Weise können Amazon Transcribe Sie Ihre Transkriptionsaufträge verfolgen und sie bearbeiten, wenn Slots verfügbar sind.

**Anmerkung**  
Amazon Transcribe kann Ihre Inhalte vorübergehend speichern, um die Qualität seiner Analysemodelle kontinuierlich zu verbessern. Weitere Informationen finden Sie in den [Häufig gestellten Fragen zu Amazon Transcribe](https://aws.amazon.com/transcribe/faqs/). Um die Löschung von Inhalten zu beantragen, die möglicherweise von gespeichert wurden Amazon Transcribe, eröffnen Sie einen Fall bei [Support](https://aws.amazon.com/contact-us/).

**Topics**
+ [Medienformate](#how-input-audio)
+ [Audiokanäle](#how-input-channels)
+ [Samplerate](#how-input-sample-rates)
+ [Output](#how-output)

## Medienformate
<a name="how-input-audio"></a>

Die unterstützten Medientypen unterscheiden sich zwischen Batch-Transkriptionen und Streaming-Transkriptionen, wobei verlustfreie Formate für beide empfohlen werden. Einzelheiten sind der folgenden Tabelle zu entnehmen:


|  | Stapel | Streaming | 
| --- | --- | --- | 
| Unterstützte Formate |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/de_de/transcribe/latest/dg/how-input.html)  |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/de_de/transcribe/latest/dg/how-input.html)  | 
| Empfohlene Formate |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/de_de/transcribe/latest/dg/how-input.html)  |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/de_de/transcribe/latest/dg/how-input.html)  | 

Die besten Ergebnisse erzielen Sie, wenn Sie ein verlustfreies Format wie FLAC oder WAV mit PCM 16-Bit-Kodierung verwenden. 

**Anmerkung**  
Streaming-Transkriptionen werden nicht in allen Sprachen unterstützt. Einzelheiten finden Sie in der Spalte „Dateneingabe“ in der [Tabelle „Unterstützte Sprachen“](supported-languages.md).

## Audiokanäle
<a name="how-input-channels"></a>

Amazon Transcribe unterstützt Einkanal- und Zweikanal-Medien. Medien mit mehr als zwei Kanälen werden derzeit nicht unterstützt.

Wenn Ihr Audiomaterial mehrere Sprecher auf einem Kanal enthält und Sie die einzelnen Sprecher in Ihrer Transkriptionsausgabe partitionieren und beschriften möchten, können Sie die [Sprecherpartitionierung (Diarisierung)](diarization.md) verwenden.

Wenn Ihr Audiomaterial Sprache auf zwei separaten Kanälen enthält, können Sie [die Kanalidentifikation](channel-id.md) verwenden, um jeden Kanal separat in Ihrem Transkript zu transkribieren.

Beide Optionen erzeugen eine einzige Transkriptionsdatei.

**Anmerkung**  
Wenn Sie die [Sprecherpartitionierung](diarization.md) oder die [Kanalidentifizierung](channel-id.md)nicht aktivieren, wird Ihr Transkripttext als ein durchgehender Abschnitt bereitgestellt.

## Samplerate
<a name="how-input-sample-rates"></a>

Bei Batch-Transkriptionsaufträgen können Sie eine Samplerate angeben, dieser Parameter ist jedoch optional. Wenn Sie dies in Ihrer Anfrage angeben, vergewissern Sie sich, dass der von Ihnen angegebene Wert mit der tatsächlichen Samplerate in Ihrem Audiomaterial übereinstimmt. Wenn Sie eine Samplerate angeben, die nicht zu Ihrem Audiomaterial passt, kann Ihr Auftrag fehlschlagen.

Bei Streaming-Transkriptionen müssen Sie in Ihrem Antrag eine Samplerate angeben. Wie bei Batch-Transkriptionsaufträgen müssen Sie sicherstellen, dass der von Ihnen angegebene Wert mit der tatsächlichen Samplerate in Ihrem Audio übereinstimmt.

Sampleraten für Low-Fidelity-Audio, wie z. B. Telefonaufnahmen, verwenden normalerweise 8.000 Hz. Amazon Transcribe Unterstützt Werte zwischen 16.000 Hz und 48.000 Hz für Hi-Fidelity-Audio.

## Output
<a name="how-output"></a>

Die Transkriptionsausgabe erfolgt im JSON-Format. Der erste Teil Ihrer Abschrift enthält das eigentliche Transkript in Absatzform, gefolgt von zusätzlichen Daten für jedes Wort und Satzzeichen. Die bereitgestellten Daten hängen von den Features ab, die Sie in Ihrer Anfrage angeben. Ihr Transkript enthält mindestens die Startzeit, die Endzeit und den Konfidenzwert für jedes Wort. Der [folgende Abschnitt](#how-it-works-output) zeigt ein Beispiel für die Ausgabe einer einfachen Transkriptionsanfrage, die keine zusätzlichen Optionen oder Features enthielt.

Alle **Batch-Transkripte werden in Buckets** gespeichert. Amazon S3 Sie können wählen, ob Sie Ihr Transkript in Ihrem eigenen Amazon S3 Bucket speichern oder einen sicheren Standard-Bucket Amazon Transcribe verwenden möchten. Weitere Informationen zum Erstellen und Verwenden von Amazon S3 -Buckets finden Sie unter [Arbeiten mit Buckets](https://docs.aws.amazon.com/AmazonS3/latest/userguide/creating-buckets-s3.html).

Wenn Sie möchten, dass Ihr Transkript in einem Amazon S3 Bucket gespeichert wird, den Sie besitzen, geben Sie die URI des Buckets in Ihrer Transkriptionsanfrage an. Stellen Sie sicher, dass Sie Amazon Transcribe Schreibberechtigungen für diesen Bucket erteilen, bevor Sie mit der Batch-Transkription beginnen. Wenn Sie Ihren eigenen Eimer angeben, verbleibt Ihr Transkript in diesem Bucket, bis Sie es entfernen. 

Wenn Sie keinen Amazon S3 Bucket angeben, Amazon Transcribe verwendet es einen sicheren, vom Service verwalteten Bucket und stellt Ihnen eine temporäre URI zur Verfügung, die Sie zum Herunterladen Ihres Transkripts verwenden können. Beachten Sie, dass temporäre URIs Dateien 15 Minuten lang gültig sind. Wenn Sie bei der Verwendung der angegebenen URI eine `AccessDenied`-Fehlermeldung erhalten, stellen Sie eine `GetTranscriptionJob`-Anfrage, um eine neue temporäre URI für Ihr Transkript zu erhalten.

Wenn Sie sich für einen Standard-Bucket entscheiden, wird Ihr Transkript gelöscht, wenn Ihr Auftrag abläuft (90 Tage). Wenn Sie Ihr Transkript nach diesem Ablaufdatum aufbewahren möchten, müssen Sie es herunterladen.

**Streaming-Transkripte** werden über dieselbe Methode zurückgegeben, die Sie für Ihren Stream verwenden.

**Tipp**  
Wenn Sie Ihre JSON-Ausgabe in ein turn-by-turn Transkript im Word-Format konvertieren möchten, sehen Sie sich dieses [GitHub Beispiel an (für Python3](https://github.com/aws-samples/amazon-transcribe-output-word-document)). Dieses Skript funktioniert mit Protokollen von Analyse nach Anrufen und Standard-Batch-Protokollen mit aktivierter Diarisierung.

### Beispielausgabe
<a name="how-it-works-output"></a>

Transkripte bieten eine vollständige Transkription in Absatzform, gefolgt von einer word-for-word Aufschlüsselung, die Daten für jedes Wort und jedes Satzzeichen enthält. Dazu gehören die Startzeit, die Endzeit, ein Vertrauenswert und ein Typ (`pronunciation` oder `punctuation`).

Das folgende Beispiel stammt von einem einfachen Batch-Transkriptionsauftrag, der keine [zusätzlichen Features](feature-matrix.md) enthielt. Mit jedem zusätzlichen Feature, die Sie auf Ihre Transkriptionsanfrage anwenden, erhalten Sie zusätzliche Daten in Ihrer Transkriptionsausgabedatei.

Einfache Batch-Transkripte enthalten zwei Hauptabschnitte:

1. `transcripts`: enthält das gesamte Transkript in einem Textblock.

1. `items`: Enthält Informationen zu jedem Wort und Satzzeichen aus dem `transcripts`-Abschnitt.

1. `audio_segments`: Ein Audiosegment ist ein bestimmter Teil einer Audioaufnahme, der ununterbrochen gesprochene Sprache mit minimalen Pausen oder Unterbrechungen enthält. Dieses Segment erfasst einen natürlichen Sprachfluss und wird `audio_segments` mit einer Start- und Endzeit aufgenommen. Das `items` Element innerhalb eines Audiosegments ist eine Folge von Kennungen, die jedem Element innerhalb des Segments entsprechen.

Jedes zusätzliche Feature, das Sie in Ihre Transkriptionsanfrage aufnehmen, führt zu zusätzlichen Informationen in Ihrem Transkript.

```
{
    "jobName": "my-first-transcription-job",
    "accountId": "111122223333",
    "results": {
        "transcripts": [
            {
                "transcript": "Welcome to Amazon Transcribe."
            }
        ],
        "items": [
            {
                "id": 0,
                "start_time": "0.64",
                "end_time": "1.09",
                "alternatives": [
                    {
                        "confidence": "1.0",
                        "content": "Welcome"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "id": 1,
                "start_time": "1.09",
                "end_time": "1.21",
                "alternatives": [
                    {
                        "confidence": "1.0",
                        "content": "to"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "id": 2,
                "start_time": "1.21",
                "end_time": "1.74",
                "alternatives": [
                    {
                        "confidence": "1.0",
                        "content": "Amazon"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "id": 3,
                "start_time": "1.74",
                "end_time": "2.56",
                "alternatives": [
                    {
                        "confidence": "1.0",
                        "content": "Transcribe"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "id": 4,
                "alternatives": [
                    {
                        "confidence": "0.0",
                        "content": "."
                    }
                ],
                "type": "punctuation"
            }
        ],
        "audio_segments": [
            {
                "id": 0,
                "transcript": "Welcome to Amazon Transcribe.",
                "start_time": "0.64",
                "end_time": "2.56",
                "items": [
                    0,
                    1,
                    2,
                    3,
                    4
                ]
            }
        ]
    },
    "status": "COMPLETED"
}
```

# Transkribieren von Zahlen und Interpunktion
<a name="how-numbers"></a>

Amazon Transcribe fügt allen unterstützten Sprachen automatisch Satzzeichen hinzu und schreibt Wörter entsprechend groß für Sprachen, die in ihren Schriftsystemen die Unterscheidung zwischen Groß- und Kleinschreibung verwenden.

In den meisten Sprachen werden die Zahlen in ihre Wortformen transkribiert. Bei Sprachen, die das Transkribieren von Zahlen unterstützen, werden Zahlen jedoch je nach Kontext, in dem sie verwendet werden, unterschiedlich Amazon Transcribe behandelt.

Zum Beispiel, wenn ein Sprecher sagt“*Treffen Sie mich am ersten Juni um 8:30 Uhr an der Main Street einhundert mit three-dollars-and-fifty Cents und Schokoriegeln one-point-five*“, das wird transkribiert als:
+ Sprachen mit Unterstützung für die Nummerntranskription: Meet me at 8:30 a.m. on June 1st at 100 Main Street with \$13.50 and 1.5 chocolate bars
+ Alle anderen Sprachen: Meet me at eight thirty a m on June first at one hundred Main Street with three dollars and fifty cents and one point five chocolate bars

Eine Liste der Sprachen, die das Transkribieren von Zahlen unterstützen, finden Sie unter. [Unterstützte Sprachen und sprachspezifische Funktionen](supported-languages.md)