

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Sprachmodule von Amazon Polly
<a name="voice-engines-polly"></a>

Amazon Polly verfügt über vier Sprachmodule, die den eingegebenen Text in lebensechte Sprache umwandeln. **Dazu gehören: **Generativ**, **Langform**, **Neural und Standard**.** Um eine Amazon Polly-Stimme zu verwenden, wählen Sie eine Engine und einen Sprachsynthese-API-Vorgang aus. Geben Sie dann den Eingangstext ein, den die Engine synthetisieren soll, und wählen Sie ein Audioausgabeformat aus. Anhand dieser Eingaben synthetisiert Amazon Polly den bereitgestellten Text zu einem hochwertigen Sprach-Audiostream. 

Die folgenden Abschnitte enthalten Einzelheiten zu den von Amazon Polly angebotenen Sprachmodulen. 

**Topics**
+ [Generative Stimmen](generative-voices.md)
+ [Stimmen in langer Form](long-form-voices.md)
+ [Neuronale Stimmen](neural-voices.md)
+ [Standardstimmen](standard-voices.md)
+ [Auswahl einer Sprachengine](using-voices.md)

# Generative Stimmen
<a name="generative-voices"></a>

Die **generative** Engine text-to-speech (TTS) von Amazon Polly bietet die menschenähnlichsten, emotional engagiertesten und anpassungsfähigsten Konversationsstimmen, die für die Nutzung über die Amazon Polly Polly-Konsole verfügbar sind.

Die **Generative Engine** ist das bisher größte Amazon Polly TTS-Modell. Sie verwendet einen Transformator mit Milliarden Parametern, der Rohtext in Sprachcodes umwandelt, gefolgt von einem auf Faltung basierenden Decoder, der diese Sprachcodes schrittweise und streamfähig in Wellenformen umwandelt. Diese Methode verdeutlicht, welche Fähigkeiten Large Language Models (LLMs) häufig zeigen, wenn sie mit immer größeren Mengen öffentlich verfügbarer und urheberrechtlich geschützter Daten trainiert werden, die eine Vielzahl von Stimmen, Sprachen und Stilen beinhalten.

Die generative Engine erzeugt synthetische Sprache, die emotional engagiert, durchsetzungsfähig und sehr umgangssprachlich ist, und zwar auf eine Weise, die der menschlichen Stimme bemerkenswert ähnlich ist. Sie können diese Stimmen als sachkundigen Kundenassistenten, als virtuellen Trainer oder als Werbetreibender mit einer fast menschlichen synthetischen Sprache verwenden.

**Anmerkung**  
Die state-of-the-art Technologie, die diesen Stimmen zugrunde liegt, fällt in das Paradigma der generativen KI für Sprach- und Stimmmodellierung. Ein Nebeneffekt der Technologie besteht darin, dass jegliche Aktualisierung der Trainingsdaten und des Modells zu geringfügigen Abweichungen im Klang der Stimmen führen kann, selbst wenn sich ihre Gesamtqualität durch Modellaktualisierungen verbessert. Dies könnte sich auf Anwendungsfälle auswirken, bei denen verschiedene Inhaltsteile über einen langen Zeitraum synthetisiert wurden — beispielsweise eine Podcast-Saison.

## Verfügbare generative Stimmen
<a name="generative-voicelist"></a>

Amazon Polly bietet derzeit 43 Stimmen in einer generativen Variante an. 


|  | Sprache | Sprachcode | Name/ID | Gender | 
| --- | --- | --- | --- | --- | 
| 1 |  **Englisch (australisch)**  | en-AU |  Olivia  |  Weiblich  | 
| 2 |  **Englisch (britisch)**  | en-GB |  Amy Brian  |  Weiblich Männlich  | 
| 3 |  **Englisch (indisch)**  | en-IN |  Kajal  |  Weiblich  | 
| 4 |  **Englisch (Irland)**  | en-IE |  Niamh  |  Weiblich  | 
| 5 |  **Englisch (Neuseeland)**  | en-NZ |  Aria  |  Weiblich  | 
| 6 |  **Englisch (Singapurisch)**  | en-SG |  Jasmin  |  Weiblich  | 
| 7 |  **Englisch (Südafrikanisch)**  | en-ZA |  Ayanda  |  Weiblich  | 
| 8 |  **Englisch (amerikanisch)**  | en-US |  Danielle Joanna Matthew Ruth Salli Stephen Tiffany  |  Weiblich Weiblich Männlich Weiblich Weiblich Männlich Weiblich  | 
| 9 |  **Niederländisch (Belgien)**  | nl-BE |  Lisa  |  Weiblich  | 
| 10 |  **Niederländisch (Niederlande)**  | nl-NL |  Laura  |  Weiblich  | 
| 11 |  **Französisch (Belgisch)**  | fr-BE |  Isabelle  |  Weiblich  | 
| 12 |  **Kanadisches Französisch**  | fr-CA |  Gabrielle Liam  |  Weiblich Männlich  | 
| 13 |  **Französisch (Frankreich)**  | fr-FR |  Ambre Céline Florian Léa Remi  |  Weiblich Weiblich Männlich Weiblich Männlich  | 
| 14 |  **Deutsch (Österreich)**  | de-AT |  Hannah  |  Weiblich  | 
| 15 |  **Deutsch (Deutschland)**  | de-DE |  Daniel Lennart Vicki  |  Männlich Männlich Weiblich  | 
| 16 |  **Deutsch (Schweizerisch)**  | de-CH |  Sabrina  |  Weiblich  | 
| 17 |  **Italienisch (Italien)**  | it-IT |  Beatrice Bianca Lorenzo  |  Weiblich Weiblich Männlich  | 
| 18 |  **Koreanisch (Korea)**  | ko-KR |  Seoyeon  |  Weiblich  | 
| 19 |  **Polnisch (Polen)**  | pl-PL |  Ewa Ola  |  Weiblich Weiblich  | 
| 20 |  **Portugiesisch (brasilianisch)**  | pt-BR |  Camila  |  Weiblich  | 
| 21 |  **Spanisch (Mexikanisch)**  | es-MX |  Andrés Mia  |  Männlich Weiblich  | 
| 22 |  **Spanisch (Spanien)**  | es-ES |  Lucia Sergio  |  Weiblich Männlich  | 
| 23 |  **Spanisch (USA)**  | es-US |  Lupe Pedro  |  Weiblich Männlich  | 

**Anmerkung**  
Die Kosten für Generative Stimmen sind auf der [Preisinformationsseite von Amazon Polly](https://aws.amazon.com/polly/pricing/) angegeben.

## Kompatibilität mit Funktionen und Regionen
<a name="generative-regions"></a>

Generative Stimmen von Amazon Polly sind in den folgenden Regionen verfügbar:
+ USA Ost (Nord-Virginia): us-east-1
+ Europa (Frankfurt): eu-central-1
+ USA West (Oregon): us-west-2
+ Asien-Pazifik (Tokio): ap-northeast-1
+ Asien-Pazifik (Seoul): ap-northeast-2
+ Asien-Pazifik (Singapur): ap-southeast-1
+ Europa (London): eu-west-2
+ Kanada (Zentral): ca-central-1
+ Andere Regionen sind nicht verfügbar

**Die folgenden Funktionen werden für generative Stimmen unterstützt:**
+ Die bidirektionale Streaming-API wird jetzt in der Generative Engine angeboten und ermöglicht das gleichzeitige Streamen von Eingabe und Ausgabe. Diese API ist in den folgenden AWS Regionen verfügbar: USA Ost (Nord-Virginia), Europa (Frankfurt), USA West (Oregon) und Asien-Pazifik (Singapur). Besuchen Sie die [Dokumentation](https://docs.aws.amazon.com/polly/latest/dg/API_StartSpeechSynthesisStream.html), um mehr darüber zu erfahren, wie Sie sie verwenden können.
+ Echtzeit- und asynchrone Sprachsyntheseoperationen. 
+ Der Sprechstil von Nachrichtensendern wird von der **Generative** Engine nicht unterstützt. 
+ Viele (aber nicht alle) SSML-Tags werden von Amazon Polly unterstützt. [Weitere Informationen zu von NTTS unterstützten SSML-Tags finden Sie unter Unterstützte SSML-Tags](https://docs.aws.amazon.com/polly/latest/dg/supportedtags.html) 
+ Wie bei Standardstimmungen können Sie aus verschiedenen Samplingraten wählen, um die Bandbreite und Audioqualität für Ihre Anwendung zu optimieren. Gültige Samplingraten für Standard- und neuronale Stimmen sind 8 kHz, 16 kHz, 22 kHz oder 24 kHz. Der Standardwert für Standardstimmen ist 22 kHz. Die Standardeinstellung für generative Stimmen ist 24 kHz. Amazon Polly unterstützt MP3 OGG (Vorbis) und Roh-PCM-Audiostreamformate.

*Support für die Generierung von Sprachmarken ist derzeit nicht verfügbar.*

**Anmerkung**  
Derzeit unterstützen die Regionen Europa (London) und Kanada (Zentral) nur die folgenden generativen Stimmen: Tiffany (en-US), Amy (en-GB), Brian (en-GB), Florian (fr-FR), Ambre (fr-FR), Lorenzo (it-IT), Beatrice (it-IT), Jasmine (en-SG), Aria (en-NZ), Sabrina (de-CH), Hannah (de-AT), Niannah (de-AT), amh (de-DE), Camila (pt-BR), Lisa (nl-BE) und Seoyeon (ko-KR)

**Anmerkung**  
Im unwahrscheinlichen Fall einer Modellhalluzination (und aufgrund des Modellverhaltens der Generative Engine, die Sprache Zeichen für Zeichen wiederzugeben) ist ein erzwungener Not-Aus-Mechanismus vorhanden. Der eingebaute Mechanismus verhindert, dass das Modell Sprache weiter wiedergibt. Dieses Sicherheitsmerkmal basiert auf einer Datenanalyse, bei der das Modell halluzinieren kann, normalerweise am Ende des Satzes.  
Es kann Fälle geben, in denen das Modell denkt, es würde halluzinieren, und dann während eines Generationsschritts ein Wort herausschneiden und so die Hälfte des Wortes wiedergeben. Dies könnte möglicherweise zu unangemessenen Ergebnissen führen.

# Stimmen in langer Form
<a name="long-form-voices"></a>

Amazon Polly verfügt über eine **Long-Form-Engine**, die menschenähnliche, ausdrucksstarke und emotional versierte Stimmen erzeugt. Langform-Stimmen sind so konzipiert, dass sie die Aufmerksamkeit der Zuhörer auf längere Inhalte wie Nachrichtenartikel, Schulungsmaterial oder Marketingvideos lenken.

Langform-Stimmen von Amazon Polly wurden mit einer hochmodernen Deep-Learning-TTS-Technologie entwickelt. Das Modell lernt, Phoneme, Prosodie, Intonation und andere phonetische und akustische Aspekte der menschlichen Sprache nachzubilden, was zu einer sehr natürlichen Sprachausgabe führt.

Die Langform-Engine verwendet Texteinbettungen, um die Bedeutung eines Textes zu interpretieren. Mithilfe von Texteinbettungen kann die Longform-Engine die richtige Betonung, die richtigen Pausen und den richtigen Ton für eine natürliche Stimme erzeugen. Das Ergebnis ist eine Stimme, die die gesamte Bandbreite der emotionalen Elemente der menschlichen Kommunikation in sich vereint. Dazu gehört die Nachahmung überraschender Dialoge oder die Differenzierung von Erzählungen. Zusammen entsteht so ein erstklassiges Sprachprodukt, das wie ein lebender Mensch klingt.

**Anmerkung**  
Die state-of-the-art Technologie, die diesen Stimmen zugrunde liegt, fällt unter das Paradigma der generativen KI für Sprach- und Stimmmodellierung. Ein Nebeneffekt der Technologie besteht darin, dass jegliche Aktualisierung der Trainingsdaten und des Modells zu geringfügigen Abweichungen im Klang der Stimmen führen kann, selbst wenn sich ihre Gesamtqualität durch Modellaktualisierungen verbessert. Dies könnte sich auf Anwendungsfälle auswirken, bei denen verschiedene Inhaltsteile über einen langen Zeitraum synthetisiert wurden — beispielsweise eine Podcast-Saison.

## Verfügbare Stimmen in Langform
<a name="long-form-voicelist"></a>

Amazon Polly bietet derzeit vier Langform-Stimmen en-US und zwei es-ES an. In beiden Sprachen sind Frauen- und Männerstimmen verfügbar. Die englischen Langformstimmen Daniel, Gregory und Ruth sind auch in einer NTTS-Variante für Konversationen erhältlich. 


|  | Sprache | Sprachcode | Name/ID | Gender | 
| --- | --- | --- | --- | --- | 
| 1 |  **Englisch (amerikanisch)**  | en-US |  Danielle Gregor Ruth Patrick  |  Weiblich Männlich Weiblich Männlich  | 
| 2 |  **Spanisch (Spanien)**  | es-ES |  Alba Raul  |  Weiblich Männlich  | 

## Kompatibilität mit Funktionen und Regionen
<a name="long-form-regions"></a>

Langform-Stimmen von Amazon Polly sind in den folgenden Regionen erhältlich:
+ USA Ost (Nord-Virginia): us-east-1
+ Andere Regionen sind nicht verfügbar

**Die Amazon Polly Long-Form-Engine unterstützt die folgenden Funktionen:**
+ Echtzeit- und asynchrone Sprachsyntheseoperationen. 
+ Alle [Sprachzeichen](https://docs.aws.amazon.com/polly/latest/dg/speechmarks.html). 
+ Viele (aber nicht alle) SSML-Tags werden von Amazon Polly unterstützt. [Weitere Informationen zu von NTTS unterstützten SSML-Tags finden Sie unter Unterstützte SSML-Tags](https://docs.aws.amazon.com/polly/latest/dg/supportedtags.html) 
+ Wie bei Standardstimmungen können Sie aus verschiedenen Samplingraten wählen, um die Bandbreite und Audioqualität für Ihre Anwendung zu optimieren. Gültige Abtastraten für Standard-, Langform- und neuronale Stimmen sind: 8 kHz, 16 kHz, 22 kHz oder 24 kHz. Der Standardwert für Standardstimmen ist 22 kHz. Die Standardeinstellung für Langform- und neuronale Stimmen ist 24 kHz. Amazon Polly unterstützt MP3 OGG (Vorbis) und Roh-PCM-Audiostreamformate.

**Anmerkung**  
Die Kosten für Langform-Stimmen sind auf der [Preisinformationsseite von Amazon Polly](https://aws.amazon.com/polly/pricing/) angegeben.

# Neuronale Stimmen
<a name="neural-voices"></a>

Amazon Polly verfügt über eine **neuronale Engine text-to-speech (NTTS)**, die Stimmen in noch höherer Qualität erzeugen kann als ihre Standardstimmen. Standard-TTS-Stimmen verwenden eine verkettete Synthese. Die Standard-Engine verkettet Phoneme aufgezeichneter Sprache und erzeugt so eine sehr natürlich klingende synthetisierte Sprache. Die unvermeidlichen Variationen der Sprache und die Techniken, die zum Segmentieren der Wellenformen verwendet werden, beschränken jedoch die Qualität der Sprache. Die Amazon Polly NTTS-Engine verwendet keine standardmäßige verkettete Synthese, um Sprache zu erzeugen. Es besteht aus zwei Teilen: 
+ *Ein neuronales Netzwerk — das eine Folge von Phonemen (die grundlegendsten Spracheinheiten) in eine Folge von Spektrogrammen umwandelt.* (Spektogramme sind Momentaufnahmen der Energieniveaus in verschiedenen Frequenzbändern.)
+ Ein Vocoder — der Spektrogramme in ein nahezu kontinuierliches Audiosignal umwandelt.

Die erste Komponente des neuronalen TTS-Systems ist ein Modell. sequence-to-sequence Dieses Modell erstellt seine Ergebnisse nicht nur aus der entsprechenden Eingabe, sondern berücksichtigt auch, wie die Sequenz der Elemente der Eingabe zusammenarbeiten. Das Modell wählt die ausgegebenen Spektrogramme so aus, dass ihre Frequenzbänder akustische Merkmale betonen, die das menschliche Gehirn bei der Sprachverarbeitung verwendet.

Die Ausgabe dieses Modells wird dann an einen neuronalen Vocoder übergeben. Dadurch werden die Spektrogramme in Sprach-Wellenformen konvertiert. Wenn dieser Ansatz mit den großen Datensätzen trainiert wird, die für den Aufbau von Systemen zur verketteten Synthese für allgemeine Zwecke verwendet werden, wird dieser sequence-to-sequence Ansatz zu qualitativ hochwertigeren und natürlicheren Stimmen führen.

## Verfügbare neuronale Stimmen
<a name="neural-voicelist"></a>

Neuronale Stimmen sind in 36 Sprachen und Sprachvarianten verfügbar. In der folgenden Tabelle werden die Stimmen aufgelistet.


|   | Sprache und Sprachvarianten | Sprachcode | Name/ID | Gender | 
| --- | --- | --- | --- | --- | 
|  1  |   **Arabisch (Golf)**   |  ar-AE  |  Hala Zayd  |  Weiblich Männlich  | 
|  2  |   **Belgisches Niederländisch (Flämisch)**   |  nl-BE  |  Lisa  |  Weiblich  | 
|  3  |   **katalanisch**   |  ca-ES  |  Arlet  |  Weiblich  | 
|  4  |   **Tschechisch**   |  cs-CZ  |  Jitka  |  Weiblich  | 
|  5  |   **Chinesisch (Kantonesisch)**   |  Yue-CN  |  Huujin  |  Weiblich  | 
|  6  |   **Chinesisch (Mandarin)**   |  cmn-CN  |  Zhiyu  |  Weiblich  | 
|  7  |   **Dänisch**   |  da-DK  |  Sofie  |  Weiblich  | 
|  8  |   **Niederländisch**   |  nl-NL  |  Laura  |  Weiblich  | 
|  9  |   **Englisch (australisch)**   |  en-AU  |  Olivia  |  Weiblich  | 
|  10  |   **Englisch (britisch)**   |  en-GB  |  Amy\$1 Emma Brian Artur  |  Weiblich Weiblich Männlich Männlich  | 
|  11  |   **Englisch (indisch)**   |  en-IN  |  Kajal  |  Weiblich  | 
|  12  |   **Englisch (Irisch)**   |  en-IE  |  Niamh  |  Weiblich  | 
|  13  |   **Englisch (Neuseeland)**   |  en-NZ  |  Aria  |  Weiblich  | 
|  14  |   **Englisch (Singapurisch)**   |  en-SG  |  Jasmin  |  Weiblich  | 
|  15  |  Englisch (Südafrikanisch)  |  en-ZA  |  Ayanda  |  Weiblich  | 
|  16  |   **Englisch (amerikanisch)**   |  en-US  |  Danielle Gregor Ivy Joanna\$1 Kendra Kimberly Salli Joey Justin Kevin Matthew\$1 Ruth Stephen  |  Weiblich Männlich Weiblich (Kind) Weiblich Weiblich Weiblich Weiblich Männlich Männlich (Kind) Männlich (Kind) Männlich Weiblich Männlich  | 
|  17  |   **Finnisch**   |  fi-FI  |  Suvi  |  Weiblich  | 
|  18  |   **Französisch (Belgisch)**   |  fr-BE  |  Isabelle  |  Weiblich  | 
|  19  |   **Kanadisches Französisch**   |  fr-CA  |  Gabrielle Liam  |  Weiblich Männlich  | 
|  20  |   **Französisch**   |  fr-FR  |  Léa Remi  |  Weiblich Männlich  | 
|  21  |   **Deutsch**   |  de-DE  |  Vicki Daniel  |  Weiblich Männlich  | 
|  22  |   **Deutsch (Österreichisch)**   |  de-AT  |  Hannah  |  Weiblich  | 
|  23  |   **Deutsch (Schweizerisch)**   |  de-CH  |  Sabrina  |  Weiblich  | 
|  24  |   **Hindi**   |  hi-IN  |  Kajal  |  Weiblich  | 
|  25  |   **Italienisch**   |  it-IT  |  Bianca Adriano  |  Weiblich Männlich  | 
|  26  |   **Japanisch**   |  ja-JP  |  Takumi Kazuha Tomoko  |  Männlich Weiblich Weiblich  | 
|  27  |   **Koreanisch**   |  ko-KR  |  Seoyeon Jihye  |  Weiblich Weiblich  | 
|  28  |   **Norwegisch**   |  nb-NO  |  Ida  |  Weiblich  | 
|  29  |   **Polnisch**   |  pl-PL  |  Ola  |  Weiblich  | 
|  30  |   **Portugiesisch (brasilianisch)**   |  pt-BR  |  Camila Vitória/Vitoria Thiago  |  Weiblich  Weiblich Männlich  | 
|  31  |   **Portugiesisch (europäisch)**   |  pt-PT  |  Inês/Ines  |  Weiblich   | 
|  32  |   **Spanisch (Spanien)**   |  es-ES  |  Lucia Sergio  |  Weiblich  Männlich  | 
|  33  |   **Spanisch (Mexikanisch)**   |  es-MX  |  Mia Andrés  |  Weiblich Männlich  | 
|  34  |   **Spanisch (USA)**   |  es-US  |  Lupe\$1 Pedro  |  Weiblich Männlich  | 
|  35  |   **Schwedisch**   |  sv-SE  |  Elin  |  Weiblich  | 
|  36  |   **Türkisch**   |  tr-TR  |  Burcu  |  Weiblich  | 

\$1Die Stimmen von Amy, Joanna, Lupe und Matthew können im Newscaster-Sprechstil verwendet werden. Weitere Informationen finden Sie unter [Die Stimme des Nachrichtensprechers anwenden](newscaster-voices.md).

## Kompatibilität mit Funktionen und Regionen
<a name="ntts-regions"></a>

Neuronale Stimmen sind nicht in allen AWS Regionen verfügbar und unterstützen auch nicht alle Funktionen von Amazon Polly. 

Neuronale Stimmen werden in den folgenden Regionen unterstützt: 
+ USA Ost (Nord-Virginia): us-east-1
+ USA West (Oregon): us-west-2
+ Afrika (Kapstadt): af-south-1
+ Asien-Pazifik (Tokio): ap-northeast-1
+ Asien-Pazifik (Seoul): ap-northeast-2
+ Asien-Pazifik (Osaka): ap-northeast-3
+ Asien-Pazifik (Mumbai): ap-south-1
+ Asien-Pazifik (Singapur): ap-southeast-1
+ Asien-Pazifik (Sydney): ap-southeast-2
+ Asien-Pazifik (Malaysia): ap-southeast-5
+ Kanada (Zentral): ca-central-1
+ Europa (Frankfurt): eu-central-1
+ Europa (Irland): eu-west-1
+ Europa (London): eu-west-2
+ Europa (Paris): eu-west-3
+ Europa (Spanien): eu-south-2
+ Europa (Zürich): eu-central-2
+ AWS GovCloud (US-West): -1 us-gov-west

Endpunkte und Protokolle für diese Regionen sind identisch mit denen für Standardstimmen. Weitere Informationen finden Sie unter [Amazon Polly Polly-Endpunkte und](https://docs.aws.amazon.com/general/latest/gr/pol.html) Kontingente.

Die folgenden Funktionen werden für neuronale Stimmen unterstützt:
+ Echtzeit- und asynchrone Sprachsyntheseoperationen.
+ Sprechstil von Newscaster. Weitere Informationen zu den Sprechstilen finden Sie unter. [Die Stimme des Nachrichtensprechers anwenden](newscaster-voices.md)
+ Alle Sprachzeichen. 
+  Viele (aber nicht alle) SSML-Tags, die von Amazon Polly unterstützt werden. Weitere Informationen zu von NTTS unterstützten SSML-Tags finden Sie unter Unterstützte Tags. 

 Wie bei Standardstimmungen können Sie aus verschiedenen Samplingraten wählen, um die Bandbreite und Audioqualität für Ihre Anwendung zu optimieren. Gültige Samplingraten für Standard- und neuronale Stimmen sind 8 kHz, 16 kHz, 22 kHz oder 24 kHz. Der Standardwert für Standardstimmen ist 22 kHz. Die Standardeinstellung für neuronale Stimmen ist 24 kHz. Amazon Polly unterstützt MP3 OGG (Vorbis) und Roh-PCM-Audiostreamformate. 

# Standardstimmen
<a name="standard-voices"></a>

Amazon Polly verfügt über eine **Standard-Engine**, die die verkettete Synthese verwendet. Die Standard-Engine verkettet Phoneme aufgezeichneter Sprache und erzeugt so eine sehr natürlich klingende synthetisierte Sprache.

## Verfügbare Standardstimmen
<a name="standard-voicelist"></a>

Amazon Polly bietet derzeit 40 weibliche und 20 männliche Standardstimmen in 29 Sprach- und Sprachvarianten an. 


|  | Sprache | Sprachcode | Name/ID | Gender | 
| --- | --- | --- | --- | --- | 
| 1 |  **Arabisch**  | arb |  Zeina  |  Weiblich  | 
| 2 |  **Chinesisch (Mandarin)**  | cmn-CN |  Zhiyu  |  Weiblich  | 
| 3 |  **Dänisch**  | da-DK |  Naja Mads  |  Weiblich Männlich  | 
| 4 |  **Niederländisch**  | nl-NL |  Lotte Ruben  |  Weiblich Männlich  | 
| 5 |  **Englisch (australisch)**  | en-AU |  Nicole Russell  |  Weiblich Männlich  | 
| 6 |  **Englisch (britisch)**  | en-GB |  Amy Emma Brian  |  Weiblich Weiblich Männlich  | 
| 7 |  **Englisch (indisch)**  | en-IN |  Aditi Raveena  |  Weiblich Weiblich  | 
| 8 |  **Englisch (amerikanisch)**  | en-US |  Ivy Joanna Kendra Kimberly Salli Joey Kevin  |  Weiblich Weiblich Weiblich Weiblich Weiblich Männlich Männlich  | 
| 9 |  **Englisch (walisisch)**  | en-GB-WLS |  Geraint  |  Männlich  | 
| 10 |  **Französisch**  | fr-FR |  Céline/Celine Léa Mathieu  |  Weiblich Weiblich Männlich  | 
| 11 |  **Kanadisches Französisch**  | fr-CA |  Chantal  |  Weiblich  | 
| 12 |  **Deutsch**  | de-DE |  Marlene Vicki Hans  |  Weiblich Weiblich Männlich  | 
| 13 |  **Hindi**  | hi-IN |  Aditi  |  Weiblich  | 
| 14 |  **Isländisch**  | is-IS |  Dóra/Dora Karl  |  Weiblich Männlich  | 
| 15 |  **Italienisch**  | it-IT |  Carla Bianca Giorgio  |  Weiblich Weiblich Männlich  | 
| 16 |  **Japanisch**  | ja-JP |  Mizuki Takumi  |  Weiblich Männlich  | 
| 17 |  **Koreanisch**  | ko-KR |  Seoyeon  |  Weiblich  | 
| 18 |  **Norwegisch**  | nb-NO |  Liv  |  Weiblich  | 
| 19 |  **Polnisch**  | pl-PL |  Ewa Maja Jacek . Jan.  |  Weiblich Weiblich Männlich Männlich  | 
| 20 |  **Portugiesisch (brasilianisch)**  | pt-BR |  Camila Vitória/Vitoria Ricardo  |  Weiblich Weiblich Männlich  | 
| 21 |  **Portugiesisch (europäisch)**  | pt-PT |  Inês/Ines Cristiano  |  Weiblich Männlich  | 
| 22 |  **Rumänisch**  | ro-RO |  Carmen  |  Weiblich  | 
| 23 |  **Russisch**  | ru-RU |  Tatyana Maxim  |  Weiblich Männlich  | 
| 24 |  **Spanisch (Spanien)**  | es-ES |  Conchita Lucia Enrique  |  Weiblich Weiblich Männlich  | 
| 25 |  **Spanisch (Mexikanisch)**  | es-MX |  Mia  |  Weiblich  | 
| 26 |  **Spanisch (USA)**  | es-US |  Lupe Penélope/Penelope Miguel  |  Weiblich Weiblich Männlich  | 
| 27 |  **Schwedisch**  | sv-SE |  Astrid  |  Weiblich  | 
| 28 |  **Türkisch**  | tr-TR |  Filiz  |  Männlich  | 
| 29 |  **Walisisch**  | cy-GB |  Gwyneth  |  Weiblich  | 

## Kompatibilität mit Funktionen und Regionen
<a name="standard-regions"></a>

Standardstimmen von Amazon Polly sind in den folgenden Amazon Polly Polly-Regionen verfügbar:
+ USA Ost (Nord-Virginia): us-east-1
+ USA Ost (Ohio): us-east-2
+ USA West (Nordkalifornien): us-west-1
+ USA West (Oregon): us-west-2
+ Afrika (Kapstadt): af-south-1
+ Asien-Pazifik (Hongkong): ap-east-1
+ Asien-Pazifik (Tokio): ap-northeast-1
+ Asien-Pazifik (Seoul): ap-northeast-2
+ Asien-Pazifik (Osaka): ap-northeast-3
+ Asien-Pazifik (Mumbai): ap-south-1
+ Asien-Pazifik (Singapur): ap-southeast-1
+ Asien-Pazifik (Sydney): ap-southeast-2
+ Asien-Pazifik (Malaysia): ap-southeast-5
+ China (Ningxia): cn-northwest-1;
+ Kanada (Zentral): ca-central-1
+ Europa (Frankfurt): eu-central-1
+ Europa (Irland): eu-west-1
+ Europa (London): eu-west-2
+ Europa (Paris): eu-west-3
+ Europa (Spanien): eu-south-2
+ Europa (Stockholm): eu-north-1
+ Naher Osten (Bahrain): me-south-1
+ Südamerika (São Paulo): sa-east-1
+ AWS GovCloud (US-West): -1 us-gov-west

Die Endpunkte und Protokolle für diese Regionen sind identisch mit denen, die für neuronale Stimmen verwendet werden. Weitere Informationen finden Sie unter [Amazon Polly Polly-Endpunkte und](https://docs.aws.amazon.com/general/latest/gr/pol.html) Kontingente.

**Die Amazon Polly Polly-Standard-Engine unterstützt die folgenden Funktionen (TBD):**
+ Echtzeit- und asynchrone Sprachsyntheseoperationen.
+ Alle [Sprachzeichen](https://docs.aws.amazon.com/polly/latest/dg/speechmarks.html).
+ Viele (aber nicht alle) SSML-Tags werden von Amazon Polly unterstützt. [Weitere Informationen zu von NTTS unterstützten SSML-Tags finden Sie unter Unterstützte SSML-Tags.](https://docs.aws.amazon.com/polly/latest/dg/supportedtags.html) 
+ Sie können aus verschiedenen Abtastraten wählen, um die Bandbreite und Audioqualität für Ihre Anwendung zu optimieren. Die Standard-Abtastraten für Standardstimmen sind 22 kHz. Amazon Polly unterstützt MP3 OGG (Vorbis) und Roh-PCM-Audiostreamformate.

**Anmerkung**  
Die Standardkosten für Voices sind auf der [Seite mit den Preisinformationen von Amazon Polly](https://aws.amazon.com/polly/pricing/) angegeben.

# Auswahl einer Sprachengine
<a name="using-voices"></a>

Sie können über die Amazon Polly Polly-Konsole oder auf Amazon Polly-Stimmen zugreifen. AWS CLI

**Um eine Sprachengine auf der Konsole auszuwählen**

1. Öffnen Sie die Amazon Polly Polly-Konsole unter [https://console.aws.amazon.com/polly/](https://console.aws.amazon.com/polly/).

1. Wählen Sie in der Amazon Polly Polly-Konsole die gewünschte Sprach-Engine aus.

1. Wählen Sie die gewünschte Stimme aus dem Drop-down-Menü „Stimme“ aus.

1. Generieren Sie TTS-Audio mit Text Ihrer Wahl.

Um eine Sprachengine in der auszuwählen AWS CLI, geben Sie die Operationen `Engine` und `VoiceId` in den `StartSpeechSynthesisTask` API-Operationen `SyntheszieSpeech` oder an. Einige Beispiele finden Sie in den [Schnellstart-Codebeispielen und den [Python-Beispielen](https://docs.aws.amazon.com/polly/latest/dg/get-started-what-next.html)](https://docs.aws.amazon.com/polly/latest/dg/get-started-what-next.html).