

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 生成式語音
<a name="generative-voices"></a>

Amazon Polly 的**生成文字**text-to-speech(TTS) 引擎提供最人性化、情感參與和適應性的對話語音，可透過 Amazon Polly 主控台使用。

**生成式引擎**是迄今為止最大的 Amazon Polly TTS 模型。它會部署十億參數轉換器，將原始文字轉換為語音碼，然後部署以卷積為基礎的解碼器，以增量、可串流的方式將這些語音碼轉換為波形。此方法顯示大型語言模型 (LLMs) 在訓練越來越多的公開可用和專屬資料時廣泛報告的緊急功能，包括各種語音、語言和風格。

生成式引擎會建立合成語音，以與人類語音非常相似的方式，以情感參與、自信和高度共通。您可以使用這些語音做為知識淵博的客戶助理、虛擬訓練師，或具有近乎人類合成語音的廣告商。

**注意**  
這些語音的state-of-the-art技術位於生成式 AI 語言和語音建模的範式中。技術的副作用是，訓練資料和模型的任何更新都可能導致聲音聲音的音量稍微變化，即使整體品質隨著模型更新而改善。這可能會影響長時間合成不同內容組件的使用案例，例如播客季節。

## 可用的生成語音
<a name="generative-voicelist"></a>

Amazon Polly 目前在生成變體中提供 43 個語音。


|  | Language | 語言代碼 | 名稱/ID | Gender | 
| --- | --- | --- | --- | --- | 
| 1 |  **英文 (澳洲)**  | en-AU |  奧利維亞  |  女性  | 
| 2 |  **英文 (英國)**  | en-GB |  Amy Brian  |  女性 男性  | 
| 3 |  **英文 (印度)**  | en-IN |  卡加爾文  |  女性  | 
| 4 |  **英文 （愛爾蘭）**  | en-IE |  Niamh  |  女性  | 
| 5 |  **英文 （紐西蘭）**  | en-NZ |  Aria  |  女性  | 
| 6 |  **英文 （新加坡）**  | en-SG |  茉莉花  |  女性  | 
| 7 |  **英文 （南非）**  | en-ZA |  Ayanda  |  女性  | 
| 8 |  **英文 (美國)**  | zh-TW |  丹尼爾文 Joanna Matthew Ruth Salli Stephen Tiffany  |  女性 女性 男性 女性 女性 男性 女性  | 
| 9 |  **荷蘭文 （比利時）**  | nl-BE |  Lisa  |  女性  | 
| 10 |  **荷蘭文 （荷蘭）**  | nl-NL |  月亮  |  女性  | 
| 11 |  **法文 （比利時）**  | fr-BE |  伊沙貝爾  |  女性  | 
| 12 |  **法文 (加拿大)**  | fr-CA |  加布里爾 Liam  |  女性 男性  | 
| 13 |  **法文 （法國）**  | fr-FR |  Ambre Céline 佛羅里安 Léa Rémi  |  女性 女性 男性 女性 男性  | 
| 14 |  **德文 （奧地利）**  | de-AT |  漢納  |  女性  | 
| 15 |  **德文 （德國）**  | de-DE |  丹尼爾 利納特 Vicki  |  男性 男性 女性  | 
| 16 |  **德文 （瑞士）**  | de-CH |  薩布林納  |  女性  | 
| 17 |  **義大利文 （義大利）**  | it-IT |  披頭四 Bianca Lorenzo  |  女性 女性 男性  | 
| 18 |  **韓文 （韓國）**  | ko-KR |  Seoyeon  |  女性  | 
| 19 |  **波蘭文 （波蘭）**  | pl-PL |  Ewa 奧拉  |  女性 女性  | 
| 20 |  **葡萄牙文 (巴西)**  | pt-BR |  Camila  |  女性  | 
| 21 |  **西班牙文 （墨西哥）**  | es-MX |  安德列 Mía  |  男性 女性  | 
| 22 |  **西班牙文 （西班牙）**  | es-ES |  Lucia Sergio  |  女性 男性  | 
| 23 |  **西班牙文 （美國）**  | es-US |  Lupe Pedro  |  女性 男性  | 

**注意**  
生成語音成本會在 [Amazon Polly 定價資訊頁面上](https://aws.amazon.com/polly/pricing/)指定。

## 功能和區域相容性
<a name="generative-regions"></a>

Amazon Polly 生成語音可在下列區域使用：
+ 美國東部 (維吉尼亞北部)：us-east-1
+ 歐洲 （法蘭克福）：eu-central-1
+ 美國西部 (奧勒岡)：us-west-2
+ 亞太區域 （東京）：ap-northeast-1
+ 亞太區域 （首爾）：ap-northeast-2
+ 亞太區域 （新加坡）：ap-southeast-1
+ 歐洲 （倫敦）：eu-west-2
+ 加拿大 （中部）：ca-central-1
+ 其他區域無法使用

**生成語音支援下列功能：**
+ 雙向串流 API 現已在生成式引擎中提供，並允許同時串流輸入和輸出。此 API 可在下列 AWS 區域使用：美國東部 （維吉尼亞北部）、歐洲 （法蘭克福）、美國西部 （奧勒岡） 和亞太區域 （新加坡）。請造訪 [文件](https://docs.aws.amazon.com/polly/latest/dg/API_StartSpeechSynthesisStream.html)以進一步了解如何使用它。
+ 即時和非同步語音合成操作。
+ **生成式**引擎不支援新聞播報員說話風格。
+ Amazon Polly 支援許多 （但非全部） SSML 標籤。如需 NTTS 支援的 SSML 標籤的詳細資訊，請參閱[支援的 SSML 標籤](https://docs.aws.amazon.com/polly/latest/dg/supportedtags.html) 
+ 如同標準語音，您可以從各種取樣率中選擇，為您的應用程式最佳化頻寬和音訊品質。標準和神經語音的有效取樣率為 8 kHz、16 kHz、22 kHz 或 24 kHz。標準語音的預設值為 22 kHz。生成語音的預設值為 24 kHz。Amazon Polly 支援 MP3、OGG (Vorbis) 和原始 PCM 音訊串流格式。

*目前無法支援產生語音標記。*

**注意**  
目前，歐洲 （倫敦） 和加拿大 （中部） 區域僅支援以下生成語音：Workday (en-US)、Amy (en-GB)、Brian (en-GB)、Florian (fr-FR)、Ambre (fr-FR)、Lorenzo (it-IT)、Beatrice (it-IT)、Jasmine (en-SG)、Aria (en-NZ)、Sabrina (de-CH)、Hannah (de-AT)、Niamh (en-IE)、Camila (pt-BR)、Lisa (nl-BE) 和 Seoyeon (ko-KR)

**注意**  
在極少數的模型幻覺情況下，（以及隨著生成式引擎透過權杖轉譯語音權杖的模型行為） 具有強制執行的緊急停止機制。內建機制會阻止模型進一步轉譯語音。此安全功能是以資料分析為基礎，其中模型可能幻覺，通常是在句子結尾。  
在某些情況下，模型可能會認為它會幻覺，然後在產生步驟期間最終剪下一個字詞，因此轉譯一半的字詞。這可能會產生不適當的結果。