

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 長形語音
<a name="long-form-voices"></a>

Amazon Polly 具有**長形引擎**，可產生類似人類、高度表達和情緒熟練的語音。長形語音旨在吸引聆聽者注意較長的內容，例如新聞文章、訓練資料或行銷影片。

Amazon Polly Long-form 語音是使用尖端深度學習 TTS 技術所開發。此模型會學習複寫人類語言的音素、音素、語調和其他音素和聲音層面，進而產生高度自然的語音輸出。

長形引擎使用文字內嵌來解釋文字的意義。使用文字內嵌，長形引擎可以產生自然聲音的正確強調、暫停和色調。結果是語音，結合存在於人類溝通中的完整情緒元素範圍。這包括模擬意外或區分對話與敘述。總之，這會建立一個高級的語音產品，聽起來像活人。

**注意**  
以這些語音為基礎的state-of-the-art技術位於生成式 AI 語言和語音建模的範式中。技術的副作用是，訓練資料和模型的任何更新都可能導致聲音聲音的音量稍微變化，即使整體品質隨著模型更新而改善。這可能會影響長時間合成不同內容組件的使用案例，例如播客季節。

## 可用的長格式語音
<a name="long-form-voicelist"></a>

Amazon Polly 目前提供四個 en-US 和兩個 es-ES 長格式語音。兩種語言都提供女性和男性語音。英文長格式語音 Daniel、Gregory 和 Ruth 也提供對話式 NTTS 變體。


|  | Language | 語言代碼 | 名稱/ID | Gender | 
| --- | --- | --- | --- | --- | 
| 1 | **英文 (美國)** | zh-TW | 丹尼爾文<br />Gregory<br />Ruth<br />派翠克 | 女性<br />男性<br />女性<br />男性 | 
| 2 | **西班牙文 （西班牙）** | es-ES | Alba<br />Raúl | 女性<br />男性 | 

## 功能和區域相容性
<a name="long-form-regions"></a>

Amazon Polly 長格式語音可在下列區域使用：
+ 美國東部 (維吉尼亞北部)：us-east-1
+ 其他區域無法使用

**Amazon Polly Long-form 引擎支援下列功能：**
+ 即時和非同步語音合成操作。
+ 所有[語音標記](https://docs.aws.amazon.com/polly/latest/dg/speechmarks.html)。
+ Amazon Polly 支援許多 （但非全部） SSML 標籤。如需 NTTS 支援的 SSML 標籤的詳細資訊，請參閱[支援的 SSML 標籤](https://docs.aws.amazon.com/polly/latest/dg/supportedtags.html) 
+ 如同標準語音，您可以從各種取樣率中選擇，為您的應用程式最佳化頻寬和音訊品質。標準語音、長式語音和神經語音的有效取樣率為：8 kHz、16 kHz、22kHz 或 24 kHz。標準語音的預設值為 22 kHz。長格式和神經語音的預設值為 24 kHz。Amazon Polly 支援 MP3、OGG (Vorbis) 和原始 PCM 音訊串流格式。

**注意**  
長格式語音成本會在 [Amazon Polly 定價資訊頁面上](https://aws.amazon.com/polly/pricing/)指定。