

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 計時語音速度
<a name="voice-speed-vip"></a>

由於語音之間的自然變化，每個可用的語音會以稍微不同的速度說話。例如，使用美式英文語音時，Ivy 和 Joanna 比 Matthew 略快，而且比 Joey 快得多。由於語音之間差異很大，因此 Amazon Polly 語音沒有標準速度 （每分鐘字數）。不過，您可以找到語音使用[語音標記](using-speechmarks.md)說出所選文字所需的時間。

**計時口語文字段落的長度**

1. 開啟 AWS CLI。

1. 執行下列程式碼，視需要填入 。

   ```
        aws polly synthesize-speech \
             --language-code {{optional language code if needed}}
             --output-format json \
             --voice-id {{[name of desired voice]}} \
             --text '{{[desired text]}}' \
             --speech-mark-types='["viseme"]' \
             LengthOfText.txt
   ```

1. 打開 `LengthOfText.txt`.

如果文字是「Mary has a little lamb」，Amazon Polly 傳回的最後幾行會是：

```
     {"time":882,"type":"viseme","value":"t"}
     {"time":964,"type":"viseme","value":"a"}
     {"time":1082,"type":"viseme","value":"p"}
```

基本上，最後視素即「lamb」中最後字母發音，是在開始說話後 1082 毫秒處開始。雖然這並非音訊確實的長度，但是已經很接近，可做為語音比較的基礎。