

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 볼륨, 말하기 속도 및 피치 제어
<a name="prosody-tag"></a>

*<prosody>*

Prosody 태그 속성은 표준 TTS 음성으로 완벽하게 지원됩니다. 생성형, 신경 및 롱폼 음성은 `volume` 및 `rate` 속성을 지원하지만 `pitch` 속성은 지원하지 않습니다. 생성형 음성의 경우 prosody 태그는 전체 문장 주위에만 사용할 수 있습니다.

선택된 음성의 볼륨, 속도 또는 피치를 제어하려면 `prosody` 태그를 사용합니다.

볼륨, 스피치 속도 및 피치는 선택된 특정 음성에 따라 다릅니다. 서로 다른 언어를 사용하는 음성 간의 차이 외에도 동일한 언어를 사용하는 각 개인의 음성 간에도 차이가 존재합니다. 따라서 속성은 모든 언어에 걸쳐 유사하지만 각 언어들 사이에 분명한 차이가 존재하며 절대값이란 있을 수 없습니다.

`prosody` 태그에는 세 개의 속성이 있으며 각 속성에는 해당 속성을 설정하는 데 사용 가능한 몇 가지 값이 있습니다. 각 속성은 동일한 구문을 사용합니다.

```
<prosody attribute="value"></prosody>
```


+ `volume`
  + `default`: 볼륨을 현재 음성의 기본 수준으로 재설정합니다.
  + `silent`: `x-soft`, `soft`, `medium`, `loud`, `x-loud`, 볼륨을 현재 음성에 사전 정의된 값으로 설정합니다.
  + `+ndB`, `-ndB`: 볼륨을 현재 볼륨 레벨으로부터 가감합니다. `+0dB` 값은 변경 없음, `+6dB` 값은 현재 볼륨의 약 2배, `-6dB` 값은 현재 볼륨의 약 절반을 의미합니다.

  예를 들어, 특정 구절의 볼륨을 다음과 같은 방식으로 설정할 수 있습니다.

  ```
  <speak>
       Sometimes it can be useful to <prosody volume="loud">increase the volume 
       for a specific speech.</prosody>                     
  </speak>
  ```

  또는 다음과 같은 방식으로 설정할 수 있습니다.

  ```
  <speak>
       And sometimes a lower volume <prosody volume="-6dB">is a more effective way of 
       interacting with your audience.</prosody>  
  </speak>
  ```
+ `rate`
  +  `x-slow`, `slow`, `medium`, `fast`, `x-fast`. 선택된 음성에 대해 피치를 사전 정의된 값으로 설정합니다.
  + `n%`: 말하기 속도의 백분율 가감 예를 들어 100%의 값은 말하기 속도를 변경하지 않는 것이고, 200%의 값은 기본 속도의 2배에 해당하는 말하기 속도를 의미하며 50%의 값은 기본 속도의 절반에 해당하는 말하기 속도를 의미합니다. 이 값의 범위는 20%\$1200%입니다.

  예를 들어, 특정 구절의 스피치 속도를 다음과 같은 방식으로 설정할 수 있습니다.

  ```
  <speak>
       For dramatic purposes, you might wish to <prosody rate="slow">slow up the speaking 
       rate of your text.</prosody>                     
  </speak>
  ```

  또는 다음과 같은 방식으로 설정할 수 있습니다.

  ```
  <speak>
       Although in some cases, it might help your audience to <prosody rate="85%">slow 
       the speaking rate slightly to aid in comprehension.</prosody>  
  </speak>
  ```
+ `pitch`
  + `default`: 현재 음성의 음색을 기본 수준으로 재설정합니다.
  + `x-low`: `low`, `medium`, `high`, `x-high`, 현재 음성의 음색을 사전 정의된 값으로 설정합니다.
  + `+n%` 또는 `-n%`: 상대적 백분율로 음색을 조절합니다. 예를 들어 값 `+0%`는 기준 음색 변경이 없음을 의미하고, `+5%`는 약간 더 높은 기준 음색을 제공하며, `-5%`는 약간 더 낮은 기준 음색을 가져옵니다.

  예를 들어, 특정 구절의 피치를 다음과 같은 방식으로 설정할 수 있습니다.

  ```
  <speak>
       Do you like sythesized speech <prosody pitch="high">with a pitch that is higher 
       than normal?</prosody>                     
  </speak>
  ```

  또는 다음과 같은 방식으로 설정할 수 있습니다.

  ```
  <speak>
       Or do you prefer your speech <prosody pitch="-10%">with a somewhat lower pitch?</prosody>  
  </speak>
  ```

<prosody> 태그는 최소 1개의 속성을 포함해야 하나, 동일한 태그 안에 여러 개를 포함할 수도 있습니다.

```
<speak>
     Each morning when I wake up, <prosody volume="loud" rate="x-slow">I speak  
     quite slowly and deliberately until I have my coffee.</prosody>
</speak>
```

또한 다음과 같은 방식으로 중첩된 태그와 조합할 수 있습니다.

```
<speak>
     <prosody rate="85%">Sometimes combining attributes <prosody pitch="-10%">can 
     change the impression your audience has of a voice</prosody> as well.</prosody>                  
</speak>
```

**참고**  
현재 생성형 음성에 부분적으로 `<prosody>` 사용할 수 있습니다.

