기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# Amazon Polly 음성 엔진
<a name="voice-engines-polly"></a>

Amazon Polly에는 입력 텍스트를 실제 같은 스피치로 변환하는 4개의 음성 엔진이 있습니다. 여기에는 **생성형**, **롱폼**, **신경망**, **표준**이 포함됩니다. Amazon Polly 음성을 사용하려면 엔진과 스피치 합성 API 작업을 선택합니다. 그런 다음 엔진이 합성할 입력 텍스트를 제공하고 오디오 출력 형식을 선택합니다. 이러한 입력을 받으면 Amazon Polly는 제공된 텍스트를 고품질 스피치 오디오 스트림으로 합성합니다.

다음 섹션에는 Amazon Polly에서 제공하는 음성 엔진에 대한 자세한 정보가 나와 있습니다.

**Topics**
+ [생성형 음성](generative-voices.md)
+ [롱폼 음성](long-form-voices.md)
+ [신경 음성](neural-voices.md)
+ [표준 음성](standard-voices.md)
+ [음성 엔진 선택](using-voices.md)

# 생성형 음성
<a name="generative-voices"></a>

Amazon Polly **생성형** 텍스트 투 스피치(TTS) 엔진은 Amazon Polly 콘솔을 통해 사용할 수 있는, 사람과 매우 비슷하고 감정적으로 능숙하며 적응력이 뛰어난 대화형 음성을 제공합니다.

**생성형 엔진**은 현재까지 가장 규모가 큰 Amazon Polly TTS 모델입니다. 이는 원시 텍스트를 스피치 코드로 변환하는 10억 개 파라미터 트랜스포머를 배포한 다음, 이러한 스피치 코드를 증분적이고 스트리밍 가능한 방식으로 파형으로 변환하는 컨볼루션 기반 디코더를 배포합니다. 이 방법은 다양한 음성, 언어 및 스타일로 구성되고 점점 증가하는 공개적으로 이용 가능한 데이터와 독점 데이터로 훈련할 때 대규모 언어 모델(LLM)의 널리 보고된 새로운 능력을 보여줍니다.

생성형 엔진은 사람의 음성과 놀랍도록 비슷하게 감정적으로 능숙하며 단호하고 고도로 구어체인 합성 스피치를 생성합니다. 사람에 가까운 합성 스피치를 통해 이러한 음성을 지식이 풍부한 고객 어시스턴트, 가상 트레이너 또는 광고주로 사용할 수 있습니다.

**참고**  
이러한 음성의 기반이 되는 최첨단 기술은 언어 및 음성 모델링을 위한 생성형 AI 패러다임에 속합니다. 이 기술의 부작용으로, 훈련 데이터와 모델을 업데이트하면 모델 업데이트에 따라 전반적인 품질이 향상되더라도 음성이 약간 다르게 들릴 수 있습니다. 이는 예를 들어 팟캐스트 시즌과 같이 장기간에 걸쳐 다양한 콘텐츠 부분이 합성되는 사용 사례에 영향을 미칠 수 있습니다.

## 사용 가능한 생성형 음성
<a name="generative-voicelist"></a>

Amazon Polly는 현재 생성형 변형에서 43개의 음성을 제공합니다.


|  | 언어 | 언어 코드 | 이름/ID | Gender | 
| --- | --- | --- | --- | --- | 
| 1 |  **영어(호주)**  | en-AU |  Olivia  |  여성  | 
| 2 |  **영어(영국)**  | en-GB |  Amy Brian  |  여성 남성  | 
| 3 |  **영어(인도)**  | en-IN |  Kajal  |  여성  | 
| 4 |  **영어(아일랜드)**  | en-IE |  Niamh  |  여성  | 
| 5 |  **영어(뉴질랜드)**  | en-NZ |  Aria  |  여성  | 
| 6 |  **영어(싱가포르어)**  | en-SG |  Jasmine  |  여성  | 
| 7 |  **영어(남아프리카)**  | en-ZA |  Ayanda  |  여성  | 
| 8 |  **영어(미국)**  | en-US |  Danielle Joanna Matthew Ruth Salli Stephen Tiffany  |  여성 여성 남성 여성 여성 남성 여성  | 
| 9 |  **네덜란드어(벨기에)**  | nl-BE |  Lisa  |  여성  | 
| 10 |  **네덜란드어(네덜란드)**  | nl-NL |  Laura  |  여성  | 
| 11 |  **프랑스어(벨기에)**  | fr-BE |  Isabelle  |  여성  | 
| 12 |  **프랑스어(캐나다)**  | fr-CA |  Gabrielle Liam  |  여성 남성  | 
| 13 |  **프랑스어(프랑스)**  | fr-FR |  Ambre Céline 플로리안 Léa Rémi  |  여성 여성 남성 여성 남성  | 
| 14 |  **독일어(오스트리아)**  | de-AT |  Hannah  |  여성  | 
| 15 |  **독일어(독일)**  | de-DE |  Daniel Lennart Vicki  |  남성 남성 여성  | 
| 16 |  **독일어(스위스)**  | de-CH |  Sabrina  |  여성  | 
| 17 |  **이탈리아어(이탈리아)**  | it-IT |  Beatrice Bianca Lorenzo  |  여성 여성 남성  | 
| 18 |  **한국어(한국)**  | ko-KR |  Seoyeon  |  여성  | 
| 19 |  **폴란드어(폴란드)**  | pl-PL |  Ewa Ola  |  여성 여성  | 
| 20 |  **포르투갈어(브라질)**  | pt-BR |  Camila  |  여성  | 
| 21 |  **스페인어(멕시코)**  | es-MX |  Andrés Mía  |  남성 여성  | 
| 22 |  **스페인어(스페인)**  | es-ES |  Lucia Sergio  |  여성 남성  | 
| 23 |  **스페인어(미국)**  | es-US |  Lupe Pedro  |  여성 남성  | 

**참고**  
생성형 음성 비용은 [Amazon Polly 요금 정보 페이지](https://aws.amazon.com/polly/pricing/)에 명시되어 있습니다.

## 기능 및 리전 호환성
<a name="generative-regions"></a>

Amazon Polly 생성형 음성을 사용할 수 있는 리전은 다음과 같습니다.
+ 미국 동부(버지니아 북부): us-east-1
+ 유럽(프랑크푸르트): eu-central-1
+ 미국 서부(오레곤): us-west-2
+ 아시아 태평양(도쿄): ap-northeast-1
+ 아시아 태평양(서울): ap-northeast-2
+ 아시아 태평양(싱가포르): ap-southeast-1
+ 유럽(런던): eu-west-2
+ 캐나다(중부): ca-central-1
+ 기타 리전에서는 사용할 수 없음

**생성형 음성에 지원되는 기능:**
+ 양방향 스트리밍 API는 이제 생성형 엔진에서 제공되며 입력과 출력을 동시에 스트리밍할 수 있습니다. 이 API는 미국 동부(버지니아 북부), 유럽(프랑크푸르트), 미국 서부(오레곤), 아시아 태평양(싱가포르) AWS 리전에서 사용할 수 있습니다. 사용 방법에 대한 자세한 내용은 [설명서를](https://docs.aws.amazon.com/polly/latest/dg/API_StartSpeechSynthesisStream.html) 참조하십시오.
+ 실시간 및 비동기 스피치 합성 작업 
+ **생성형** 엔진에서는 뉴스 진행자 말투가 지원되지 않습니다.
+ 상당수의(전부 아님) SSML 태그가 Amazon Polly에서 지원됩니다. NTTS를 지원하는 SSML 태그에 대한 자세한 내용은 [지원되는 SSML 태그](https://docs.aws.amazon.com/polly/latest/dg/supportedtags.html)를 참조하세요.
+ 표준 음성의 경우와 마찬가지로, 다양한 샘플링 속도 중에서 선택하여 애플리케이션의 대역폭과 오디오 품질을 최적화할 수 있습니다. 표준 음성과 신경 음성에 맞는 샘플링 속도는 8kHz, 16kHz, 22kHz 또는 24kHz입니다. 표준 음성의 기본값은 22kHz이고 생성형 음성의 기본값은 24kHz입니다. Amazon Polly는 MP3, OGG(Vorbis) 및 원시 PCM 오디오 스트림 형식을 지원합니다.

*스피치 마크 생성은 현재 지원되지 않습니다.*

**참고**  
현재 유럽(런던) 및 캐나다(중부) 리전에서는 다음과 같은 생성형 음성만 지원합니다. -Tanyin(en-US), Amy(en-GB), Brian(en-GB), Florian(fr-FR), Ambre(fr-FR), Lorenzo(it-IT), Beatrice(it-IT), Jasmine(en-SG), Aria(en-NZ), Sabrina(de-CH), Hannah(de-AT), Niamh(en-IE), Camila(pt-BR), Lisa(nl-BE) 및 Seoyeon(ko-KR)

**참고**  
드물게 모델 할루시네이션이 발생할 경우(그리고 토큰으로 스피치 토큰을 렌더링하는 생성형 엔진의 모델 동작 발생) 강제 비상 중지 메커니즘이 실행됩니다. 이 기본 제공 메커니즘은 모델이 더 이상 스피치를 렌더링하지 못하도록 합니다. 이러한 안전 기능은 모델이 일반적으로 문장 끝에서 할루시네이션을 일으킬 가능성이 있다는 데이터 분석을 기반으로 합니다.  
모델이 할루시네이션을 일으킬 것이라고 판단하여 생성 단계에서 단어를 잘라내 단어의 절반을 렌더링하는 경우가 생길 수 있습니다. 이로 인해 부적절한 결과가 발생할 수 있습니다.

# 롱폼 음성
<a name="long-form-voices"></a>

Amazon Polly에는 사람과 비슷하고 표현력이 뛰어나며 감정적으로 능숙한 음성을 생성하는 **롱폼 엔진**이 있습니다. 롱폼 음성은 뉴스 기사, 교육 자료 또는 마케팅 비디오와 같은 긴 콘텐츠에서 청취자의 관심을 끌도록 설계되었습니다.

Amazon Polly 롱폼 음성은 최첨단 딥 러닝 TTS 기술을 사용하여 개발되었습니다. 이 모델은 인간 언어의 음소, 운율, 억양 및 기타 음성 및 음향 측면을 따라하도록 학습하여 매우 자연스러운 음성 출력을 제공합니다.

롱폼 엔진은 텍스트 임베딩을 사용하여 텍스트의 의미를 해석합니다. 롱폼 엔진은 텍스트 임베딩을 사용하여 자연스러운 음성의 올바른 강조, 멈춤, 톤을 생성할 수 있습니다. 그 결과 인간의 의사소통에 존재하는 모든 감정적 요소를 결합한 음성이 탄생합니다. 여기에는 놀라움을 모방하거나 대화와 내레이션을 구분하는 것이 포함됩니다. 이 모든 것이 합쳐져 살아 있는 사람처럼 들리는 프리미엄 스피치 산물이 생성됩니다.

**참고**  
이러한 음성의 기반이 되는 최첨단 기술은 언어 및 음성 모델링을 위한 생성형 AI 패러다임에 속합니다. 이 기술의 부작용으로, 훈련 데이터와 모델을 업데이트하면 모델 업데이트에 따라 전반적인 품질이 향상되더라도 음성이 약간 다르게 들릴 수 있습니다. 이는 예를 들어 팟캐스트 시즌과 같이 장기간에 걸쳐 다양한 콘텐츠 부분이 합성되는 사용 사례에 영향을 미칠 수 있습니다.

## 사용 가능한 롱폼 음성
<a name="long-form-voicelist"></a>

Amazon Polly는 현재 4개의 en-US 및 2개의 es-ES 롱폼 음성을 지원합니다. 두 언어 모두 여성 및 남성 음성을 사용할 수 있습니다. 영어 롱폼 음성 Daniel, Gregory 및 Ruth는 대화형 NTTS 변형으로도 제공됩니다.


|  | 언어 | 언어 코드 | 이름/ID | Gender | 
| --- | --- | --- | --- | --- | 
| 1 |  **영어(미국)**  | en-US |  Danielle Gregory Ruth Patrick  |  여성 남성 여성 남성  | 
| 2 |  **스페인어(스페인)**  | es-ES |  Alba Raúl  |  여성 남성  | 

## 기능 및 리전 호환성
<a name="long-form-regions"></a>

Amazon Polly 롱폼 음성을 사용할 수 있는 리전은 다음과 같습니다.
+ 미국 동부(버지니아 북부): us-east-1
+ 기타 리전에서는 사용할 수 없음

**Amazon Polly 롱폼 엔진이 지원하는 기능:**
+ 실시간 및 비동기 스피치 합성 작업 
+ 모든 [스피치 마크](https://docs.aws.amazon.com/polly/latest/dg/speechmarks.html) 
+ 상당수의(전부 아님) SSML 태그가 Amazon Polly에서 지원됩니다. NTTS를 지원하는 SSML 태그에 대한 자세한 내용은 [지원되는 SSML 태그](https://docs.aws.amazon.com/polly/latest/dg/supportedtags.html)를 참조하세요.
+ 표준 음성의 경우와 마찬가지로, 다양한 샘플링 속도 중에서 선택하여 애플리케이션의 대역폭과 오디오 품질을 최적화할 수 있습니다. 표준, 롱폼 및 신경 음성에 맞는 샘플링 속도는 8kHz, 16kHz, 22kHz 또는 24kHz입니다. 표준 음성의 기본값은 22kHz이고 롱폼 및 신경 음성의 기본값은 24kHz입니다. Amazon Polly는 MP3, OGG(Vorbis) 및 원시 PCM 오디오 스트림 형식을 지원합니다.

**참고**  
롱폼 음성 비용은 [Amazon Polly 요금 정보 페이지](https://aws.amazon.com/polly/pricing/)에 명시되어 있습니다.

# 신경 음성
<a name="neural-voices"></a>

Amazon Polly에는 표준 음성보다 자연스러운 음성을 낼 수 있는 **신경망 텍스트 투 스피치(NTTS)** 시스템이 있습니다. 표준 TTS 음성은 연결 합성을 사용합니다. 이 표준 엔진은 녹음된 스피치의 음소를 서로 연결하여 매우 자연스럽게 들리도록 합성된 스피치를 만들어 냅니다. 하지만 말은 변형될 수밖에 없고 파형 분절에 사용되는 기술로 인해 스피치 품질이 제한됩니다. Amazon Polly NTTS 엔진은 스피치를 생성하기 위해 표준 연결 합성을 사용하지 않으며, 다음 두 부분으로 이루어져 있습니다.
+ 신경망 - 음소(가장 기본적인 언어 단위) 시퀀스를 *스펙트로그램* 시퀀스로 변환합니다. (스펙트로그램은 다양한 주파수 대역의 에너지 레벨을 스냅샷으로 찍은 것입니다.)
+ 보코더 - 스펙트로그램을 거의 연속된 오디오 신호로 변환합니다.

신경 TTS 시스템의 첫 번째 구성 요소는 Sequence-to-Sequence 모델입니다. 이 모델은 해당하는 입력에서만 결과를 만들 뿐만 아니라 입력 요소의 시퀀스가 함께 작동하는 방식도 고려합니다. 모델이 출력되는 스펙트로그램을 선택하면 주파수 대역이 사람의 뇌가 말을 처리할 때 사용하는 음향 기능을 강조합니다.

그런 다음 이 모델의 출력이 신경 보코더로 전달되고 스펙트로그램이 스피치 파형으로 변환됩니다. 범용 연결 합성 시스템을 빌드하는 데 사용되는 대규모 데이터세트로 훈련될 경우 이 Sequence-to-Sequence 접근 방식은 더 우수하고 자연스럽게 들리는 음성을 만들어 냅니다.

## 사용 가능한 신경 음성
<a name="neural-voicelist"></a>

신경 음성은 36개 언어와 언어 변형으로 제공됩니다. 다음 표에 음성이 나와 있습니다.


|   | 언어 및 사투리 | 언어 코드 | 이름/ID | Gender | 
| --- | --- | --- | --- | --- | 
|  1  |   **아랍어(걸프)**   |  ar-AE  |  Hala Zayd  |  여성 남성  | 
|  2  |   **벨기에 네덜란드어(플랑드르)**   |  nl-BE  |  Lisa  |  여성  | 
|  3  |   **카탈루냐어**   |  ca-ES  |  Arlet  |  여성  | 
|  4  |   **체코어**   |  cs-CZ  |  Jitka  |  여성  | 
|  5  |   **중국어(광동어)**   |  yue-CN  |  Hiujin  |  여성  | 
|  6  |   **표준 중국어**   |  cmn-CN  |  Zhiyu  |  여성  | 
|  7  |   **덴마크어**   |  da-DK  |  Sofie  |  여성  | 
|  8  |   **네덜란드어**   |  nl-NL  |  Laura  |  여성  | 
|  9  |   **영어(호주)**   |  en-AU  |  Olivia  |  여성  | 
|  10  |   **영어(영국)**   |  en-GB  |  Amy\$1 Emma Brian Arthur  |  여성 여성 남성 남성  | 
|  11  |   **영어(인도)**   |  en-IN  |  Kajal  |  여성  | 
|  12  |   **영어(아일랜드)**   |  en-IE  |  Niamh  |  여성  | 
|  13  |   **영어(뉴질랜드)**   |  en-NZ  |  Aria  |  여성  | 
|  14  |   **영어(싱가포르어)**   |  en-SG  |  Jasmine  |  여성  | 
|  15  |  영어(남아프리카)  |  en-ZA  |  Ayanda  |  여성  | 
|  16  |   **영어(미국)**   |  en-US  |  Danielle Gregory Ivy Joanna\$1 Kendra Kimberly Salli Joey Justin Kevin Matthew\$1 Ruth Stephen  |  여성 남성 여성(어린이) 여성 여성 여성 여성 남성 남성(어린이) 남성(어린이) 남성 여성 남성  | 
|  17  |   **핀란드어**   |  fi-FI  |  Suvi  |  여성  | 
|  18  |   **프랑스어(벨기에)**   |  fr-BE  |  Isabelle  |  여성  | 
|  19  |   **프랑스어(캐나다)**   |  fr-CA  |  Gabrielle Liam  |  여성 남성  | 
|  20  |   **프랑스어**   |  fr-FR  |  Léa Rémi  |  여성 남성  | 
|  21  |   **독일어**   |  de-DE  |  Vicki Daniel  |  여성 남성  | 
|  22  |   **독일어(오스트리아)**   |  de-AT  |  Hannah  |  여성  | 
|  23  |   **독일어(스위스)**   |  de-CH  |  Sabrina  |  여성  | 
|  24  |   **힌디어**   |  hi-IN  |  Kajal  |  여성  | 
|  25  |   **이탈리아어**   |  it-IT  |  Bianca Adriano  |  여성 남성  | 
|  26  |   **일본어**   |  ja-JP  |  Takumi Kazuha Tomoko  |  남성 여성 여성  | 
|  27  |   **한국어**   |  ko-KR  |  Seoyeon Jihye  |  여성 여성  | 
|  28  |   **노르웨이어**   |  nb-NO  |  Ida  |  여성  | 
|  29  |   **폴란드어**   |  pl-PL  |  Ola  |  여성  | 
|  30  |   **포르투갈어(브라질)**   |  pt-BR  |  Camila Vitória/Vitoria Thiago  |  여성  여성 남성  | 
|  31  |   **포르투갈어(유럽)**   |  pt-PT  |  Inês/Ines  |  여성   | 
|  32  |   **스페인어(스페인)**   |  es-ES  |  Lucia Sergio  |  여성  남성  | 
|  33  |   **스페인어(멕시코)**   |  es-MX  |  Mia Andrés  |  여성 남성  | 
|  34  |   **스페인어(미국)**   |  es-US  |  Lupe\$1 Pedro  |  여성 남성  | 
|  35  |   **스웨덴어**   |  sv-SE  |  Elin  |  여성  | 
|  36  |   **터키어**   |  tr-TR  |  Burcu  |  여성  | 

\$1Amy, Joanna, Lupe 및 Matthew 음성은 뉴스 진행자 말투로 사용할 수 있습니다. 자세한 내용은 [뉴스 진행자 음성 적용](newscaster-voices.md) 단원을 참조하십시오.

## 기능 및 리전 호환성
<a name="ntts-regions"></a>

일부 AWS 리전에서는 신경 음성을 사용할 수 없으며 모든 Amazon Polly 기능을 지원하지도 않습니다.

신경 음성이 지원되는 리전은 다음과 같습니다.
+ 미국 동부(버지니아 북부): us-east-1
+ 미국 서부(오레곤): us-west-2
+ 아프리카(케이프타운): af-south-1
+ 아시아 태평양(도쿄): ap-northeast-1
+ 아시아 태평양(서울): ap-northeast-2
+ 아시아 태평양(오사카): ap-northeast-3
+ 아시아 태평양(뭄바이): ap-south-1
+ 아시아 태평양(싱가포르): ap-southeast-1
+ 아시아 태평양(시드니): ap-southeast-2
+ 아시아 태평양(말레이시아): ap-southeast-5
+ 캐나다(중부): ca-central-1
+ 유럽(프랑크푸르트): eu-central-1
+ 유럽(아일랜드): eu-west-1
+ 유럽(런던): eu-west-2
+ 유럽(파리): eu-west-3
+ 유럽(스페인): eu-south-2
+ 유럽(취리히): eu-central-2
+ AWS GovCloud(미국 서부): us-gov-west-1

이 리전의 엔드포인트와 프로토콜은 표준 음성에 사용되는 것과 같습니다. 자세한 내용은 [Amazon Polly 엔드포인트 및 할당량](https://docs.aws.amazon.com/general/latest/gr/pol.html)을 참조하세요.

신경 음성에 지원되는 기능은 다음과 같습니다.
+ 실시간 및 비동기 스피치 합성 작업
+ 뉴스 진행자 말투입니다. 진행자 말투에 대한 자세한 내용은 [뉴스 진행자 음성 적용](newscaster-voices.md)을 참조하세요.
+ 모든 스피치 마크 
+  Amazon Polly에서 지원하는 상당수의(전부 아님) SSML 태그입니다. NTTS를 지원하는 SSML 태그에 대한 자세한 내용은 지원되는 태그를 참조하세요.

 표준 음성의 경우와 마찬가지로, 다양한 샘플링 속도 중에서 선택하여 애플리케이션의 대역폭과 오디오 품질을 최적화할 수 있습니다. 표준 음성과 신경 음성에 맞는 샘플링 속도는 8kHz, 16kHz, 22kHz 또는 24kHz입니다. 표준 음성의 기본값은 22kHz이고 신경 음성의 기본값은 24kHz입니다. Amazon Polly는 MP3, OGG(Vorbis) 및 원시 PCM 오디오 스트림 형식을 지원합니다.

# 표준 음성
<a name="standard-voices"></a>

Amazon Polly에는 연결 합성을 사용하는 **표준** 엔진이 있습니다. 이 표준 엔진은 녹음된 스피치의 음소를 서로 연결하여 매우 자연스럽게 들리도록 합성된 스피치를 만들어 냅니다.

## 사용 가능한 표준 음성
<a name="standard-voicelist"></a>

Amazon Polly는 현재 29개의 언어 및 언어 변형으로 여성 표준 음성 40개와 남성 표준 음성 20개를 제공합니다.


|  | 언어 | 언어 코드 | 이름/ID | Gender | 
| --- | --- | --- | --- | --- | 
| 1 |  **아랍어**  | arb |  Zeina  |  여성  | 
| 2 |  **표준 중국어**  | cmn-CN |  Zhiyu  |  여성  | 
| 3 |  **덴마크어**  | da-DK |  Naja Mads  |  여성 남성  | 
| 4 |  **네덜란드어**  | nl-NL |  Lotte Ruben  |  여성 남성  | 
| 5 |  **영어(호주)**  | en-AU |  Nicole Russell  |  여성 남성  | 
| 6 |  **영어(영국)**  | en-GB |  Amy Emma Brian  |  여성 여성 남성  | 
| 7 |  **영어(인도)**  | en-IN |  Aditi Raveena  |  여성 여성  | 
| 8 |  **영어(미국)**  | en-US |  Ivy Joanna Kendra Kimberly Salli Joey Kevin  |  여성 여성 여성 여성 여성 남성 남성  | 
| 9 |  **영어(웨일스)**  | en-GB-WLS |  Geraint  |  남성  | 
| 10 |  **프랑스어**  | fr-FR |  Céline/Celine Léa Mathieu  |  여성 여성 남성  | 
| 11 |  **프랑스어(캐나다)**  | fr-CA |  Chantal  |  여성  | 
| 12 |  **독일어**  | de-DE |  Marlene Vicki Hans  |  여성 여성 남성  | 
| 13 |  **힌디어**  | hi-IN |  Aditi  |  여성  | 
| 14 |  **아이슬란드어**  | is-IS |  Dóra/Dora Karl  |  여성 남성  | 
| 15 |  **이탈리아어**  | it-IT |  Carla Bianca Giorgio  |  여성 여성 남성  | 
| 16 |  **일본어**  | ja-JP |  Mizuki Takumi  |  여성 남성  | 
| 17 |  **한국어**  | ko-KR |  Seoyeon  |  여성  | 
| 18 |  **노르웨이어**  | nb-NO |  Liv  |  여성  | 
| 19 |  **폴란드어**  | pl-PL |  Ewa Maja Jacek Jan  |  여성 여성 남성 남성  | 
| 20 |  **포르투갈어(브라질)**  | pt-BR |  Camila Vitória/Vitoria Ricardo  |  여성 여성 남성  | 
| 21 |  **포르투갈어(유럽)**  | pt-PT |  Inês/Ines Cristiano  |  여성 남성  | 
| 22 |  **루마니아어**  | ro-RO |  Carmen  |  여성  | 
| 23 |  **러시아어**  | ru-RU |  Tatyana Maxim  |  여성 남성  | 
| 24 |  **스페인어(스페인)**  | es-ES |  Conchita Lucia Enrique  |  여성 여성 남성  | 
| 25 |  **스페인어(멕시코)**  | es-MX |  Mia  |  여성  | 
| 26 |  **스페인어(미국)**  | es-US |  Lupe Penélope/Penelope Miguel  |  여성 여성 남성  | 
| 27 |  **스웨덴어**  | sv-SE |  Astrid  |  여성  | 
| 28 |  **터키어**  | tr-TR |  Filiz  |  남성  | 
| 29 |  **웨일스어**  | cy-GB |  Gwyneth  |  여성  | 

## 기능 및 리전 호환성
<a name="standard-regions"></a>

Amazon Polly 표준 음성을 사용할 수 있는 Amazon Polly 리전은 다음과 같습니다.
+ 미국 동부(버지니아 북부): us-east-1
+ 미국 동부(오하이오): us-east-2
+ 미국 서부(캘리포니아 북부): us-west-1
+ 미국 서부(오레곤): us-west-2
+ 아프리카(케이프타운): af-south-1
+ 아시아 태평양(홍콩): ap-east-1
+ 아시아 태평양(도쿄): ap-northeast-1
+ 아시아 태평양(서울): ap-northeast-2
+ 아시아 태평양(오사카): ap-northeast-3
+ 아시아 태평양(뭄바이): ap-south-1
+ 아시아 태평양(싱가포르): ap-southeast-1
+ 아시아 태평양(시드니): ap-southeast-2
+ 아시아 태평양(말레이시아): ap-southeast-5
+ 중국(닝샤): cn-northwest-1
+ 캐나다(중부): ca-central-1
+ 유럽(프랑크푸르트): eu-central-1
+ 유럽(아일랜드): eu-west-1
+ 유럽(런던): eu-west-2
+ 유럽(파리): eu-west-3
+ 유럽(스페인): eu-south-2
+ 유럽(스톡홀름): eu-north-1
+ 중동(바레인): me-south-1
+ 남아메리카(상파울루): sa-east-1
+ AWS GovCloud(미국 서부): us-gov-west-1

이 리전의 엔드포인트와 프로토콜은 신경 음성에 사용되는 것과 같습니다. 자세한 내용은 [Amazon Polly 엔드포인트 및 할당량](https://docs.aws.amazon.com/general/latest/gr/pol.html)을 참조하세요.

**Amazon Polly 표준 엔진이 지원하는 기능(TBD):**
+ 실시간 및 비동기 스피치 합성 작업
+ 모든 [스피치 마크](https://docs.aws.amazon.com/polly/latest/dg/speechmarks.html)
+ 상당수의(전부 아님) SSML 태그가 Amazon Polly에서 지원됩니다. NTTS를 지원하는 SSML 태그에 대한 자세한 내용은 [지원되는 SSML 태그](https://docs.aws.amazon.com/polly/latest/dg/supportedtags.html)를 참조하세요.
+ 다양한 샘플링 속도 중에서 선택하여 애플리케이션의 대역폭과 오디오 품질을 최적화할 수 있습니다. 표준 음성의 기본 샘플링 속도는 22kHz입니다. Amazon Polly는 MP3, OGG(Vorbis) 및 원시 PCM 오디오 스트림 형식을 지원합니다.

**참고**  
표준 음성 비용은 [Amazon Polly 요금 정보 페이지](https://aws.amazon.com/polly/pricing/)에 명시되어 있습니다.

# 음성 엔진 선택
<a name="using-voices"></a>

Amazon Polly 콘솔 또는를 통해 Amazon Polly 음성에 액세스할 수 있습니다 AWS CLI.

**콘솔에서 음성 엔진을 선택하려면**

1. [https://console.aws.amazon.com/polly/](https://console.aws.amazon.com/polly/)에서 Amazon Polly 콘솔을 엽니다.

1. Amazon Polly 콘솔에서 원하는 음성 엔진을 선택합니다.

1. 음성 드롭다운 메뉴에서 원하는 음성을 선택합니다.

1. 원하는 텍스트로 TTS 오디오를 생성합니다.

에서 음성 엔진을 선택하려면 `SyntheszieSpeech` 또는 `StartSpeechSynthesisTask` API 작업`VoiceId`에서 `Engine` 및를 AWS CLI지정합니다. 몇 가지 예는 [퀵 스타트 코드 샘플](https://docs.aws.amazon.com/polly/latest/dg/get-started-what-next.html)과 [Python 예제](https://docs.aws.amazon.com/polly/latest/dg/get-started-what-next.html)를 참조하세요.