

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# BlazingText 모델 튜닝
<a name="blazingtext-tuning"></a>

하이퍼파라미터 튜닝이라고도 하는 자동 모델 튜닝은 데이터세트에 대한 광범위한 하이퍼파라미터를 테스트하는 여러 작업을 실행하여 최적의 모델 버전을 찾습니다.** 튜닝 가능한 하이퍼파라미터, 각 하이퍼파라미터에 대한 값 범위 및 목표 지표를 선택합니다. 알고리즘에서 계산하는 지표 중에서 목표 지표를 선택합니다. 자동 모델 튜닝은 선택한 하이퍼파라미터를 검색하여 목표 지표를 최적화하는 모델을 만드는 값 조합을 찾습니다.

모델 튜닝에 대한 추가 정보는 [SageMaker AI로 자동 모델 튜닝](automatic-model-tuning.md) 섹션을 참조하세요.

## BlazingText 알고리즘에서 계산하는 지표
<a name="blazingtext-metrics"></a>

BlazingText Word2Vec 알고리즘(`skipgram`, `cbow` 및 `batch_skipgram` 모드)은 훈련 중 단일 지표(`train:mean_rho`)에 대해 보고합니다. 이 지표는 [WS-353 단어 유사성 데이터 세트](https://aclweb.org/aclwiki/WordSimilarity-353_Test_Collection_(State_of_the_art))에 대해 계산됩니다. Word2Vec 알고리즘에 대한 하이퍼파라미터 값을 튜닝할 때 이 지표를 목표값으로 사용합니다.

BlazingText 텍스트 분류 알고리즘(`supervised` 모드) 역시 훈련 중 단일 지표(`validation:accuracy`)에 대해 보고합니다. 텍스트 분류 알고리즘에 대한 하이퍼파라미터 값을 튜닝할 때 이러한 지표를 목표값으로 사용합니다.


| 지표 이름 | 설명 | 최적화 방향 | 
| --- | --- | --- | 
| train:mean\$1rho |  [WS-353 단어 유사성 데이터 세트](http://alfonseca.org/pubs/ws353simrel.tar.gz)에 대한 중앙값 rho(Spearman 순위 상관 계수)  |  최대화  | 
| validation:accuracy |  사용자 지정 검증 데이터 세트에 대한 분류 정확성  |  최대화  | 

## 튜닝 가능한 BlazingText 하이퍼파라미터
<a name="blazingtext-tunable-hyperparameters"></a>

### Word2Vec 알고리즘의 튜닝 가능한 하이퍼파라미터
<a name="blazingtext-tunable-hyperparameters-word2vec"></a>

Amazon SageMaker AI BlazingText Word2Vec 모델은 다음 하이퍼파라미터를 사용하여 튜닝합니다. Word2Vec 목표 지표에 가장 큰 영향을 미치는 하이퍼파라미터는 `mode`, ` learning_rate`, `window_size`, `vector_dim` 및 `negative_samples`입니다.


| 파라미터 이름 | 파라미터 유형 | 권장 범위 또는 값 | 
| --- | --- | --- | 
| batch\$1size |  `IntegerParameterRange`  |  [8-32]  | 
| epochs |  `IntegerParameterRange`  |  [5-15]  | 
| learning\$1rate |  `ContinuousParameterRange`  |  MinValue: 0.005, MaxValue: 0.01  | 
| min\$1count |  `IntegerParameterRange`  |  [0-100]  | 
| mode |  `CategoricalParameterRange`  |  [`'batch_skipgram'`, `'skipgram'`, `'cbow'`]  | 
| negative\$1samples |  `IntegerParameterRange`  |  [5-25]  | 
| sampling\$1threshold |  `ContinuousParameterRange`  |  MinValue: 0.0001, MaxValue: 0.001  | 
| vector\$1dim |  `IntegerParameterRange`  |  [32-300]  | 
| window\$1size |  `IntegerParameterRange`  |  [1-10]  | 

### 텍스트 분류 알고리즘의 튜닝 가능한 하이퍼파라미터
<a name="blazingtext-tunable-hyperparameters-text_class"></a>

Amazon SageMaker AI BlazingText 텍스트 분류 모델은 다음 하이퍼파라미터를 사용하여 튜닝합니다.


| 파라미터 이름 | 파라미터 유형 | 권장 범위 또는 값 | 
| --- | --- | --- | 
| buckets |  `IntegerParameterRange`  |  [1000000-10000000]  | 
| epochs |  `IntegerParameterRange`  |  [5-15]  | 
| learning\$1rate |  `ContinuousParameterRange`  |  MinValue: 0.005, MaxValue: 0.01  | 
| min\$1count |  `IntegerParameterRange`  |  [0-100]  | 
| vector\$1dim |  `IntegerParameterRange`  |  [32-300]  | 
| word\$1ngrams |  `IntegerParameterRange`  |  [1-3]  | 