

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# K-Means 모델 튜닝
<a name="k-means-tuning"></a>

하이퍼파라미터 튜닝이라고도 하는 자동 모델 튜닝은 데이터세트에 대한 광범위한 하이퍼파라미터를 테스트하는 여러 작업을 실행하여 최적의 모델 버전을 찾습니다.** 튜닝 가능한 하이퍼파라미터, 각 하이퍼파라미터에 대한 값 범위 및 목표 지표를 선택합니다. 알고리즘에서 계산하는 지표 중에서 목표 지표를 선택합니다. 자동 모델 튜닝은 선택한 하이퍼파라미터를 검색하여 목표 지표를 최적화하는 모델을 만드는 값 조합을 찾습니다.

Amazon SageMaker AI k-means 알고리즘은 가능한 한 구성원이 유사한 클러스터로 데이터를 그룹화하는 비지도 알고리즘입니다. 비지도 알고리즘이기 때문에 하이퍼파라미터가 최적화할 수 있는 기준이 되는 검증 데이터 세트를 사용하지 않습니다. 그러나 테스트 데이터 세트를 사용해 각 훈련 실행 종료 시 데이터 포인트와 최종 클러스터 중심 사이의 제곱 거리에 따라 달라지는 지표를 내보냅니다. 테스트 데이터 세트에 대해 밀집도가 가장 높은 클러스터를 보고하는 모델을 찾기 위해 하이퍼파라미터 튜닝 작업을 사용할 수 있습니다. 클러스터는 구성원의 유사성을 최적화합니다.

모델 튜닝에 대한 추가 정보는 [SageMaker AI로 자동 모델 튜닝](automatic-model-tuning.md) 섹션을 참조하세요.

## K-Means 알고리즘으로 계산되는 지표
<a name="km-metrics"></a>

k-means 알고리즘은 훈련 중 다음 지표를 계산합니다. 모델을 튜닝할 때 목표 지표로 이러한 지표 중 하나를 선택합니다.


| 지표 이름 | 설명 | 최적화 방향 | 
| --- | --- | --- | 
| test:msd | 테스트 세트의 각 레코드와 모델의 가장 가까운 중심 간 평균 제곱 거리. | 최소화 | 
| test:ssd | 테스트 세트의 각 레코드와 모델의 가장 가까운 중심 간 제곱 거리 합. | 최소화 | 



## 튜닝 가능한 K-Means 하이퍼파라미터
<a name="km-tunable-hyperparameters"></a>

다음 하이퍼파라미터를 사용하여 Amazon SageMaker AI k-means 모델을 튜닝합니다. k-means 목표 지표에 가장 큰 영향을 미치는 하이퍼파라미터는 `mini_batch_size`, `extra_center_factor` 및 `init_method`입니다. 하이퍼파라미터 `epochs`를 튜닝할 경우 일반적으로 개선 결과는 미미합니다.


| 파라미터 이름 | 파라미터 유형 | 권장 범위 | 
| --- | --- | --- | 
| epochs | IntegerParameterRanges | MinValue: 1, MaxValue:10 | 
| extra\_center\_factor | IntegerParameterRanges | MinValue: 4, MaxValue: 10 | 
| init\_method | CategoricalParameterRanges | ['kmeans\+\+', 'random'] | 
| mini\_batch\_size | IntegerParameterRanges | MinValue: 3000, MaxValue:15000 | 