

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# k-means 하이퍼파라미터
<a name="k-means-api-config"></a>

[https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingJob.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingJob.html) 요청에서 사용하고자 하는 훈련 알고리즘을 지정합니다. 알고리즘별 하이퍼파라미터를 문자열-문자열 맵으로 지정할 수 있습니다. 다음 테이블에는 Amazon SageMaker AI에서 제공되는 k-means 훈련 알고리즘에 대한 하이퍼파라미터가 나열되어 있습니다. k-means 클러스터링 작동 방식에 대한 자세한 정보는 [k-means 클러스터링 작동 방식](algo-kmeans-tech-notes.md) 섹션을 참조하세요.


| 파라미터 이름 | 설명 | 
| --- | --- | 
| feature\$1dim | 입력 데이터의 특징 수. **필수** 유효한 값: 양수  | 
| k |  필요한 클러스터 수. **필수** 유효한 값: 양수  | 
| epochs | 훈련 데이터에 대한 전달 횟수. **선택 사항** 유효한 값: 양수 기본값: 1  | 
| eval\$1metrics | 모델에 대한 점수를 보고하는 데 사용되는 지표 유형의 JSON 목록. 허용되는 값은 평균 제곱 편차의 경우 `msd`이고, 제곱 거리의 합의 경우 `ssd`입니다. 테스트 데이터가 제공된 경우에는 요청된 각 지표에 대해 점수가 보고됩니다. **선택 사항** 유효한 값: `[\"msd\"]`, `[\"ssd\"]` 또는 `[\"msd\",\"ssd\"]`. 기본값: `[\"msd\"]`  | 
| extra\$1center\$1factor | 이 알고리즘은 실행 시 K 중심 = `num_clusters` \$1 `extra_center_factor`를 생성하고 모델 완료 시 중심 수를 K에서 `k`로 줄입니다. **선택 사항** 유효한 값: 양의 정수 또는 `auto`. 기본값: `auto`  | 
| half\$1life\$1time\$1size | 클러스터 평균을 계산할 때 관측치에 지정할 가중치를 결정하는 데 사용됩니다. 더 많은 지점을 관측할수록 가중치는 급격하게 감소합니다. 지점이 처음으로 관측되는 경우 클러스터 평균을 계산할 때 해당 지점에는 가중치 1이 할당됩니다. `half_life_time_size` 지점을 관측한 이후 가중치는 1/2이 되도록 지수 감소 함수의 감소 상수를 선택합니다. 0으로 설정된 경우 감퇴가 없습니다. **선택 사항** 유효한 값: 음수가 아닌 정수 기본값: 0  | 
| init\$1method | 이 알고리즘이 초기 클러스터 중심을 선택하는 메서드. 표준 k-means 접근 방식은 이러한 메서드를 무작위로 선택합니다. 대체 k-means\$1\$1 메서드는 첫 번째 클러스터 중심을 무작위로 선택합니다. 그런 다음 기존 중심에서 남은 데이터 포인트까지 거리의 제곱에 비례하는 가능성 분포로 중심 선택에 가중치를 부여해 초기 클러스터의 위치를 분산시킵니다. **선택 사항** 유효한 값: `random` 또는 `kmeans++`. 기본값: `random`  | 
| local\$1lloyd\$1init\$1method | `k` 중심이 포함된 최종 모델을 빌드하기 위해 사용되는 Lloyd의 Expectation–Maximization(EM) 프로시저에 대한 초기화 메서드. **선택 사항** 유효한 값: `random` 또는 `kmeans++`. 기본값: `kmeans++`  | 
| local\$1lloyd\$1max\$1iter | `k` 중심이 포함된 최종 모델을 빌드하기 위해 사용되는 Lloyd의 Expectation–Maximization(EM) 프로시저에 대한 최대 반복 횟수. **선택 사항** 유효한 값: 양수 기본값: 300  | 
| local\$1lloyd\$1num\$1trials | `k` 중심이 포함된 최종 모델을 빌드하는 경우 손실이 가장 낮은 Lloyd의 Expectation–Maximization(EM) 프로시저가 실행되는 횟수. **선택 사항** 유효한 값: 양의 정수 또는 `auto`. 기본값: `auto`  | 
| local\$1lloyd\$1tol | `k` 중심이 포함된 최종 모델을 빌드하기 위해 사용되는 Lloyd의 Expectation–Maximization(EM) 프로시저의 조기 중지에 대한 손실 변화 내결함성. **선택 사항** 유효한 값: 부동 소수점. 범위: [0, 1]. 기본값: 0.0001  | 
| mini\$1batch\$1size | 데이터 반복자의 미니 배치당 관측치의 수. **선택 사항** 유효한 값: 양수 기본값: 5000  | 