翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# K-Means ハイパーパラメータ
<a name="k-means-api-config"></a>

[https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingJob.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingJob.html) リクエストで、使用するトレーニングアルゴリズムを指定します。また、アルゴリズム固有のハイパーパラメータを文字列から文字列へのマップとして指定することもできます。次の表に、Amazon SageMaker AI によって提供される k-means トレーニングアルゴリズムのハイパーパラメータを示します。k-means クラスタリングの仕組みの詳細については、「[K-Means クラスタリングの仕組み](algo-kmeans-tech-notes.md)」を参照してください。


| Parameter Name | 説明 | 
| --- | --- | 
| feature\_dim | 入力データ内の特徴の数。<br />**必須**<br />有効な値: 正の整数 | 
| k | 必要なクラスターの数。<br />**必須**<br />有効な値: 正の整数 | 
| epochs | トレーニングデータに対して実行するパスの数。<br />**オプション**<br />有効な値: 正の整数<br />デフォルト値： 1 | 
| eval\_metrics | モデルのスコアを報告するために使用されるメトリクスタイプの JSON リスト。許容値は、平均二乗偏差の場合 `msd`、平方距離の合計の場合 `ssd` です。テストデータが提供されている場合は、リクエストされた各メトリクスのスコアが報告されます。<br />**オプション**<br />有効な値: `[\"msd\"]`、`[\"ssd\"]`、 または `[\"msd\",\"ssd\"]`。<br />デフォルト値: `[\"msd\"]` | 
| extra\_center\_factor | アルゴリズムは、実行時に K 個の中心 = `num_clusters` \* `extra_center_factor` を作成し、モデルを完成させるときに中心の数を K から `k` に減らします。<br />**オプション**<br />有効な値: 正の整数または `auto`。<br />デフォルト値: `auto` | 
| half\_life\_time\_size | クラスター平均を計算するときに観測に付ける重みを決定するために使用されます。この重みは、観測ポイントが増えるにつれて指数関数的に減衰します。ポイントが最初に観測される際、クラスターの平均の計算時に 1 の重みが割り当てられます。`half_life_time_size` ポイントを観測した後、その重みが 1/2 になるように、指数関数的減衰関数の減衰定数が選択されます。0 に設定した場合、減衰はありません。<br />**オプション**<br />有効な値: 負以外の整数<br />デフォルト値: 0 | 
| init\_method | アルゴリズムが初期クラスターの中心を選択する方法。標準的な k-means アプローチがランダムに選択します。別の k-means\+\+ 法では、初期クラスターの中心をランダムに選択します。さらに、既存の中心からの残りのデータポイントの距離の 2 乗に比例する確率分布で中心の選択に重み付けすることによって、残りの初期クラスターの位置を広げます。<br />**オプション**<br />有効な値: `random` または `kmeans++`。<br />デフォルト値: `random` | 
| local\_lloyd\_init\_method | `k` 個の中心を含む最終モデルを構築するために使用された、ロイドの期待値最大化 (EM) 手順の初期化方法。<br />**オプション**<br />有効な値: `random` または `kmeans++`。<br />デフォルト値: `kmeans++` | 
| local\_lloyd\_max\_iter | `k` 個の中心を含む最終モデルを構築するために使用された、ロイドの期待値最大化 (EM) 手順の最大反復回数。<br />**オプション**<br />有効な値: 正の整数<br />デフォルト値: 300 | 
| local\_lloyd\_num\_trials | `k` 個の中心を含む最終モデルを構築するときに、最小の損失でロイドの期待値最大化 (EM) 手順が実行される回数。<br />**オプション**<br />有効な値: 正の整数または `auto`。<br />デフォルト値: `auto` | 
| local\_lloyd\_tol | `k` 個の中心を含む最終モデルを構築するために使用されたロイドの期待値最大化 (EM) 手順の早期停止における損失の変化の許容度。<br />**オプション**<br />有効な値: 浮動小数点数。[0, 1] の範囲です。<br />デフォルト値: 0.0001 | 
| mini\_batch\_size | データイテレーターのミニバッチごとの観測数。<br />**オプション**<br />有効な値: 正の整数<br />デフォルト値: 5000 |