

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# CatBoost のハイパーパラメータ
<a name="catboost-hyperparameters"></a>

次の表には、Amazon SageMaker AI CatBoost アルゴリズムに必要な、または最も一般的に使用されるハイパーパラメータのサブセットが含まれています。ユーザーは、データからモデルパラメータを推定しやすくするために、これらのパラメータを設定します。SageMaker AI CatBoost アルゴリズムは、オープンソースの [CatBoost](https://github.com/catboost/catboost) パッケージの実装です。

**注記**  
デフォルトのハイパーパラメータは、[CatBoost サンプルノートブック](catboost.md#catboost-sample-notebooks) のサンプルデータセットに基づいています。

デフォルトでは、SageMaker AI CatBoost アルゴリズムは分類問題のタイプに基づいて評価指標と損失関数を自動的に選択します。CatBoost アルゴリズムは、データ内のラベル数に基づいて分類問題のタイプを検出します。回帰問題の場合、評価メトリクスと損失関数はどちらも二乗平均平方根誤差です。二項分類問題の場合、評価メトリクスは曲線下面積 (AUC) で、損失関数は対数損失です。多クラス分類問題の場合、評価メトリクスと損失関数はマルチクラスの交差エントロピーになります。`eval_metric` ハイパーパラメータを使用して、デフォルトの評価メトリクスを変更できます。説明、有効値、およびデフォルト値など、LightGBM ハイパーパラメータの詳細については、次の表を参照してください。


| Parameter Name | 説明 | 
| --- | --- | 
| iterations | 構築できるツリーの最大数。<br />有効な値: 整数、範囲: 正の整数。<br />デフォルト値: `500`。 | 
| early\_stopping\_rounds | ある検証データポイントの 1 つのメトリクスが最後の `early_stopping_rounds` ラウンドで改善されない場合、トレーニングは停止します。`early_stopping_rounds` が 0 以下の場合、このハイパーパラメータは無視されます。<br />有効な値: 整数。<br />デフォルト値: `5`。 | 
| eval\_metric | 検証データの評価メトリクス。`eval_metric` がデフォルトの `"auto"` 値に設定されている場合、アルゴリズムは分類問題のタイプに基づいて自動的に評価メトリクスを選択します。[See the AWS documentation website for more details](http://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/catboost-hyperparameters.html)<br />有効な値: 文字列、有効な値については、「[CatBoost documentation](https://catboost.ai/en/docs/references/eval-metric__supported-metrics)」を参照してください。<br />デフォルト値: `"auto"`。 | 
| learning\_rate | トレーニング例の各バッチを完了した後に、モデルの重みが更新されるレート。<br />有効な値: 浮動小数点、範囲: (`0.0`, `1.0`)。<br />デフォルト値: `0.009`。 | 
| depth | ツリーの深さです。<br />有効な値: 整数、範囲: (`1`,`16`)。<br />デフォルト値: `6`。 | 
| l2\_leaf\_reg | コスト関数の L2 正則化項の係数。<br />有効な値: 整数、範囲: 正の整数。<br />デフォルト値: `3`。 | 
| random\_strength | ツリー構造を選択したときに、スコアリングの分割に使用するランダム性の量。このパラメータを使用すると、モデルがオーバーフィットするのを防ぐことができます。<br />有効な値: 浮動小数点、範囲: 正の浮動小数点数。<br />デフォルト値: `1.0`。 | 
| max\_leaves | 生成されるツリーのリーフの最大数。`"Lossguide"` 成長ポリシーでのみ使用できます。<br />有効な値: 整数、範囲: (`2`,`64`)。<br />デフォルト値: `31`。 | 
| rsm | ランダム部分空間法。特徴量をランダムに選択し直す場合に、分割選択ごとに使用する特徴量の割合。<br />有効な値: 浮動小数点、範囲: (`0.0`, `1.0`)。<br />デフォルト値: `1.0`。 | 
| sampling\_frequency | ツリーを構築する際にウェイトやオブジェクトをサンプリングする頻度。<br />有効な値: 文字列、(`"PerTreeLevel"` または `"PerTree"`) のいずれか。<br />デフォルト値: `"PerTreeLevel"`。 | 
| min\_data\_in\_leaf | リーフ内のトレーニングサンプルの最小数。CatBoost は、サンプル数が指定値より少ないリーフでは新しい分割を検索しません。`"Lossguide"` および `"Depthwise"` 成長ポリシーでのみ使用できます。<br />有効な値: 整数、範囲: (`1` または `∞`)。<br />デフォルト値: `1`。 | 
| bagging\_temperature | ベイズブートストラップの設定を定義します。ベイズブートストラップを使用して、オブジェクトにランダムなウェイトを割り当てます。`bagging_temperature` が `1.0` に設定されている場合、重みは指数分布からサンプリングされます。`bagging_temperature` を `0.0` に設定すると、すべての重みは 1.0 になります。<br />有効な値: 浮動小数点、範囲: 負以外の浮動小数点数。<br />デフォルト値: `1.0`。 | 
| boosting\_type | ブースティングスキーム。「自動」とは、`boosting_type` が処理ユニットの種類、トレーニングデータセット内のオブジェクト数、選択した学習モードに基づいて選択されることを意味します。<br />有効な値: 文字列、(`"Auto"`, `"Ordered"`, `"Plain"`) のいずれかです。<br />デフォルト値: `"Auto"`。 | 
| scale\_pos\_weight | 二項分類における正のクラスのウェイト。この値は、正のクラスのオブジェクトのウェイトの乗数として使用されます。<br />有効な値: 浮動小数点、範囲: 正の浮動小数。<br />デフォルト値: `1.0`。 | 
| max\_bin | 数値機能の分割数です。`"Auto"` は `max_bin` が処理ユニットのタイプやその他のパラメータに基づいて選択されることを意味します。詳細については、CatBoost のドキュメントを参照してください。<br />有効な値: 文字列、(`"Auto"` または `"1"` から `"65535"` までの整数の文字列) のいずれか。<br />デフォルト値: `"Auto"`。 | 
| grow\_policy | ツリー成長ポリシー。貪欲なツリー構造の実行方法を定義します。<br />有効な値: 文字列、(`"SymmetricTree"`、`"Depthwise"` または `"Lossguide"`) のいずれか。<br />デフォルト値: `"SymmetricTree"`。 | 
| random\_seed | トレーニングに使用するランダムシード。<br />有効な値: 整数、範囲: 負以外の整数。<br />デフォルト値: `1.0`。 | 
| thread\_count | トレーニング中に使用するスレッド数。`thread_count` が `-1` の場合、スレッド数はプロセッサコアの数と等しくなります。`0` を `thread_count` にすることはできません。<br />有効な値: 整数、(`-1` または正の整数) のいずれか。<br />デフォルト値: `-1`。 | 
| verbose | 印刷メッセージの冗長性です。レベルが高いほど、印刷ステートメントはより詳細になります。<br />有効な値: 整数、範囲: 正の整数。<br />デフォルト値: `1`。 | 