

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# CatBoost 超參數
<a name="catboost-hyperparameters"></a>

下表包含 Amazon SageMaker AI CatBoost 演算法所需或最常用的超參數子集。使用者設定參數，並用來協助從資料預估模型參數。SageMaker AI CatBoost 演算法是開放原始碼 [CatBoost](https://github.com/catboost/catboost) 套件的實作。

**注意**  
預設超參數是根據[CatBoost 範例筆記本](catboost.md#catboost-sample-notebooks)中的範例資料集。

依預設，SageMaker AI CatBoost 演算法會根據分類問題的類型自動選擇評估量度和損耗函式。CatBoost 演算法會根據資料中的標籤數量來偵測分類問題的類型。對於迴歸問題，評估量度和損耗函式都是均方根誤差。對於二進制分類問題，評估量度是曲線下面積 (AUC)，而遺失函式是記錄遺失。對於多類分類問題，評估度量和損耗函式是多類交叉熵。您可以使用`eval_metric`超參數來變更預設評估測量結果。如需有關 LightGBM 超參數的詳細資訊，包括說明、有效值和預設值，請參閱下表。


| 參數名稱 | Description | 
| --- | --- | 
| iterations |  可建立的樹數量上限。 有效值：整數，範圍：正整數。 預設值：`500`。  | 
| early\$1stopping\$1rounds |  如果一個驗證資料點的一個指標在上`early_stopping_rounds`輪中沒有改善，則訓練將停止。如果`early_stopping_rounds`小於或等於零，則會忽略此超參數。 有效值：整數。 預設值：`5`。  | 
| eval\$1metric |  驗證資料的評估指標。如果設`eval_metric`為預設`"auto"`值，則演算法會根據分類問題類型自動選擇評估量度： [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/catboost-hyperparameters.html) 有效值：字串，請參閱 [CatBoost 文件](https://catboost.ai/en/docs/references/eval-metric__supported-metrics)以取得有效值。 預設值：`"auto"`。  | 
| learning\$1rate |  檢視每批訓練範例後，模型權重的更新率。 有效值：浮點數、範圍：(`0.0`, `1.0`)。 預設值：`0.009`。  | 
| depth |  樹的深度。 有效值：整數,範圍：(`1`，`16`)。 預設值：`6`。  | 
| l2\$1leaf\$1reg |  係數用於成本函式的 L2 正規化項。 有效值：整數，範圍：正整數。 預設值：`3`。  | 
| random\$1strength |  選取樹狀結構時，用於評分分割的隨機性量。使用此參數可避免過度擬合模型。 有效值：浮點數，範圍：正浮點數。 預設值：`1.0`。  | 
| max\$1leaves |  結果樹中葉子的最大數量。只能與`"Lossguide"`增長政策搭配使用。 有效值：整數,範圍：[`2`, `64`]。 預設值：`31`。  | 
| rsm |  隨機子空間方法。隨機再次選取圖徵時，每次分割選取時要使用的圖徵百分比。 有效值：浮點數、範圍：(`0.0`, `1.0`]。 預設值：`1.0`。  | 
| sampling\$1frequency |  建立樹木時採樣權重和物件的頻率。 有效值：字串，可以是：(`"PerTreeLevel"` 或 `"PerTree"`)。 預設值：`"PerTreeLevel"`。  | 
| min\$1data\$1in\$1leaf |  葉中訓練樣本的最小數量。CatBoost 不會搜尋葉子中樣本計數小於指定值的新分割。只能與 `"Lossguide"` 和 `"Depthwise"` 增長政策搭配使用。 有效值：整數,範圍：(`1` 或 `∞`)。 預設值：`1`。  | 
| bagging\$1temperature |  定義貝葉斯引導程序的設置。使用貝葉斯引導程序為對象分配隨機權重。如果設定`bagging_temperature`為`1.0`，則會從指數分佈中取樣權數。如果設定`bagging_temperature`為`0.0`，則所有寬度都為 1.0。 有效值：浮點數，範圍：非負浮點數。 預設值：`1.0`。  | 
| boosting\$1type |  提升計劃。“自動” 表示 `boosting_type` 根據處理單元類型、訓練資料集中的物件數目以及選取的學習模式來選取。 有效值：字串，下列任一項：(`"Auto"`, `"Ordered"`, `"Plain"`)。 預設值：`"Auto"`。  | 
| scale\$1pos\$1weight |  在二進制分類正類的權重。該值被用作從正類對象的權重的乘數。 有效值：浮點數，範圍：正浮點數。 預設值：`1.0`。  | 
| max\$1bin |  數值特徵的分割數。`"Auto"`表示`max_bin`為根據處理單元類型和其他參數進行選擇。如需詳細資訊，請參閱 CatBoost 文件。 有效值：字串，可以是：(`"Auto"` 或整數字串包含 `"1"` 到 `"65535"`)。 預設值：`"Auto"`。  | 
| grow\$1policy |  樹生長政策。定義如何執行貪婪樹建構模組。 有效值：字串，下列任一項：(`"SymmetricTree"`, `"Depthwise"`,或 `"Lossguide"`)。 預設值：`"SymmetricTree"`。  | 
| random\$1seed |  用於訓練的隨機種子。 有效值：整數，範圍：非負整數。 預設值：`1.0`。 | 
| thread\$1count |  訓練期間要使用的執行緒數目。如果`thread_count`是`-1`，則執行緒數目等於處理器核心的數目。`thread_count`不可以為`0`。 有效值：正整數，可以是：(`-1`或正整數)。 預設值：`-1`。  | 
| verbose |  列印訊息的詳細程度，較高的層次與更詳細的列印對帳單相對應。 有效值：整數，範圍：正整數。 預設值：`1`。  | 