

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 线性学习器超参数
<a name="ll_hyperparameters"></a>

下表包含线性学习器算法的超参数。这些是由用户设置的参数，以便于从数据中评估模型参数。首先，按字母顺序列出必须设置的所需超参数。接下来，也按字母顺序列出可以设置的可选超参数。当超参数设置为时`auto`，Amazon SageMaker AI 将自动计算并设置该超参数的值。


| 参数名称 | 说明 | 
| --- | --- | 
| num\_classes | 响应变量的分类数量。该算法假定分类标记为 `0`、...、`num_classes - 1`。<br />`predictor_type` 为 `multiclass_classifier` 时**必需**。否则，算法将忽略它。<br />有效值：从 3 到 1000000 的整数 | 
| predictor\_type | 将目标变量的类型指定为二元分类、多元分类或回归。<br />**必填**<br />有效值：`binary_classifier`、`multiclass_classifier` 或 `regressor` | 
| accuracy\_top\_k | 当计算多元分类的前 k 个最大数准确率指标时，为 *k* 的值。如果模型将前 k 个最大数分数中的一个分配给实际标签，则将示例评分为正确。<br />**可选**<br />有效值：正整数<br />默认值：3  | 
| balance\_multiclass\_weights | 指定是否使用分类权重，这使得每个分类在损失函数中具有相同的重要性。仅当 `predictor_type` 为 `multiclass_classifier` 时使用。<br />**可选**<br />有效值：`true`、`false`<br />默认值：`false` | 
| beta\_1 | 一阶矩估计的指数衰减率。仅当 `optimizer` 值为 `adam` 时适用。<br />**可选**<br />有效值：`auto` 或 0 和 1.0 之间的浮点值<br />默认值：`auto` | 
| beta\_2 | 二阶矩估计的指数衰减率。仅当 `optimizer` 值为 `adam` 时适用。<br />**可选**<br />有效值：`auto` 或 0 和 1.0 之间的浮点整数值 <br />默认值：`auto` | 
| bias\_lr\_mult | 允许偏移项有不同的学习率。偏移的实际学习率是 `learning_rate` \* `bias_lr_mult`。<br />**可选**<br />有效值：`auto` 或正的浮点整数<br />默认值：`auto` | 
| bias\_wd\_mult | 允许偏移项有不同的正则化。偏移的实际 L2 正则化权重是 `wd` \* `bias_wd_mult`。默认情况下，偏移项上没有正则化。<br />**可选**<br />有效值：`auto` 或非负浮点整数<br />默认值：`auto` | 
| binary\_classifier\_model\_selection\_criteria | 当 `predictor_type` 设置为 `binary_classifier` 时，验证数据集的模型评估标准（或者，如果未提供验证数据集，则为训练数据集）。标准包括：[See the AWS documentation website for more details](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/ll_hyperparameters.html)<br />**可选**<br />有效值：`accuracy`、`f_beta`、`precision_at_target_recall`、`recall_at_target_precision` 或 `loss_function`<br />默认值：`accuracy` | 
| early\_stopping\_patience | 如果在相关指标中没有改进，则在结束训练前等待的纪元数。如果您提供了 binary\_classifier\_model\_selection\_criteria 的值，则指标就是该值。否则，指标与为 loss 超参数指定的值相同。该指标是在验证数据上评估的。如果未提供验证数据，则该指标始终与为 `loss` 超参数指定的值相同，并在训练数据上进行评估。要禁用提前停止，请将 `early_stopping_patience` 设置为大于为 `epochs` 指定的值。<br />**可选**<br />有效值：正整数<br />默认值：3 | 
| early\_stopping\_tolerance | 用于评估损失改善的相对容差。如果损失改善除以上一个最佳损失的比率小于此值，则提前停止逻辑会认为改善是零。<br />**可选**<br />有效值：正的浮点整数<br />默认值：0.001 | 
| epochs | 扫描训练数据的最大次数。<br />**可选**<br />有效值：正整数<br />默认值：15 | 
| f\_beta | 在计算二元分类或多元分类的 F 分数指标时使用的 Beta 值。如果为 `binary_classifier_model_selection_criteria` 指定的值为 `f_beta`，也会使用此选项。<br />**可选**<br />有效值：正的浮点整数<br />默认值：1.0  | 
| feature\_dim | 输入数据中的特征数。<br />**可选**<br />有效值：`auto` 或正整数<br />默认值：`auto` | 
| huber\_delta | 用于 Huber 损失的参数。在训练和指标评估过程中，对小于增量的错误计算 L2 损失，对大于增量的错误计算 L1 损失。<br />**可选**<br />有效值：正的浮点整数<br />默认值：1.0  | 
| init\_bias | 偏移项的初始权重。<br />**可选**<br />有效值：浮点整数<br />默认值：0 | 
| init\_method | 设置用于模型权重的初始分布函数。函数包括：[See the AWS documentation website for more details](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/ll_hyperparameters.html)<br />**可选**<br />有效值：`uniform` 或 `normal`<br />默认值：`uniform` | 
| init\_scale | 扩展模型权重的初始均匀分布。仅当 `init_method` 超参数设置为 `uniform` 时适用。<br />**可选**<br />有效值：正的浮点整数<br />默认值：0.07 | 
| init\_sigma | 正态分布的初始标准差。仅当 `init_method` 超参数设置为 `normal` 时适用。<br />**可选**<br />有效值：正的浮点整数<br />默认值：0.01 | 
| l1 | L1 正则化参数。如果不希望使用 L1 正则化，请将此值设置为 0。<br />**可选**<br />有效值：`auto` 或非负浮点值<br />默认值：`auto` | 
| learning\_rate | 优化程序用于参数更新的步长。<br />**可选**<br />有效值：`auto` 或正的浮点整数<br />默认值：`auto`，其值取决于选择的优化程序。 | 
| loss | 指定损失函数。<br />可用的损失函数及其默认值取决于 `predictor_type` 的值：[See the AWS documentation website for more details](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/ll_hyperparameters.html)<br />有效值：`auto`、`logistic`、`squared_loss`、`absolute_loss`、`hinge_loss`、`eps_insensitive_squared_loss`、`eps_insensitive_absolute_loss`、`quantile_loss` 或 `huber_loss` <br />**可选**<br />默认值：`auto` | 
| loss\_insensitivity | epsilon 不敏感损失类型的参数。在训练和指标评估过程中，任何小于此值的误差都被认为是零。<br />**可选**<br />有效值：正的浮点整数<br />默认值：0.01  | 
| lr\_scheduler\_factor | 对于每个 `lr_scheduler_step` 超参数，学习率按此数量减少。仅当 `use_lr_scheduler` 超参数设置为 `true` 时适用。<br />**可选**<br />有效值：`auto` 或 0 和 1 之间正的浮点整数值<br />默认值：`auto` | 
| lr\_scheduler\_minimum\_lr | 学习率降低到的值永远不会低于为 `lr_scheduler_minimum_lr` 设置的值。仅当 `use_lr_scheduler` 超参数设置为 `true` 时适用。<br />**可选**<br />有效值：`auto` 或正的浮点整数<br />默认值：`auto` | 
| lr\_scheduler\_step | 学习率下降之间的步骤数。仅当 `use_lr_scheduler` 超参数设置为 `true` 时适用。<br />**可选**<br />有效值：`auto` 或正整数<br />默认值：`auto` | 
| margin | `hinge_loss` 函数的间隔。<br />**可选**<br />有效值：正的浮点整数<br />默认值：1.0 | 
| mini\_batch\_size | 用于数据迭代器的每个小批量的观察次数。<br />**可选**<br />有效值：正整数<br />默认值：1000 | 
| momentum | `sgd` 优化程序的动量。<br />**可选**<br />有效值：`auto` 或 0 和 1.0 之间的浮点整数值<br />默认值：`auto` | 
| normalize\_data | 在训练之前标准化特征数据。数据标准化将各个特征的数据转换为具有平均值零并进行缩放以获得单位标准偏差。<br />**可选**<br />有效值：`auto`、`true` 或 `false`<br />默认值：`true` | 
| normalize\_label | 对标签进行标准化。标签标准化将标签移动到平均值零，并将其缩放为具有单位标准偏差。<br />`auto` 默认值标准化回归问题的标签，但不标准化分类问题的标签。对于分类问题，如果您将 `normalize_label` 超参数设置为 `true`，该算法将忽略它。<br />**可选**<br />有效值：`auto`、`true` 或 `false`<br />默认值：`auto` | 
| num\_calibration\_samples | 验证数据集中用于模型校准的观察次数（在查找最佳阈值时）。<br />**可选**<br />有效值：`auto` 或正整数<br />默认值：`auto` | 
| num\_models | 并行训练的模型数。对于默认值 `auto`，算法决定训练的并行模型数。一个模型根据给定的训练参数 (正则化、优化程序、损耗) 进行训练，其余模型根据接近的参数进行训练。<br />**可选**<br />有效值：`auto` 或正整数<br />默认值：`auto` | 
| num\_point\_for\_scaler | 用于计算标准化或取消偏移项的数据点数量。<br />**可选**<br />有效值：正整数<br />默认值：10,000 | 
| optimizer | 要使用的优化算法。<br />**可选**<br />有效值：[See the AWS documentation website for more details](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/ll_hyperparameters.html)<br />默认值：`auto`。`auto` 的默认设置是 `adam`。 | 
| positive\_example\_weight\_mult | 在训练二元分类器时分配给正示例的权重。负示例的权重固定为 1。如果您希望算法选择一个权重，以使分类负示例*与* 正示例时发生的错误对训练损失有相同的影响，请指定 `balanced`。如果希望算法选择优化性能的权重，请指定 `auto`。<br />**可选**<br />有效值：`balanced`、`auto` 或正的浮点整数<br />默认值：1.0 | 
| quantile | 分位数损失的分位数。对于分位数 q，模型将尝试生成预测，以便 `true_label` 的值大于概率 q 的预测。<br />**可选**<br />有效值：0 和 1 之间的浮点整数值<br />默认值：0.5 | 
| target\_precision | 目标查准率。如果 `binary_classifier_model_selection_criteria` 是 `recall_at_target_precision`，则查准率保持为此值，同时查全率最大化。<br />**可选**<br />有效值：0 和 1.0 之间的浮点整数值<br />默认值：0.8 | 
| target\_recall | 目标查全率。如果 `binary_classifier_model_selection_criteria` 是 `precision_at_target_recall`，则查全率保持在此值，同时查准率最大化。<br />**可选**<br />有效值：0 和 1.0 之间的浮点整数值<br />默认值：0.8 | 
| unbias\_data | 在训练前对特性取消偏移以使平均值为 0。默认情况下，如果 `use_bias` 超参数设置为 `true`，则对数据取消偏移。<br />**可选**<br />有效值：`auto`、`true` 或 `false`<br />默认值：`auto` | 
| unbias\_label | 在训练前对标签取消偏移以使平均值为 0。仅当 `use_bias` 超参数设置为 `true` 时才适用于回归。<br />**可选**<br />有效值：`auto`、`true` 或 `false`<br />默认值：`auto` | 
| use\_bias | 指定模型是否应包含偏移项，即线性等式中的截距项。<br />**可选**<br />有效值：`true` 或 `false`<br />默认值：`true` | 
| use\_lr\_scheduler | 是否对学习率使用计划程序。如果要使用计划程序，请指定 `true`。<br />**可选**<br />有效值：`true` 或 `false`<br />默认值：`true` | 
| wd | 权重衰减参数，也称为 L2 正则化参数。如果不希望使用 L2 正则化，请将此值设置为 0。<br />**可选**<br />有效值：`auto` 或非负浮点整数<br />默认值：`auto` | 