

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 調校序列對序列模型
<a name="seq-2-seq-tuning"></a>

*自動模型調校*，又稱為超參數調校，會透過在您的資料集上，執行許多測試超參數範圍的任務，來尋找最佳版本的模型。您可以選擇可調校的超參數、每一個超參數的值範圍，及目標指標。您可以從演算法運算的指標中選擇目標指標。自動模型調校會搜尋所選擇的超參數，以找出產生之模型可最佳化目標指標的值組合。

如需模型調校的詳細資訊，請參閱[使用 SageMaker AI 執行自動模型調校](automatic-model-tuning.md)。

## 序列對序列演算法所運算的指標
<a name="seq-2-seq-metrics"></a>

序列對序列演算法會報告三個在訓練期間運算的指標。請在調校超參數值時選擇其中一個做為目標，以進行最佳化。


| 指標名稱 | 說明 | 最佳化方向 | 
| --- | --- | --- | 
| validation:accuracy | 驗證資料集上運算的準確度。 | 最大化 | 
| validation:bleu | 驗證資料集上運算的 [Bleu](https://en.wikipedia.org/wiki/BLEU) 分數。因為 BLEU 運算相當耗費資源，您可以選擇在驗證資料集的隨機部分樣本上運算 BLEU，來加速整體訓練程序。使用 `bleu_sample_size` 參數來指定部分樣本。 | 最大化 | 
| validation:perplexity | [Perplexity](https://en.wikipedia.org/wiki/Perplexity)，即在驗證資料集上運算的損失函式。Perplexity (困惑度) 會測量經驗樣本和模型所預測分布之間的交叉熵，藉此提供模型預測樣本值良好程度的指標。預測樣本時表現較佳的模型，困惑度較低。 | 最小化 | 

## 可調校序列對序列超參數
<a name="seq-2-seq-tunable-hyperparameters"></a>

您可以調校下列 SageMaker AI 序列對序列演算法的超參數。對序列對序列目標指標影響程度最大的超參數為：`batch_size`、`optimizer_type`、`learning_rate`、`num_layers_encoder` 和 `num_layers_decoder`。


| 參數名稱 | 參數類型 | 建議範圍 | 
| --- | --- | --- | 
| num\_layers\_encoder | IntegerParameterRange | [1-10] | 
| num\_layers\_decoder | IntegerParameterRange | [1-10] | 
| batch\_size | CategoricalParameterRange | [16,32,64,128,256,512,1024,2048] | 
| optimizer\_type | CategoricalParameterRange | ['adam', 'sgd', 'rmsprop'] | 
| weight\_init\_type | CategoricalParameterRange | ['xavier', 'uniform'] | 
| weight\_init\_scale | ContinuousParameterRange | 針對 xavier 類型：MinValue：2.0，MaxValue：3.0 針對 uniform 類型：MinValue：-1.0，MaxValue：1.0 | 
| learning\_rate | ContinuousParameterRange | MinValue：0.00005、MaxValue：0.2 | 
| weight\_decay | ContinuousParameterRange | MinValue：0.0、MaxValue：0.1 | 
| momentum | ContinuousParameterRange | MinValue：0.5、MaxValue：0.9 | 
| clip\_gradient | ContinuousParameterRange | MinValue：1.0、MaxValue：5.0 | 
| rnn\_num\_hidden | CategoricalParameterRange | 僅適用於遞迴神經網絡 (RNN)。[128,256,512,1024,2048]  | 
| cnn\_num\_hidden | CategoricalParameterRange | 僅適用於卷積神經網絡 (CNN)。[128,256,512,1024,2048]  | 
| num\_embed\_source | IntegerParameterRange | [256-512] | 
| num\_embed\_target | IntegerParameterRange | [256-512] | 
| embed\_dropout\_source | ContinuousParameterRange | MinValue：0.0、MaxValue：0.5 | 
| embed\_dropout\_target | ContinuousParameterRange | MinValue：0.0、MaxValue：0.5 | 
| rnn\_decoder\_hidden\_dropout | ContinuousParameterRange | MinValue：0.0、MaxValue：0.5 | 
| cnn\_hidden\_dropout | ContinuousParameterRange | MinValue：0.0、MaxValue：0.5 | 
| lr\_scheduler\_type | CategoricalParameterRange | ['plateau\_reduce', 'fixed\_rate\_inv\_t', 'fixed\_rate\_inv\_sqrt\_t'] | 
| plateau\_reduce\_lr\_factor | ContinuousParameterRange | MinValue：0.1、MaxValue：0.5 | 
| plateau\_reduce\_lr\_threshold | IntegerParameterRange | [1-5] | 
| fixed\_rate\_lr\_half\_life | IntegerParameterRange | [10-30] | 