

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Menyetel Sequence-to-Sequence Model
<a name="seq-2-seq-tuning"></a>

*Penyetelan model otomatis*, juga dikenal sebagai tuning hyperparameter, menemukan versi terbaik dari model dengan menjalankan banyak pekerjaan yang menguji berbagai hiperparameter pada kumpulan data Anda. Anda memilih hyperparameters yang dapat disetel, rentang nilai untuk masing-masing, dan metrik objektif. Anda memilih metrik objektif dari metrik yang dihitung oleh algoritme. Penyetelan model otomatis mencari hiperparameter yang dipilih untuk menemukan kombinasi nilai yang menghasilkan model yang mengoptimalkan metrik objektif.

Untuk informasi selengkapnya tentang penyetelan model, lihat[Penyetelan model otomatis dengan AI SageMaker](automatic-model-tuning.md).

## Metrik yang Dihitung oleh Algoritma Sequence-to-Sequence
<a name="seq-2-seq-metrics"></a>

Algoritma urutan ke urutan melaporkan tiga metrik yang dihitung selama pelatihan. Pilih salah satunya sebagai tujuan untuk mengoptimalkan saat menyetel nilai hyperparameter.


| Nama Metrik | Deskripsi | Arah Optimasi | 
| --- | --- | --- | 
| validation:accuracy | Akurasi dihitung pada dataset validasi. | Maksimalkan | 
| validation:bleu | Skor [Bleu](https://en.wikipedia.org/wiki/BLEU) dihitung pada dataset validasi. Karena komputasi BLEU mahal, Anda dapat memilih untuk menghitung BLEU pada subsampel acak dari kumpulan data validasi untuk mempercepat proses pelatihan secara keseluruhan. Gunakan `bleu_sample_size` parameter untuk menentukan subsampel. | Maksimalkan | 
| validation:perplexity | [Perplexity](https://en.wikipedia.org/wiki/Perplexity), adalah fungsi kerugian yang dihitung pada dataset validasi. Kebingungan mengukur entropi silang antara sampel empiris dan distribusi yang diprediksi oleh model dan dengan demikian memberikan ukuran seberapa baik model memprediksi nilai sampel, Model yang pandai memprediksi sampel memiliki kebingungan yang rendah. | Minimalkan | 

## Hiperparameter yang dapat disetel Sequence-to-Sequence
<a name="seq-2-seq-tunable-hyperparameters"></a>

Anda dapat menyetel hyperparameter berikut untuk algoritma SageMaker AI Sequence to Sequence. Hiperparameter yang memiliki dampak terbesar pada metrik objektif urutan ke urutan adalah:`batch_size`,,, `optimizer_type` `learning_rate``num_layers_encoder`, dan. `num_layers_decoder`


| Nama Parameter | Jenis Parameter | Rentang yang Direkomendasikan | 
| --- | --- | --- | 
| num\_layers\_encoder | IntegerParameterRange | [1-10] | 
| num\_layers\_decoder | IntegerParameterRange | [1-10] | 
| batch\_size | CategoricalParameterRange | [16,32,64,128,256,512,1024,2048] | 
| optimizer\_type | CategoricalParameterRange | ['adam', 'sgd', 'rmsprop'] | 
| weight\_init\_type | CategoricalParameterRange | ['xavier', 'seragam'] | 
| weight\_init\_scale | ContinuousParameterRange | Untuk tipe xavier: MinValue: 2.0, MaxValue: 3.0 Untuk tipe seragam: MinValue: -1.0, MaxValue: 1.0 | 
| learning\_rate | ContinuousParameterRange | MinValue: 0.00005, MaxValue: 0.2 | 
| weight\_decay | ContinuousParameterRange | MinValue: 0.0, MaxValue: 0.1 | 
| momentum | ContinuousParameterRange | MinValue: 0,5, MaxValue: 0,9 | 
| clip\_gradient | ContinuousParameterRange | MinValue: 1.0, MaxValue: 5.0 | 
| rnn\_num\_hidden | CategoricalParameterRange | Hanya berlaku untuk jaringan saraf berulang (RNNs). [128,256,512,1024,2048]  | 
| cnn\_num\_hidden | CategoricalParameterRange | Hanya berlaku untuk jaringan saraf convolutional (). CNNs [128,256,512,1024,2048]  | 
| num\_embed\_source | IntegerParameterRange | [256-512] | 
| num\_embed\_target | IntegerParameterRange | [256-512] | 
| embed\_dropout\_source | ContinuousParameterRange | MinValue: 0.0, MaxValue: 0.5 | 
| embed\_dropout\_target | ContinuousParameterRange | MinValue: 0.0, MaxValue: 0.5 | 
| rnn\_decoder\_hidden\_dropout | ContinuousParameterRange | MinValue: 0.0, MaxValue: 0.5 | 
| cnn\_hidden\_dropout | ContinuousParameterRange | MinValue: 0.0, MaxValue: 0.5 | 
| lr\_scheduler\_type | CategoricalParameterRange | ['plateau\_reduce', 'fixed\_rate\_inv\_t', 'fixed\_rate\_inv\_sqrt\_t'] | 
| plateau\_reduce\_lr\_factor | ContinuousParameterRange | MinValue: 0,1, MaxValue: 0,5 | 
| plateau\_reduce\_lr\_threshold | IntegerParameterRange | [1-5] | 
| fixed\_rate\_lr\_half\_life | IntegerParameterRange | [10-30] | 