

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Sequence-to-Sequence Iperparametri
<a name="seq-2-seq-hyperparameters"></a>

La tabella seguente elenca gli iperparametri che puoi impostare durante l'allenamento con l'algoritmo Amazon SageMaker AI Sequence-to-Sequence (seq2seq).


| Nome parametro | Description | 
| --- | --- | 
| batch\_size | Dimensioni del mini-batch per la discesa del gradiente.<br />**Opzionale**<br />Valori validi: numeri interi positivi<br />Valore predefinito: 64 | 
| beam\_size | Lunghezza del fascio per la relativa ricerca. Utilizzato durante l’addestramento per il calcolo di `bleu` e durante l'inferenza.<br />**Opzionale**<br />Valori validi: numeri interi positivi<br />Valore predefinito: 5 | 
| bleu\_sample\_size | Numero di istanze da cui prelevare il set di dati di convalida per decodificare e calcolare il punteggio `bleu` durante l’addestramento. Imposta su -1 per utilizzare il set completo di convalida (se `bleu` viene scelto come `optimized_metric`).<br />**Opzionale**<br />Valori validi: numero intero<br />Valore predefinito: 0 | 
| bucket\_width | Restituisce i bucket (di origine, di destinazione) fino a (`max_seq_len_source`, `max_seq_len_target`). La parte più lunga dei dati utilizza passaggi di, `bucket_width` mentre la parte più corta utilizza passaggi ridimensionati in base al rapporto di lunghezza medio. target/source Se un lato raggiunge la sua lunghezza massima prima dell'altro, la larghezza dei bucket extra su quel lato viene fissata su quel lato di `max_len`.<br />**Opzionale**<br />Valori validi: numeri interi positivi<br />Valore predefinito: 10 | 
| bucketing\_enabled | Imposta su `false` per disattivare il bucketing, svolgere alla lunghezza massima.<br />**Opzionale**<br />Valori validi: `true` o `false`<br />Valore predefinito: `true` | 
| checkpoint\_frequency\_num\_batches | Checkpoint e valutazione ogni x batch. Questo iperparametro di checkpoint viene passato all'algoritmo seq2seq dell' SageMaker IA per l'arresto anticipato e il recupero del modello migliore. Il checkpoint dell'algoritmo viene eseguito localmente nel contenitore di addestramento dell'algoritmo e non è compatibile con il checkpoint AI. SageMaker L'algoritmo salva temporaneamente i checkpoint su un percorso locale e memorizza l'artefatto del modello migliore nel percorso di output del modello in S3 dopo l'interruzione del processo di addestramento.<br />**Opzionale**<br />Valori validi: numeri interi positivi<br />Valore predefinito: 1000 | 
| checkpoint\_threshold | Numero massimo del modello di checkpoint consentito per non migliorare in `optimized_metric` sul set di dati di convalida prima che l’addestramento venga arrestato. Questo iperparametro di checkpoint viene passato all'algoritmo seq2seq dell' SageMaker IA per l'arresto anticipato e il recupero del modello migliore. Il checkpoint dell'algoritmo viene eseguito localmente nel contenitore di addestramento dell'algoritmo e non è compatibile con il checkpoint AI. SageMaker L'algoritmo salva temporaneamente i checkpoint su un percorso locale e memorizza l'artefatto del modello migliore nel percorso di output del modello in S3 dopo l'interruzione del processo di addestramento.<br />**Opzionale**<br />Valori validi: numeri interi positivi<br />Valore predefinito: 3 | 
| clip\_gradient | Ritagliare i valori di gradiente assoluto maggiori di questo. Impostare su negativo per disattivare.<br />**Opzionale**<br />Valori validi: float.<br />Valore predefinito: 1 | 
| cnn\_activation\_type | Il tipo di attivazione `cnn` da utilizzare.<br />**Opzionale**<br />Valori validi: stringa. Uno tra `glu`, `relu`, `softrelu`, `sigmoid` o `tanh`.<br />Valore predefinito: `glu` | 
| cnn\_hidden\_dropout | Probabilità di dropout tra layer convoluzionali.<br />**Opzionale**<br />Valori validi: Float. Intervallo in [0,1].<br />Valore predefinito: 0 | 
| cnn\_kernel\_width\_decoder | Larghezza kernel per il decodificatore `cnn`.<br />**Opzionale**<br />Valori validi: numeri interi positivi<br />Valore predefinito: 5 | 
| cnn\_kernel\_width\_encoder | Larghezza kernel per il codificatore `cnn`.<br />**Opzionale**<br />Valori validi: numeri interi positivi<br />Valore predefinito: 3 | 
| cnn\_num\_hidden | Numero di unità nascoste `cnn` per codificatore e decodificatore.<br />**Opzionale**<br />Valori validi: numeri interi positivi<br />Valore predefinito: 512 | 
| decoder\_type | Tipo di decodificatore.<br />**Opzionale**<br />Valori validi: stringa. `rnn` o `cnn`.<br />Valore predefinito: *rnn* | 
| embed\_dropout\_source | Probabilità di dropout per le integrazioni lato origine.<br />**Opzionale**<br />Valori validi: Float. Intervallo in [0,1].<br />Valore predefinito: 0 | 
| embed\_dropout\_target | Probabilità di dropout per le integrazioni lato destinazione.<br />**Opzionale**<br />Valori validi: Float. Intervallo in [0,1].<br />Valore predefinito: 0 | 
| encoder\_type | Tipo di codificatore. L'architettura `rnn` è basata sul meccanismo di attenzione di Bahdanau e altri e l'architettura *cnn* si basa su Gehring e altri<br />**Opzionale**<br />Valori validi: stringa. `rnn` o `cnn`.<br />Valore predefinito: `rnn` | 
| fixed\_rate\_lr\_half\_life | Half life per la velocità di apprendimento in termini di numero di checkpoint per i pianificatori `fixed_rate_`\*.<br />**Opzionale**<br />Valori validi: numeri interi positivi<br />Valore predefinito: 10 | 
| learning\_rate | Velocità di apprendimento iniziale.<br />**Opzionale**<br />Valori validi: float.<br />Valore predefinito: 0.0003 | 
| loss\_type | Funzione di perdita per l'apprendimento.<br />**Opzionale**<br />Valori validi: stringa. `cross-entropy`<br />Valore predefinito: `cross-entropy` | 
| lr\_scheduler\_type | Tipo di pianificatore della velocità di apprendimento. `plateau_reduce` indica una riduzione della velocità di apprendimento quando `optimized_metric` su livelli fissi di `validation_accuracy`. `inv_t` indica il decadimento temporale inverso. `learning_rate`/(1\+`decay_rate`\*t)<br />**Opzionale**<br />Valori validi: stringa. Uno tra `plateau_reduce`, `fixed_rate_inv_t` o `fixed_rate_inv_sqrt_t`.<br />Valore predefinito: `plateau_reduce` | 
| max\_num\_batches | Numero massimo di updates/batches da elaborare. -1 per infinito.<br />**Opzionale**<br />Valori validi: numero intero<br />Valore predefinito: -1 | 
| max\_num\_epochs | Numero massimo di epoch da trasmettere tramite i dati di addestramento prima che il fitting venga arrestato. L’addestramento continua fino a questo numero di epoch anche se la precisione di convalida non migliora trasmettendo questo parametro. Ignorato se non trasmesso.<br />**Opzionale**<br />Valori validi: numeri interi positivi minori o uguali a max\_num\_epochs.<br />Valore predefinito: nessuno | 
| max\_seq\_len\_source | Lunghezza massima per la sequenza di origine. Le sequenze più lunghe verranno troncate a questa lunghezza.<br />**Opzionale**<br />Valori validi: numeri interi positivi<br />Valore predefinito: 100 | 
| max\_seq\_len\_target | Lunghezza massima per la sequenza di destinazione. Le sequenze più lunghe verranno troncate a questa lunghezza.<br />**Opzionale**<br />Valori validi: numeri interi positivi<br />Valore predefinito: 100 | 
| min\_num\_epochs | Numero minimo di epoche (Unix epochs) che l’addestramento deve eseguire prima di essere arrestato dalle condizioni `early_stopping`.<br />**Opzionale**<br />Valori validi: numeri interi positivi<br />Valore predefinito: 0 | 
| momentum | Costante di momento utilizzata per `sgd`. Non trasmettere questo parametro se usi `adam` o `rmsprop`.<br />**Opzionale**<br />Valori validi: float.<br />Valore predefinito: nessuno | 
| num\_embed\_source | Dimensioni di incorporamento per i token di origine.<br />**Opzionale**<br />Valori validi: numeri interi positivi<br />Valore predefinito: 512 | 
| num\_embed\_target | Dimensioni di integrazione per i token di destinazione.<br />**Opzionale**<br />Valori validi: numeri interi positivi<br />Valore predefinito: 512 | 
| num\_layers\_decoder | Numero di livelli per decodificatore *rnn* o *cnn*.<br />**Opzionale**<br />Valori validi: numeri interi positivi<br />Valore predefinito: 1 | 
| num\_layers\_encoder | Numero di livelli per codificatore `rnn` o `cnn`.<br />**Opzionale**<br />Valori validi: numeri interi positivi<br />Valore predefinito: 1 | 
| optimized\_metric | Parametri per l'ottimizzazione con arresto precoce.<br />**Opzionale**<br />Valori validi: stringa. Uno tra `perplexity`, `accuracy` o `bleu`.<br />Valore predefinito: `perplexity` | 
| optimizer\_type | Ottimizzatore da cui scegliere.<br />**Opzionale**<br />Valori validi: stringa. Uno tra `adam`, `sgd` o `rmsprop`.<br />Valore predefinito: `adam` | 
| plateau\_reduce\_lr\_factor | Fattore con cui moltiplicare la velocità di apprendimento (per `plateau_reduce`).<br />**Opzionale**<br />Valori validi: float.<br />Valore predefinito: 0.5 | 
| plateau\_reduce\_lr\_threshold | Per il pianificatore `plateau_reduce`, moltiplicare la velocità di apprendimento con il fattore di riduzione se `optimized_metric` non è migliorato per i vari checkpoint.<br />**Opzionale**<br />Valori validi: numeri interi positivi<br />Valore predefinito: 3 | 
| rnn\_attention\_in\_upper\_layers | Trasmissione dell'attenzione ai livelli superiori di *rnn*, come il documento Google NMT. Applicabile solo se viene utilizzato più di un layer.<br />**Opzionale**<br />Valori validi: booleani (`true` o `false`)<br />Valore predefinito: `true` | 
| rnn\_attention\_num\_hidden | Numero di unità nascoste per i livelli di attenzione. Valore predefinito:`rnn_num_hidden`.<br />**Opzionale**<br />Valori validi: numeri interi positivi<br />Valore predefinito: `rnn_num_hidden` | 
| rnn\_attention\_type | Modello di attenzione per codificatori. `mlp` si riferisce a concat e bilinear si riferisce al concetto generale del documento di Luong e altri.<br />**Opzionale**<br />Valori validi: stringa. Uno tra `dot`, `fixed`, `mlp` o `bilinear`.<br />Valore predefinito: `mlp` | 
| rnn\_cell\_type | Tipo specifico di architettura `rnn`.<br />**Opzionale**<br />Valori validi: stringa. `lstm` o `gru`.<br />Valore predefinito: `lstm` | 
| rnn\_decoder\_state\_init | Modalità di inizializzazione degli stati del decodificatore `rnn` dai codificatori.<br />**Opzionale**<br />Valori validi: stringa. Uno tra `last`, `avg` o `zero`.<br />Valore predefinito: `last` | 
| rnn\_first\_residual\_layer | Primo livello *rnn* ad avere una connessione residua, applicabile solo se il numero di livelli nel codificatore o nel decodificatore è superiore a 1.<br />**Opzionale**<br />Valori validi: numeri interi positivi<br />Valore predefinito: 2 | 
| rnn\_num\_hidden | Numero di unità nascoste *rnn* per codificatore e decodificatore. Deve essere un multiplo di 2 in quanto per impostazione predefinita l'algoritmo utilizza la tecnica Long Term Short Term Memory (LSTM) bidirezionale.<br />**Opzionale**<br />Valori validi: numeri interi pari positivi<br />Valore predefinito: 1024 | 
| rnn\_residual\_connections | Aggiunta di connessione residua alla rete *rnn* nello stack. Il numero di layer deve essere superiore a 1.<br />**Opzionale**<br />Valori validi: booleani (`true` o `false`)<br />Valore predefinito: `false` | 
| rnn\_decoder\_hidden\_dropout | Probabilità di dropout per lo stato nascosto che combina il contesto con lo stato nascosto *rnn* nel decodificatore.<br />**Opzionale**<br />Valori validi: Float. Intervallo in [0,1].<br />Valore predefinito: 0 | 
| training\_metric | Parametri di tracciamento dell’addestramento sui dati di convalida.<br />**Opzionale**<br />Valori validi: stringa. `perplexity` o `accuracy`.<br />Valore predefinito: `perplexity` | 
| weight\_decay | Decadimento del peso costante.<br />**Opzionale**<br />Valori validi: float.<br />Valore predefinito: 0 | 
| weight\_init\_scale | Dimensionamento dell'inizializzazione del peso (per l'inizializzazione `uniform` e `xavier`). <br />**Opzionale**<br />Valori validi: float.<br />Valore predefinito: 2.34 | 
| weight\_init\_type | Tipo di inizializzazione del peso. <br />**Opzionale**<br />Valori validi: stringa. `uniform` o `xavier`.<br />Valore predefinito: `xavier` | 
| xavier\_factor\_type | Tipo di fattore xavier.<br />**Opzionale**<br />Valori validi: stringa. Uno tra `in`, `out` o `avg`.<br />Valore predefinito: `in` | 