

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Ajuste un Sequence-to-Sequence modelo
<a name="seq-2-seq-tuning"></a>

El *ajuste de modelo automático*, también conocido como ajuste de hiperparámetros, encuentra la mejor versión de un modelo ejecutando muchas tareas que probar una serie de hiperparámetros en su conjunto de datos. Usted elige los hiperparámetros que pueden ajustarse, un rango de valores para cada uno de ellos y una métrica objetiva. Puede elegir la métrica objetiva de las métricas que el algoritmo computa. El ajuste de modelo automático busca los hiperparámetros elegidos para encontrar la combinación de valores que obtienen el modelo que optimiza la métrica objetiva.

Para obtener más información acerca del ajuste de modelos, consulte [Ajuste automático de modelos con IA SageMaker](automatic-model-tuning.md).

## Métricas calculadas por el Sequence-to-Sequence algoritmo
<a name="seq-2-seq-metrics"></a>

El algoritmo de secuencia a secuencia informa sobre tres métricas que se calculan durante la capacitación. Elija una de ellas como objetivo para optimizar al ajustar los valores de hiperparámetro.


| Nombre de métrica | Description (Descripción) | Dirección de optimización | 
| --- | --- | --- | 
| validation:accuracy | Precisión calculada en el conjunto de datos de validación. | Maximizar | 
| validation:bleu | Puntuación [bleu﻿](https://en.wikipedia.org/wiki/BLEU) calculada en el conjunto de datos de validación. Como la computación BLEU es cara, puede elegir computar BLEU en una submuestra aleatoria del conjunto de datos de validación para acelerar el proceso de capacitación general. Use el parámetro `bleu_sample_size` para especificar la submuestra. | Maximizar | 
| validation:perplexity | [Perplejidad](https://en.wikipedia.org/wiki/Perplexity), es una función de pérdida computada en el conjunto de datos de validación. La perplejidad mide la entropía cruzada entre una muestra empírica y la distribución prevista por un modelo y de esta forma proporciona una medida de lo bien que un modelo predice los valores de muestra. Los modelos que son buenos prediciendo una muestra tienen una perplejidad baja. | Minimizar | 

## Hiperparámetros ajustables Sequence-to-Sequence
<a name="seq-2-seq-tunable-hyperparameters"></a>

Puede ajustar los siguientes hiperparámetros para el algoritmo SageMaker AI Sequence to Sequence. Los hiperparámetros que mayor impacto tienen en las métricas objetivas de secuencia a secuencia: `batch_size`, `optimizer_type`, `learning_rate`, `num_layers_encoder` y `num_layers_decoder`.


| Nombre del parámetro | Tipo de parámetro | Intervalos recomendados | 
| --- | --- | --- | 
| num\_layers\_encoder | IntegerParameterRange | [1-10] | 
| num\_layers\_decoder | IntegerParameterRange | [1-10] | 
| batch\_size | CategoricalParameterRange | [16,32,64,128,256,512,1024,2048] | 
| optimizer\_type | CategoricalParameterRange | ['adam', 'sgd', 'rmsprop'] | 
| weight\_init\_type | CategoricalParameterRange | ['xavier', 'uniform'] | 
| weight\_init\_scale | ContinuousParameterRange | Para el tipo xavier, escriba MinValue: 2.0, MaxValue: 3.0 Para el tipo uniforme: MinValue: -1.0, MaxValue: 1.0 | 
| learning\_rate | ContinuousParameterRange | MinValue: 0,00005, 0,2 MaxValue | 
| weight\_decay | ContinuousParameterRange | MinValue: 0,0, 0,1 MaxValue | 
| momentum | ContinuousParameterRange | MinValue: 0,5, MaxValue 0,9 | 
| clip\_gradient | ContinuousParameterRange | MinValue: 1,0, MaxValue 5,0 | 
| rnn\_num\_hidden | CategoricalParameterRange | Aplicable solo a redes neuronales recurrentes (RNNs). [128,256,512,1024,2048]  | 
| cnn\_num\_hidden | CategoricalParameterRange | Aplicable solo a redes neuronales convolucionales ()CNNs. [128,256,512,1024,2048]  | 
| num\_embed\_source | IntegerParameterRange | [256-512] | 
| num\_embed\_target | IntegerParameterRange | [256-512] | 
| embed\_dropout\_source | ContinuousParameterRange | MinValue: 0.0, MaxValue: 0.5 | 
| embed\_dropout\_target | ContinuousParameterRange | MinValue: 0,0, MaxValue 0,5 | 
| rnn\_decoder\_hidden\_dropout | ContinuousParameterRange | MinValue: 0,0, MaxValue 0,5 | 
| cnn\_hidden\_dropout | ContinuousParameterRange | MinValue: 0,0, MaxValue 0,5 | 
| lr\_scheduler\_type | CategoricalParameterRange | ['plateau\_reduce', 'fixed\_rate\_inv\_t', 'fixed\_rate\_inv\_sqrt\_t'] | 
| plateau\_reduce\_lr\_factor | ContinuousParameterRange | MinValue: 0,1, MaxValue 0,5 | 
| plateau\_reduce\_lr\_threshold | IntegerParameterRange | [1-5] | 
| fixed\_rate\_lr\_half\_life | IntegerParameterRange | [10-30] | 