Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Formación de un modelo de aprendizaje por refuerzo en AWS DeepRacer Student
<a name="train-model"></a>

Este tutorial muestra cómo entrenar tu primer modelo en AWS DeepRacer Student. También le proporciona algunos consejos útiles que le ayudarán a aprovechar al máximo su experiencia y acelerar su aprendizaje. 

## Paso 1: Entrena un modelo de aprendizaje por refuerzo con Student AWS DeepRacer
<a name="student-league-train-model-proc"></a>

Comience su viaje en AWS DeepRacer Student aprendiendo dónde encontrar el botón **Crear modelo** y comience a entrenar su primer modelo. Tenga en cuenta que crear y entrenar un modelo es un proceso repetitivo. Experimente con diferentes algoritmos y funciones de recompensa para lograr los mejores resultados. 

**Cómo entrenar un modelo de aprendizaje por refuerzo**

1. En la página de **inicio** del AWS DeepRacer estudiante, selecciona **Crear un modelo**. Como alternativa, vaya a **Sus modelos** en el panel de navegación en la parte izquierda. En la página **Modelos**, en **Sus modelos**, seleccione **Crear modelo**. 

1. En la página **Descripción general**, obtenga más información acerca de cómo entrenar un modelo de refuerzo. En esta página se explica cada paso del proceso. Cuando haya terminado de leerlo, elija **Siguiente**. 

## Paso 2: asignar un nombre al modelo
<a name="student-league-create-model-step-two"></a>

Póngale un nombre a su modelo. Es una buena práctica dar a los modelos nombres únicos para localizarlos rápidamente cuando desee mejorarlos o clonarlos. Por ejemplo, es posible que desee nombrar sus modelos utilizando una convención de nomenclatura como:*yourinitials-date-version*.

**Cómo poner un nombre a su modelo**

1. En la página **Asignar un nombre a su modelo**, introduzca un nombre en el campo **Nombre del modelo**. 
**nota**  
Al empezar a entrenar un modelo, el nombre del modelo pasa a ser fijo y ya no se puede cambiar.

1. Elija **Siguiente**.

## Paso 3: elegir su pista
<a name="student-league-create-model-step-three"></a>

Elija su pista de simulación. La pista sirve como entorno y proporciona datos a su vehículo. Si elige una pista muy compleja, su vehículo requerirá un tiempo total de entrenamiento más prolongado y la función de recompensa que utilizará será más compleja.

**Cómo elegir su pista (entorno)**

1. En la página **Elegir pista**, elija una pista que sirva de entorno de entrenamiento para su vehículo. 

1. Elija **Siguiente**.

## Paso 4: elegir un algoritmo
<a name="student-league-create-model-step-four"></a>

El AWS DeepRacer estudiante tiene dos algoritmos de entrenamiento entre los que elegir. Los diferentes algoritmos maximizan las recompensas de distintas formas. Para aprovechar al máximo su experiencia como AWS DeepRacer estudiante, experimente con ambos algoritmos. Para obtener más información sobre los algoritmos, consulte [AWS DeepRacer Entrenamiento de algoritmos](https://docs.aws.amazon.com/deepracer/latest/developerguide/deepracer-how-it-works-reinforcement-learning-algorithm.html). 

**Cómo elegir un algoritmo de entrenamiento**

1. En la página **Elegir el tipo de algoritmo**, seleccione un tipo de algoritmo. Hay dos tipos de algoritmos disponibles:
   +  **Optimización de políticas proximales (PPO)**. Este algoritmo estable pero hambriento de datos funciona de manera consistente entre las repeticiones de entrenamiento. 
   +  **Actor crítico suave (SAC)**. Este algoritmo inestable pero eficiente en términos de datos puede funcionar de manera inconsistente entre las repeticiones de entrenamiento. 

1. Elija **Siguiente**.

## Paso 5: personalizar su función de recompensa
<a name="student-league-create-model-step-five"></a>

La función de recompensa es una parte fundamental del aprendizaje por refuerzo. Úsela para incentivar a su vehículo (agente) a realizar acciones específicas mientras explora la pista (entorno). Del mismo modo que estimularía y desalentaría ciertos comportamientos en una mascota, puede utilizar esta herramienta para animar a su vehículo a completar una vuelta lo más rápido posible y evitar que se salga de la pista y haga zigzag. 

Cuando entrene a su primer modelo, quizás quiera usar una función de recompensa de muestra predeterminada. Cuando esté listo para probar y optimizar su modelo, puede personalizar la función de recompensa editando el código en el editor de códigos. Para obtener más información acerca de cómo personalizar una función de recompensa, consulte [Personalización de una función de recompensa](reward-function.md).

**Cómo personalizar su función de recompensa**

1. En la página **Personalizar la función de recompensa**, seleccione un ejemplo de función de recompensa. Hay tres ejemplos de funciones de recompensa disponibles que puede personalizar:
   + **Seguir la línea central**. Recompense a su vehículo cuando conduzca de forma autónoma lo más cerca posible de la línea central de la pista.
   + **Mantenerse dentro las líneas**. Recompense a su vehículo cuando conduzca de forma autónoma, manteniendo las cuatro ruedas dentro de los límites de la pista.
   + **Evitar la conducción en zigzag**. Recompense a su vehículo por permanecer cerca de la línea central. Penalice a su vehículo si utiliza ángulos de dirección altos o se desvía del camino.
**nota**  
Si no quiere personalizar la función de recompensa, seleccione **Siguiente**.

1. (Opcional) Modifique el código de la función de recompensa. 
   + Seleccione un ejemplo de función de recompensa y seleccione **Explícame este código**. 
   + Para ver más información sobre cada sección del código, seleccione el signo **\$1** para que aparezca un cuadro de texto emergente con texto explicativo. Avance en el tutorial del código seleccionando **Siguiente** en cada ventana emergente. Para salir de un cuadro de texto emergente, seleccione la **X** de la esquina. Para abandonar el tutorial, seleccione **Finalizar**.
**nota**  
Puede optar por no editar el código de la función de recompensa de muestra seleccionando **Usar el código predeterminado**.
   + Si lo desea, edite el código de la función de recompensa de muestra seleccionando una función de recompensa de muestra y eligiendo **Editar código de muestra**. Edite el código y seleccione **Validar** para comprobar el código. Si el código no se puede validar o si quiere restablecerlo a su estado original, seleccione **Restablecer**. 

1. Elija **Siguiente**.

## Paso 6: elegir la duración y enviar su modelo a la tabla de clasificación
<a name="student-league-create-model-step-six"></a>

La duración del entrenamiento de su modelo afecta a su rendimiento. Cuando esté en la fase inicial del entrenamiento, debería empezar con un valor pequeño para este parámetro y luego entrenar progresivamente durante periodos de tiempo más prolongados. 

En este paso del entrenamiento del modelo, el modelo entrenado se envía a una tabla de clasificación. Si no desea continuar, desmarque la casilla de verificación.

**Cómo elegir la duración y enviar un modelo a la tabla de clasificación**

1. En la página **Elegir duración**, seleccione una hora en **Elegir la duración del entrenamiento del modelo**. 

1. En el campo **Descripción del modelo**, introduzca una descripción útil para su modelo que le ayude a recordar las selecciones que ha realizado. 
**sugerencia**  
Se recomienda añadir información sobre el modelo, como las selecciones y modificaciones actuales de la función de recompensa y el algoritmo, así como sus hipótesis sobre el rendimiento del modelo.

1. Seleccione la casilla de verificación para que su modelo se envíe automáticamente a la tabla de clasificación de AWS DeepRacer estudiantes una vez finalizada la formación. Si lo desea, puede optar por no introducir su modelo desmarcando la casilla de verificación.
**sugerencia**  
Le recomendamos que envíe su modelo a la tabla de clasificación. Al enviar su modelo, podrá compararlo con los demás y recibir información para que pueda mejorarlo. 

1. Elija **Entrene su modelo**.

1. En la ventana emergente **Iniciar el entrenamiento del modelo**, seleccione **Aceptar**.

1. En la página **Configuración del entrenamiento**, puede revisar el estado y la configuración del entrenamiento de su modelo. También puede ver un vídeo del entrenamiento de su modelo en la pista seleccionada cuando el **Estado** del entrenamiento esté **En curso**. Ver el vídeo puede ayudarle a obtener información valiosa que podrá utilizar para mejorar su modelo. 

## Paso 7: ver el rendimiento de su modelo en la tabla de clasificación
<a name="student-league-create-model-step-seven"></a>

Una vez que haya entrenado su modelo y lo haya enviado a una tabla de clasificación, podrá ver su rendimiento. 

**Cómo ver el rendimiento de su modelo**

1. En el panel de navegación de la izquierda, vaya a **Competir**. Elija una temporada. En la página **Clasificación**, aparecen su modelo y su rango en una sección. La página también incluye una sección de **Clasificación** con una lista de los modelos presentados, detalles de la carrera y una sección de **Detalles de la carrera**.

1. En la página que muestra la tabla de clasificación, en la sección de su perfil, seleccione **Ver vídeo** para ver un vídeo del rendimiento de su modelo.

## Paso 8: usar **Clonar** para mejorar su modelo
<a name="student-league-create-model-step-eight"></a>

Una vez que haya entrenado y, si lo desea, enviado su modelo a una tabla de clasificación, podrá clonarlo para mejorarlo. La clonación del modelo le ahorra pasos y hace que el entrenamiento sea más eficaz, ya que utiliza un modelo previamente entrenado como punto de partida para un modelo nuevo. 

**Cómo clonar y mejorar un modelo**

1. En AWS DeepRacer Student, en el panel de navegación izquierdo, **dirígete a Tus** modelos.

1. En la página **Sus modelos**, seleccione un modelo y elija **Clonar**.

1. En el campo **Asignar un nombre a su modelo**, introduzca un nombre nuevo para el modelo clonado y seleccione **Siguiente**.

1. En la página **Personalizar una función de recompensa**, personalice la función de recompensa y luego seleccione **Siguiente**. Para obtener más información acerca de cómo personalizar una función de recompensa, consulte [Paso 5: personalizar su función de recompensa](#student-league-create-model-step-five). 

1. En la página **Elegir duración**, introduzca una hora en el campo **Elegir la duración del entrenamiento del modelo**, introduzca una descripción en el campo **Descripción del modelo** y seleccione la casilla de verificación para enviar el modelo clonado a la tabla de clasificación.

1. Elija **Entrene su modelo**. Se ha iniciado su entrenamiento. Aparece la página **Configuración del entrenamiento** con información sobre el modelo clonado. También puede ver un vídeo del entrenamiento de su modelo en la pista seleccionada cuando el **Estado** del entrenamiento esté **En curso**. 

1. Siga clonando y modificando sus modelos previamente entrenados para conseguir su mejor rendimiento en la clasificación.

## Paso 9: (opcional) descargar un modelo
<a name="student-league-create-model-step-nine"></a>

Después de entrenar un modelo y, si lo desea, de enviarlo a la tabla de clasificación, es posible que desee descargarlo para usarlo en un dispositivo AWS DeepRacer físico en el futuro. El modelo se guarda como un archivo `.tar.gz`.

**Cómo descargar un modelo**

1. En AWS DeepRacer Student, en el panel de navegación izquierdo, **dirígete a Tus modelos**.

1. En la página **Sus modelos**, seleccione un modelo y luego haga clic en **Descargar**.

1. Siga el estado de la descarga del modelo en su navegador. Cuando descargue su modelo, puede guardarlo en su disco duro local o en otro dispositivo de almacenamiento preferido.

   Para obtener más información sobre cómo trabajar con AWS DeepRacer dispositivos, consulte [Opere su AWS DeepRacer vehículo](https://docs.aws.amazon.com/deepracer/latest/developerguide/operate-deepracer-vehicle.html) en la *AWS DeepRacer guía*.