Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Perfeccione los modelos Amazon Nova con ajustes de refuerzo
Antes de realizar los ajustes, asegúrese de cumplir con los requisitos previos, ya que Amazon Bedrock necesita permisos específicos para crear y gestionar el proceso de ajuste. Para obtener información completa sobre seguridad y permisos, consulte. Acceso y seguridad para los modelos Amazon Nova
Realice el ajuste preciso del refuerzo para los modelos de Amazon Nova en 5 pasos:
-
Proporcione un conjunto de datos de entrenamiento: cargue las instrucciones en el formato requerido (por ejemplo, JSONL) como conjunto de datos de entrenamiento para reforzar el ajuste. Para obtener más información, consulte Prepare los datos para los modelos de Amazon Nova.
-
Configure la función de recompensa (calificador): defina un calificador para puntuar las respuestas del modelo en función de la corrección, la estructura, el tono u otros objetivos. La función de recompensa se puede ejecutar con Lambda para calcular las puntuaciones objetivas. También puede elegir un modelo como juez (mediante la consola) y calificar las respuestas en función de los criterios y principios que configure (la consola los convierte automáticamente en funciones Lambda). Para obtener más información, consulte Configuración de funciones de recompensa para los modelos Amazon Nova.
-
Enviar trabajo de ajuste de refuerzo: inicie el trabajo de ajuste de refuerzo especificando el modelo base, el conjunto de datos, la función de recompensa y otros ajustes opcionales, como los hiperparámetros. Para obtener más información, consulte Cree y gestione trabajos de ajuste preciso para los modelos de Amazon Nova.
-
Supervise la formación: realice un seguimiento del estado del trabajo, las métricas de recompensas y el progreso de la formación hasta su finalización. Para obtener más información, consulte Supervise su trabajo de formación en RFT.
-
Utilice un modelo ajustado: una vez finalizado el trabajo, implemente el modelo de RFT resultante con un solo clic para realizar inferencias bajo demanda. También puede usar el rendimiento aprovisionado para cargas de trabajo de misión crítica que requieren un rendimiento constante. Consulte Configuración de la inferencia para un modelo personalizado. Utilice Test in Playground para evaluar y comparar las respuestas con el modelo base.
importante
Puede enviar un máximo de 20 000 solicitudes a Amazon Bedrock para reforzar y ajustar el modelo.
Modelos Nova compatibles
En la siguiente tabla se muestran los modelos de Amazon Nova que puede personalizar con ajustes de refuerzo:
nota
Para obtener información sobre otros modelos compatibles, incluidos los modelos de peso abierto, consulte. Ajuste con precisión los modelos de peso abierto con -compatible OpenAI APIs
| Proveedor | Modelo | ID del modelo | Compatibilidad con modelos de una sola región |
|---|---|---|---|
| Amazon | Nova 2 Lite | amazon.nova-2-lite-v1:00:256 k | us-east-1 |