Fine-tune Modelos Amazon Nova con ajuste fino de refuerzos

Antes de realizar los ajustes, asegúrese de cumplir con los requisitos previos, ya que Amazon Bedrock necesita permisos específicos para crear y gestionar el proceso de ajuste. Para obtener información completa sobre seguridad y permisos, consulte. Acceso y seguridad para los modelos Amazon Nova

Realice el ajuste preciso de los refuerzos para los modelos de Amazon Nova en 5 pasos:

Proporcione un conjunto de datos de entrenamiento: cargue las instrucciones en el formato requerido (por ejemplo, JSONL) como conjunto de datos de entrenamiento para reforzar el ajuste. Para obtener más información, consulte Prepare los datos para los modelos de Amazon Nova.
Configure la función de recompensa (calificador): defina un calificador para puntuar las respuestas del modelo en función de la corrección, la estructura, el tono u otros objetivos. La función de recompensa se puede ejecutar con Lambda para calcular las puntuaciones objetivas. También puede elegir un modelo como juez (mediante la consola) y calificar las respuestas en función de los criterios y principios que configure (la consola los convierte automáticamente en funciones Lambda). Para obtener más información, consulte Configuración de funciones de recompensa para los modelos Amazon Nova.
Enviar trabajo de ajuste de refuerzo: inicie el trabajo de ajuste de refuerzo especificando el modelo base, el conjunto de datos, la función de recompensa y otros ajustes opcionales, como los hiperparámetros. Para obtener más información, consulte Cree y gestione trabajos de ajuste preciso para los modelos de Amazon Nova.
Supervise la formación: realice un seguimiento del estado del trabajo, las métricas de recompensas y el progreso de la formación hasta su finalización. Para obtener más información, consulte Supervise su trabajo de formación en RFT.
Utilice el Fine-Tuned modelo: una vez finalizado el trabajo, implemente el modelo de RFT resultante con un solo clic para realizar inferencias bajo demanda. También puede usar el rendimiento aprovisionado para cargas de trabajo de misión crítica que requieren un rendimiento constante. Consulte Configuración de la inferencia para un modelo personalizado. Utilice Test in Playground para evaluar y comparar las respuestas con el modelo base.

importante

Puede enviar un máximo de 20 000 solicitudes a Amazon Bedrock para reforzar y ajustar el modelo.

Modelos Nova compatibles

En la siguiente tabla se muestran los modelos de Amazon Nova que puede personalizar con ajustes de refuerzo:

nota

Para obtener información sobre otros modelos compatibles, incluidos los modelos de peso abierto, consulte. Fine-tune modelos de peso abierto que utilizan OpenAI-API compatibles

Modelos compatibles para el ajuste fino de refuerzos
Proveedor	Modelo	ID del modelo	Single-region soporte de modelos
Amazon	Nova 2 Lite	amazon.nova-2-lite-v1:0:256k	us-east-1

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Refinamiento de refuerzo

Acceso y seguridad