Optimice y migre las solicitudes en Amazon Bedrock

Amazon Bedrock ofrece una optimización rápida, una herramienta de migración y optimización de modelos que le ayuda a obtener el mejor rendimiento de los modelos básicos. Amazon Bedrock ofrece dos opciones de optimización rápida.

La optimización simple realiza una reescritura heurística rápida de una única solicitud corta para un modelo.
La optimización avanzada de solicitudes (AdvPO) le permite optimizar las indicaciones para cualquier modelo de Bedrock y, al mismo tiempo, comparar las indicaciones originales con las instrucciones optimizadas de hasta 5 modelos simultáneamente.

Puede usarlo si está migrando a un nuevo modelo o simplemente desea obtener un mejor rendimiento en su modelo actual. Si va a cambiar de modelo, seleccione su modelo actual como base y hasta 4 modelos más. Si no va a cambiar de modelo, simplemente seleccione el modelo actual para ver el antes y el después de la optimización. El optimizador toma las plantillas de solicitudes (hasta 10 por trabajo) y, a modo de ejemplo, las entradas del usuario para valores variables (hasta 100 por plantilla de solicitud). También requiere respuestas basadas en la verdad básica y una métrica de evaluación que sirva de guía para la optimización. Incluso es compatible con entradas multimodales como jpeg, png o PDF. Puede proporcionar una LLM-as-a-judge rúbrica, una función Lambda o criterios de orientación breves en lenguaje natural. La evaluación orienta la optimización rápida. El optimizador funciona en un circuito de retroalimentación basado en la evaluación para optimizar las respuestas rápidas y resultantes del modelo. Genera las plantillas de solicitudes originales y finales con las puntuaciones de las evaluaciones, las estimaciones de costes y la latencia.

Elija un método de optimización

	Optimización sencilla	Optimización rápida avanzada
Caso de uso	Reescritura básica de un solo mensaje para mensajes cortos	Optimización flexible e iterativa en la que la evaluación orienta la reescritura rápida para migrar los modelos y ajustar el rendimiento
Lo mejor para	Indicaciones breves (aproximadamente 1000 fichas o menos)	Plantillas de solicitudes de cualquier longitud que quepan en la ventana de contexto del modelo
Entrada	Texto de solicitud único	Hasta 10 plantillas de solicitudes con muestras de evaluación, incluidas las multimodales
Modelos de	1 modelo	Hasta 5 modelos comparados simultáneamente
Evaluación	Ninguno (reescritura heurística)	Su elección: criterios de dirección, LLM-as-judge rúbrica o función Lambda personalizada
Salida	Mensaje reescrito (instantáneo)	Plantillas optimizadas con puntuaciones de evaluación, estimaciones de costes y latencia por modelo
Execution	Sincrónico (segundos)	Trabajo asíncrono (de 15 minutos a horas, según la cantidad de plantillas de solicitudes y muestras de evaluación)
Multimodal	No	Sí (imágenes, archivos PDF)
Migración de modelos	Parcial: puede reescribir las instrucciones, pero no puede compararlas una al lado de la otra	Sí, compare el modelo actual con los candidatos uno al lado del otro

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Capacidades adicionales

Funcionamiento