Ottimizzazione e migrazione dei prompt in Amazon Bedrock

Amazon Bedrock offre un'ottimizzazione tempestiva, uno strumento di migrazione e ottimizzazione dei modelli che ti aiuta a ottenere le migliori prestazioni dai modelli base. Amazon Bedrock offre due opzioni di ottimizzazione immediata.

L'ottimizzazione semplice esegue una riscrittura rapida ed euristica di un singolo breve prompt per un modello.
Advanced Prompt Optimization (AdVPO) consente di ottimizzare i prompt per qualsiasi modello su Bedrock confrontando i prompt originali con quelli ottimizzati su un massimo di 5 modelli contemporaneamente.

È possibile utilizzarlo se si sta migrando a un nuovo modello o se si desidera semplicemente ottenere prestazioni migliori sul modello attuale. Se state cambiando modello, selezionate il modello attuale come riferimento e fino a 4 altri modelli. Se non intendi modificare i modelli, seleziona semplicemente il modello attuale per vedere prima e dopo l'ottimizzazione. L'ottimizzatore utilizza i modelli di prompt (fino a 10 per processo) e gli input utente di esempio per i valori delle variabili (fino a 100 per modello di prompt). Richiede inoltre risposte fondate sulla verità e una metrica di valutazione per guidare l'ottimizzazione. È anche compatibile con input multimodali come jpeg, png o PDF. Puoi fornire una LLM-as-a-judge rubrica, una funzione Lambda o brevi criteri di gestione del linguaggio naturale. La valutazione guida l'ottimizzazione tempestiva. L'ottimizzatore funziona in un ciclo di feedback basato sulla valutazione per ottimizzare la richiesta e le risposte del modello risultanti. Produce i modelli di prompt originali e finali con punteggi di valutazione, stime dei costi e latenza.

Scegli un metodo di ottimizzazione

	Ottimizzazione semplice	Ottimizzazione rapida avanzata
Caso d'uso	Riscrittura di base con un solo prompt per istruzioni brevi	Ottimizzazione flessibile e iterativa in cui la valutazione indirizza la tempestiva riscrittura, per la migrazione dei modelli e l'ottimizzazione delle prestazioni
Ideale per	Richieste brevi (circa 1.000 token o meno)	Richiedi modelli di qualsiasi lunghezza che rientrino nella finestra contestuale del modello
Input	Testo del prompt singolo	Fino a 10 modelli di prompt con esempi di valutazione, inclusi modelli multimodali
Modelli	1 modello	Fino a 5 modelli confrontati contemporaneamente
Valutazione	Nessuno (riscrittura euristica)	La tua scelta: criteri di sterzo, LLM-as-judge rubrica o funzione Lambda personalizzata
Output	Richiesta riscritta (istantanea)	Modelli ottimizzati con punteggi di valutazione, stime dei costi e latenza per modello
Esecuzione	Sincrono (secondi)	Lavoro asincrono (da 15 minuti a ore, a seconda del numero di modelli di prompt e di esempi di valutazione)
Multimodale	No	Sì (immagini, PDF)
Migrazione del modello	Parziale: può riscrivere i prompt, ma nessun confronto fianco a fianco	Sì, confronta il modello attuale con i candidati fianco a fianco

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Funzionalità aggiuntive

Come funziona