Optimalkan dan migrasi prompt di Amazon Bedrock

Amazon Bedrock menawarkan pengoptimalan cepat, migrasi model dan alat pengoptimalan yang membantu Anda mendapatkan kinerja terbaik dari model foundation. Amazon Bedrock menyediakan dua opsi pengoptimalan cepat.

Optimasi sederhana melakukan penulisan ulang heuristik yang cepat dari satu prompt pendek untuk satu model.
AdvPo (AdvPo) memungkinkan Anda mengoptimalkan permintaan untuk model apa pun di Bedrock sambil membandingkan permintaan asli Anda dengan permintaan yang dioptimalkan hingga 5 model secara bersamaan.

Anda dapat menggunakan ini jika Anda bermigrasi ke model baru atau hanya ingin mendapatkan kinerja yang lebih baik pada model Anda saat ini. Jika Anda mengubah model, pilih model Anda saat ini sebagai baseline dan hingga 4 model lainnya. Jika Anda tidak mengubah model, cukup pilih model Anda saat ini untuk melihat sebelum dan sesudah pengoptimalan. Pengoptimal mengambil template prompt Anda (hingga 10 per pekerjaan), dan contoh input pengguna untuk nilai variabel (hingga 100 per template prompt). Ini juga membutuhkan jawaban kebenaran dasar dan metrik evaluasi untuk memandu pengoptimalan. Ini bahkan kompatibel dengan input multimodal seperti jpeg, png, atau PDF. Anda dapat memberikan LLM-as-a-judge rubrik, fungsi Lambda, atau kriteria kemudi bahasa alami pendek. Evaluasi mengarahkan optimasi yang cepat. Pengoptimal bekerja dalam loop umpan balik berbasis evaluasi untuk mengoptimalkan respons model yang cepat dan dihasilkan. Ini menghasilkan templat prompt asli dan akhir dengan skor evaluasi, perkiraan biaya, dan latensi.

Pilih metode pengoptimalan

	Optimasi sederhana	Optimasi Prompt Tingkat Lanjut
Kasus penggunaan	Penulisan ulang prompt tunggal dasar untuk petunjuk singkat	Optimalisasi berulang yang fleksibel di mana evaluasi Anda mengarahkan penulisan ulang yang cepat, untuk migrasi model dan penyetelan kinerja
Terbaik untuk	Petunjuk singkat (sekitar 1k token atau kurang)	Templat prompt dengan panjang apa pun yang sesuai dengan jendela konteks model
Masukan	Teks prompt tunggal	Hingga 10 templat cepat dengan sampel evaluasi, termasuk multimodal
Model	1 model	Hingga 5 model dibandingkan secara bersamaan
Evaluasi	Tidak ada (penulisan ulang heuristik)	Pilihan Anda: kriteria kemudi, LLM-as-judge rubrik, atau fungsi Lambda khusus
Keluaran	Prompt ditulis ulang (instan)	Template yang dioptimalkan dengan skor evaluasi, perkiraan biaya, dan latensi per model
Eksekusi	Sinkron (detik)	Pekerjaan asinkron (15 menit hingga jam, tergantung pada jumlah templat yang cepat dan sampel evaluasi)
Multimodal	Tidak	Ya (gambar, PDF)
Migrasi model	Partial: dapat menulis ulang prompt, tetapi tidak ada perbandingan berdampingan	Ya, bandingkan model saat ini dengan kandidat secara berdampingan

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Kemampuan Tambahan

Cara kerjanya