View a markdown version of this page

Optimalkan dan migrasi prompt di Amazon Bedrock - Amazon Bedrock

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Optimalkan dan migrasi prompt di Amazon Bedrock

Amazon Bedrock menawarkan pengoptimalan cepat, migrasi model dan alat pengoptimalan yang membantu Anda mendapatkan kinerja terbaik dari model foundation. Amazon Bedrock menyediakan dua opsi pengoptimalan cepat.

  • Optimasi sederhana melakukan penulisan ulang heuristik yang cepat dari satu prompt pendek untuk satu model.

  • AdvPo (AdvPo) memungkinkan Anda mengoptimalkan permintaan untuk model apa pun di Bedrock sambil membandingkan permintaan asli Anda dengan permintaan yang dioptimalkan hingga 5 model secara bersamaan.

    Anda dapat menggunakan ini jika Anda bermigrasi ke model baru atau hanya ingin mendapatkan kinerja yang lebih baik pada model Anda saat ini. Jika Anda mengubah model, pilih model Anda saat ini sebagai baseline dan hingga 4 model lainnya. Jika Anda tidak mengubah model, cukup pilih model Anda saat ini untuk melihat sebelum dan sesudah pengoptimalan. Pengoptimal mengambil template prompt Anda (hingga 10 per pekerjaan), dan contoh input pengguna untuk nilai variabel (hingga 100 per template prompt). Ini juga membutuhkan jawaban kebenaran dasar dan metrik evaluasi untuk memandu pengoptimalan. Ini bahkan kompatibel dengan input multimodal seperti jpeg, png, atau PDF. Anda dapat memberikan LLM-as-a-judge rubrik, fungsi Lambda, atau kriteria kemudi bahasa alami pendek. Evaluasi mengarahkan optimasi yang cepat. Pengoptimal bekerja dalam loop umpan balik berbasis evaluasi untuk mengoptimalkan respons model yang cepat dan dihasilkan. Ini menghasilkan templat prompt asli dan akhir dengan skor evaluasi, perkiraan biaya, dan latensi.

Pilih metode pengoptimalan

Optimasi sederhana Optimasi Prompt Tingkat Lanjut
Kasus penggunaan Penulisan ulang prompt tunggal dasar untuk petunjuk singkat Optimalisasi berulang yang fleksibel di mana evaluasi Anda mengarahkan penulisan ulang yang cepat, untuk migrasi model dan penyetelan kinerja
Terbaik untuk Petunjuk singkat (sekitar 1k token atau kurang) Templat prompt dengan panjang apa pun yang sesuai dengan jendela konteks model
Masukan Teks prompt tunggal Hingga 10 templat cepat dengan sampel evaluasi, termasuk multimodal
Model 1 model Hingga 5 model dibandingkan secara bersamaan
Evaluasi Tidak ada (penulisan ulang heuristik) Pilihan Anda: kriteria kemudi, LLM-as-judge rubrik, atau fungsi Lambda khusus
Keluaran Prompt ditulis ulang (instan) Template yang dioptimalkan dengan skor evaluasi, perkiraan biaya, dan latensi per model
Eksekusi Sinkron (detik) Pekerjaan asinkron (15 menit hingga jam, tergantung pada jumlah templat yang cepat dan sampel evaluasi)
Multimodal Tidak Ya (gambar, PDF)
Migrasi model Partial: dapat menulis ulang prompt, tetapi tidak ada perbandingan berdampingan Ya, bandingkan model saat ini dengan kandidat secara berdampingan