Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Sempurnakan model Amazon Nova dengan penyetelan penguatan
Sebelum melakukan fine-tuning, pastikan Anda memiliki prasyarat karena Amazon Bedrock memerlukan izin khusus untuk membuat dan mengelola proses fine-tuning. Untuk informasi keamanan dan izin yang komprehensif, lihatAkses dan keamanan untuk model Amazon Nova.
Jalankan fine-tuning penguatan untuk model Amazon Nova dalam 5 langkah:
-
Menyediakan Dataset Pelatihan — Unggah petunjuk dalam format yang diperlukan (misalnya, JSONL) sebagai kumpulan data pelatihan fine-tuning penguatan. Untuk informasi selengkapnya, lihat Siapkan data untuk model Amazon Nova.
-
Konfigurasi Fungsi Hadiah (grader) - Tentukan grader untuk menilai respons model berdasarkan kebenaran, struktur, nada, atau tujuan lainnya. Fungsi hadiah dapat dijalankan menggunakan Lambda untuk menghitung skor objektif. Anda juga dapat memilih model sebagai juri (melalui konsol) dan menilai respons berdasarkan kriteria dan prinsip yang Anda konfigurasikan (konsol mengonversinya menjadi fungsi Lambda secara otomatis). Untuk informasi selengkapnya, lihat Menyiapkan fungsi hadiah untuk model Amazon Nova.
-
Submit reinforcement fine-tuning Job — Luncurkan pekerjaan fine-tuning tulangan dengan menentukan model dasar, dataset, fungsi reward, dan pengaturan opsional lainnya seperti hyperparameters. Untuk informasi selengkapnya, lihat Buat dan kelola pekerjaan fine-tuning untuk model Amazon Nova.
-
Pantau Pelatihan — Lacak status pekerjaan, metrik hadiah, dan kemajuan pelatihan hingga selesai. Untuk informasi selengkapnya, lihat Pantau pekerjaan pelatihan RFT Anda.
-
Gunakan Model Fine-Tuned — Setelah pekerjaan selesai, terapkan model RFT yang dihasilkan dengan satu klik untuk inferensi sesuai permintaan. Anda juga dapat menggunakan Provisioned Throughput untuk beban kerja penting misi yang memerlukan kinerja yang konsisten. Lihat Siapkan inferensi untuk model khusus. Gunakan Test in Playground untuk mengevaluasi dan membandingkan respons dengan model dasar.
penting
Anda dapat memberikan maksimum 20K petunjuk ke Amazon Bedrock untuk penguatan menyempurnakan model.
Model Nova yang didukung
Tabel berikut menunjukkan model Amazon Nova yang dapat Anda sesuaikan dengan fine-tuning tulangan:
catatan
Untuk informasi tentang model tambahan yang didukung termasuk model berat terbuka, lihatSempurnakan model bobot terbuka menggunakan -kompatibel OpenAI APIs.
| Penyedia | Model | ID Model | Dukungan model wilayah tunggal |
|---|---|---|---|
| Amazon | Nova 2 Lite | amazon.nova-2-lite-v 1:0:256 k | us-east-1 |