Sempurnakan model Amazon Nova dengan penyetelan penguatan - Amazon Bedrock

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Sempurnakan model Amazon Nova dengan penyetelan penguatan

Sebelum melakukan fine-tuning, pastikan Anda memiliki prasyarat karena Amazon Bedrock memerlukan izin khusus untuk membuat dan mengelola proses fine-tuning. Untuk informasi keamanan dan izin yang komprehensif, lihatAkses dan keamanan untuk model Amazon Nova.

Jalankan fine-tuning penguatan untuk model Amazon Nova dalam 5 langkah:

  1. Menyediakan Dataset Pelatihan — Unggah petunjuk dalam format yang diperlukan (misalnya, JSONL) sebagai kumpulan data pelatihan fine-tuning penguatan. Untuk informasi selengkapnya, lihat Siapkan data untuk model Amazon Nova.

  2. Konfigurasi Fungsi Hadiah (grader) - Tentukan grader untuk menilai respons model berdasarkan kebenaran, struktur, nada, atau tujuan lainnya. Fungsi hadiah dapat dijalankan menggunakan Lambda untuk menghitung skor objektif. Anda juga dapat memilih model sebagai juri (melalui konsol) dan menilai respons berdasarkan kriteria dan prinsip yang Anda konfigurasikan (konsol mengonversinya menjadi fungsi Lambda secara otomatis). Untuk informasi selengkapnya, lihat Menyiapkan fungsi hadiah untuk model Amazon Nova.

  3. Submit reinforcement fine-tuning Job — Luncurkan pekerjaan fine-tuning tulangan dengan menentukan model dasar, dataset, fungsi reward, dan pengaturan opsional lainnya seperti hyperparameters. Untuk informasi selengkapnya, lihat Buat dan kelola pekerjaan fine-tuning untuk model Amazon Nova.

  4. Pantau Pelatihan — Lacak status pekerjaan, metrik hadiah, dan kemajuan pelatihan hingga selesai. Untuk informasi selengkapnya, lihat Pantau pekerjaan pelatihan RFT Anda.

  5. Gunakan Model Fine-Tuned — Setelah pekerjaan selesai, terapkan model RFT yang dihasilkan dengan satu klik untuk inferensi sesuai permintaan. Anda juga dapat menggunakan Provisioned Throughput untuk beban kerja penting misi yang memerlukan kinerja yang konsisten. Lihat Siapkan inferensi untuk model khusus. Gunakan Test in Playground untuk mengevaluasi dan membandingkan respons dengan model dasar.

penting

Anda dapat memberikan maksimum 20K petunjuk ke Amazon Bedrock untuk penguatan menyempurnakan model.

Model Nova yang didukung

Tabel berikut menunjukkan model Amazon Nova yang dapat Anda sesuaikan dengan fine-tuning tulangan:

catatan

Untuk informasi tentang model tambahan yang didukung termasuk model berat terbuka, lihatSempurnakan model bobot terbuka menggunakan -kompatibel OpenAI APIs.

Model yang didukung untuk fine-tuning penguatan
Penyedia Model ID Model Dukungan model wilayah tunggal
Amazon Nova 2 Lite amazon.nova-2-lite-v 1:0:256 k us-east-1