Fine-tune Model Amazon Nova dengan penyetelan penguatan

Sebelum melakukan fine-tuning, pastikan Anda memiliki prasyarat karena Amazon Bedrock memerlukan izin khusus untuk membuat dan mengelola proses fine-tuning. Untuk informasi keamanan dan izin yang komprehensif, lihatAkses dan keamanan untuk model Amazon Nova.

Jalankan fine-tuning penguatan untuk model Amazon Nova dalam 5 langkah:

Menyediakan Dataset Pelatihan — Unggah petunjuk dalam format yang diperlukan (misalnya, JSONL) sebagai kumpulan data pelatihan fine-tuning penguatan. Untuk informasi selengkapnya, lihat Siapkan data untuk model Amazon Nova.
Konfigurasi Fungsi Hadiah (grader) - Tentukan grader untuk menilai respons model berdasarkan kebenaran, struktur, nada, atau tujuan lainnya. Fungsi hadiah dapat dijalankan menggunakan Lambda untuk menghitung skor objektif. Anda juga dapat memilih model sebagai juri (melalui konsol) dan menilai respons berdasarkan kriteria dan prinsip yang Anda konfigurasikan (konsol mengonversinya menjadi fungsi Lambda secara otomatis). Untuk informasi selengkapnya, lihat Menyiapkan fungsi hadiah untuk model Amazon Nova.
Submit reinforcement fine-tuning Job — Luncurkan pekerjaan fine-tuning tulangan dengan menentukan model dasar, dataset, fungsi reward, dan pengaturan opsional lainnya seperti hyperparameters. Untuk informasi selengkapnya, lihat Buat dan kelola pekerjaan fine-tuning untuk model Amazon Nova.
Pantau Pelatihan — Lacak status pekerjaan, metrik hadiah, dan kemajuan pelatihan hingga selesai. Untuk informasi selengkapnya, lihat Pantau pekerjaan pelatihan RFT Anda.
Gunakan Fine-Tuned Model — Setelah pekerjaan selesai, terapkan model RFT yang dihasilkan dengan satu klik untuk inferensi sesuai permintaan. Anda juga dapat menggunakan Provisioned Throughput untuk beban kerja penting misi yang memerlukan kinerja yang konsisten. Lihat Siapkan inferensi untuk model khusus. Gunakan Test in Playground untuk mengevaluasi dan membandingkan respons dengan model dasar.

penting

Anda dapat memberikan maksimum 20K petunjuk ke Amazon Bedrock untuk penguatan menyempurnakan model.

Model Nova yang didukung

Tabel berikut menunjukkan model Amazon Nova yang dapat Anda sesuaikan dengan fine-tuning tulangan:

catatan

Untuk informasi tentang model tambahan yang didukung termasuk model berat terbuka, lihatFine-tune model berat terbuka menggunakan OpenAI-API yang kompatibel.

Model yang didukung untuk fine-tuning penguatan
Penyedia	Model	ID Model	Single-region dukungan model
Amazon	Nova 2 Lite	amazon.nova-2-lite-v 1:0:256 k	us-east-1

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Penyempurnaan berbasis penguatan

Akses dan keamanan