View a markdown version of this page

Fine-tune modelli a peso aperto che utilizzano OpenAI-API compatibili - Amazon Bedrock

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Fine-tune modelli a peso aperto che utilizzano OpenAI-API compatibili

Amazon Bedrock fornisce endpoint API OpenAI compatibili per la messa a punto dei modelli di base. Questi endpoint consentono di utilizzare OpenAI SDK e strumenti familiari per creare, monitorare e gestire lavori di ottimizzazione con i modelli Amazon Bedrock. Questa pagina illustra l'utilizzo di queste API per la messa a punto dei rinforzi.

Funzionalità chiave

  • Carica file di formazione: utilizza l'API Files per caricare e gestire i dati di formazione per perfezionare i lavori

  • Crea lavori di ottimizzazione: inizia a perfezionare i lavori con dati di formazione personalizzati e funzioni di ricompensa

  • Elenca e recupera i lavori: visualizza tutti i lavori di messa a punto e ottieni informazioni dettagliate su lavori specifici

  • Monitora gli eventi lavorativi: monitora i progressi di ottimizzazione tramite registri degli eventi dettagliati

  • Accedi ai checkpoint: recupera i checkpoint del modello intermedio creati durante la formazione

  • Inferenza immediata: una volta completata la messa a punto, utilizza il modello ottimizzato risultante per l'inferenza su richiesta tramite le API (API di completamento) di Amazon OpenAI-compatible Bedrock senza passaggi di distribuzione aggiuntivi Responses/chat

  • Migrazione sempliceOpenAI: compatibile con le basi di codice SDK esistenti

Workflow di rinforzo e ottimizzazione per modelli a peso aperto

Prima della messa a punto, assicurati di disporre dei prerequisiti, poiché Amazon Bedrock necessita di autorizzazioni specifiche per creare e gestire il processo di messa a punto. Per informazioni complete su Accesso e sicurezza per modelli a peso aperto sicurezza e autorizzazioni, consulta.

Esegui la messa a punto del rinforzo per i modelli a peso aperto in 5 passaggi:

  1. Carica il set di dati di addestramento: utilizza l'API Files per caricare i prompt nel formato richiesto (ad esempio, JSONL) con lo scopo di «perfezionare» il set di dati di addestramento per il perfezionamento dei rinforzi. Per ulteriori informazioni, consulta Preparare i dati per modelli a peso aperto.

  2. Configura la funzione Reward: definisci un classificatore per assegnare un punteggio alle risposte del modello in base a correttezza, struttura, tono o altri obiettivi utilizzando le funzioni Lambda. Per ulteriori informazioni, consulta Configurazione delle funzioni di ricompensa per i modelli a peso aperto.

  3. Create Fine-tuning Job: avvia il processo di ottimizzazione del rinforzo utilizzando l'API OpenAI compatibile specificando il modello di base, il set di dati, la funzione di ricompensa e altre impostazioni opzionali come gli iperparametri. Per ulteriori informazioni, consulta Crea un lavoro di messa a punto.

  4. Monitora i progressi della formazione: monitora lo stato del lavoro, gli eventi e le metriche di formazione utilizzando le API di fine-tuning jobs. Per ulteriori informazioni, consulta Elenca gli eventi di messa a punto. Accedi ai punti di controllo intermedi del modello per valutare le prestazioni nelle diverse fasi della formazione, vedi. Elenca i punti di controllo per la messa a punto

  5. Run Inference: utilizza l'ID del modello ottimizzato direttamente per l'inferenza tramite le API Responses o Chat Completions compatibili con Amazon Bedrock. OpenAI Per ulteriori informazioni, consulta Esegui l'inferenza con un modello ottimizzato.

Regioni ed endpoint supportati

La tabella seguente mostra i modelli e le regioni di base che supportano le API di ottimizzazione OpenAI compatibili:

Regioni e modelli supportati per OpenAI API di fine-tuning compatibili
Provider Modello ID modello Nome Regione Regione Endpoint
OpenAI Gpt-oss-20B apri ai.gpt-oss-20b Stati Uniti occidentali (Oregon) us-west-2 bedrock-mantle.us-west-2.api.aws
Qwen Qwen3 32 GB qwen.qwen3-32b Stati Uniti occidentali (Oregon) us-west-2 bedrock-mantle.us-west-2.api.aws