Richiesta e risposta - Amazon Bedrock

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Richiesta e risposta

Il corpo della richiesta viene passato nel body campo di una richiesta a InvokeModelo InvokeModelWithResponseStream.

Nota

Le restrizioni si applicano alle seguenti operazioni: InvokeModelInvokeModelWithResponseStream,Converse, eConverseStream. Per i dettagli, consulta Restrizioni API.

avvertimento

Claude Sonnet 4.5e Claude Haiku 4.5 supporta la specificazione del top_p parametro temperature o, ma non di entrambi. Questa condizione non si applica ai modelli precedenti.

Request

Anthropic Claude include i parametri di inferenza seguenti per effettuare una chiamata di inferenza ai messaggi.

{ "anthropic_version": "bedrock-2023-05-31", "anthropic_beta": ["computer-use-2024-10-22"] "max_tokens": int, "system": string, "messages": [ { "role": string, "content": [ { "type": "image", "source": { "type": "base64", "media_type": "image/jpeg", "data": "content image bytes" } }, { "type": "text", "text": "content text" } ] } ], "temperature": float, "top_p": float, "top_k": int, "tools": [ { "type": "custom", "name": string, "description": string, "input_schema": json }, { "type": "computer_20241022", "name": "computer", "display_height_px": int, "display_width_px": int, "display_number": 0 int }, { "type": "bash_20241022", "name": "bash" }, { "type": "text_editor_20241022", "name": "str_replace_editor" } ], "tool_choice": { "type" : string, "name" : string, }, "stop_sequences": [string] }

I seguenti parametri sono obbligatori.

  • anthropic_version (obbligatorio): versione di Anthropic. Il valore deve essere bedrock-2023-05-31.

  • max_Tokens (obbligatorio): numero massimo di token da generare prima dell’interruzione.

    Tenere presente che i modelli Anthropic Claude potrebbero interrompere la generazione di token prima di raggiungere il valore di max_tokens. In modelli Anthropic Claude diversi i valori massimi per questo parametro sono differenti. Per ulteriori informazioni, consulta Confronto dei modelli.

  • messages (obbligatorio): messaggi di input.

    • role: ruolo del turno di conversazione. I valori validi sono user e assistant.

      Minimo Massimo

      0

      2000

    • content (obbligatorio): contenuto del turno di conversazione, come array di oggetti. Ogni oggetto contiene un campo type, in cui è possibile specificare uno dei seguenti valori:

      • text: se si specifica questo tipo, è necessario includere un campo di testo e indicare il prompt di testo come valore. Se un altro oggetto dell’array è un’immagine, questo prompt di testo si applica alle immagini.

      • image: se si specifica questo tipo, è necessario includere un campo source mappato a un oggetto con i seguenti campi:

        • type (obbligatorio): tipo di codifica dell’immagine. È possibile specificare base64.

        • media_type (obbligatorio): tipo di immagine. È possibile specificare i seguenti formati di immagine:

          • image/jpeg

          • image/png

          • image/webp

          • image/gif

        • data (obbligatorio): byte dell’immagine con codifica base64 per l’immagine. La dimensione massima è 3,75 MB. L’altezza e la larghezza massime di un’immagine corrispondono a 8.000 pixel.

I seguenti parametri sono facoltativi.

  • system (facoltativo): prompt di sistema per la richiesta.

    Un prompt di sistema è un modo per fornire contesto e istruzioni ad Anthropic Claude, ad esempio specificando un obiettivo o un ruolo particolare. Per ulteriori informazioni, consulta Dare un ruolo a Claude con un system prompt nella documentazione di Anthropic.

    Nota

    È possibile utilizzare i prompt di sistema con Anthropic Claude versione 2.1 o successiva.

  • anthropic_beta (facoltativo): il parametro anthropic_beta è un elenco di stringhe di intestazioni beta utilizzate per indicare l’accettazione a un particolare set di funzionalità beta.

    Nota

    La variante con lunghezza contestuale di 1 milione di token Claude Sonnet 4 è disponibile in alcune AWS regioni come «Servizio beta», come definito nei Termini di AWS servizio. È soggetto al Contratto AWS e ai Termini di AWS servizio dell'utente e al modello di EULA applicabile. Per ulteriori informazioni sui prezzi per le richieste contestuali più lunghe, consulta la pagina Prezzi di Amazon Bedrock. Si applicano quote di servizio separate (per ulteriori informazioni, vedere Service Quotas in Console di gestione AWS).

    Altre intestazioni beta disponibili sono le seguenti:

    Funzionalità beta

    Intestazione beta

    Note

    Utilizzo del computer

    computer-use-2025-01-24

    Compatibile con Claude 3.7 Sonnet.

    Utilizzo degli strumenti

    token-efficient-tools-2025-02-19

    Compatibile con Claude 3.7 Sonnet e Claude 4+.

    Pensiero interlacciato

    Interleaved-thinking-2025-05-14

    Compatibile con i modelli Claude 4+.

    Token di output fino a 128.000

    output-128k-2025-02-19

    Compatibile con Claude 3.7 Sonnet.

    Modalità sviluppatore per il pensiero non elaborato sui modelli Claude 4+

    dev-full-thinking-2025-05-14

    Compatibile con i modelli Claude 4+. Contatta il team del tuo account per accedere a questa funzionalità beta.

    1 milione di token

    context-1m-2025-08-07

    Compatibile con Claude Sonnet 4

    Gestione del contesto

    context-management-2025-06-27

    Compatibile con Claude Sonnet 4.5 e Claude Haiku 4.5

    Sforzo

    effort-2025-11-24

    Compatibile con Claude Opus 4.5

    Strumento di ricerca degli strumenti

    tool-search-tool-2025-10-19

    Compatibile con Claude Opus 4.5

    Esempi di utilizzo degli strumenti

    tool-examples-2025-10-29

    Compatibile con Claude Opus 4.5

  • stop_sequences (facoltativo): sequenze di testo personalizzate che inducono il modello a interrompere la generazione. I modelli Anthropic Claude in genere interrompono la generazione quando hanno completato naturalmente il proprio turno e in questo caso il valore della campo di risposta stop_reason è end_turn. Se si desidera che il modello interrompa la generazione quando incontra stringhe di testo personalizzate, usare il parametro stop_sequences. Se il modello incontra una delle stringhe di testo personalizzate, il valore del campo di risposta stop_reason è stop_sequence e il valore di stop_sequence contiene la sequenza di arresto corrispondente.

    Il numero massimo di voci è 8191.

  • temperature (facoltativo): quantità di randomizzazione inserita nella risposta.

    Predefinita Minimo Massimo

    1

    0

    1

  • top_p (facoltativo): utilizza il metodo “nucleus sampling”.

    Nel metodo “nucleus sampling”, Anthropic Claude calcola la distribuzione cumulativa di tutte le opzioni per ogni token successivo in ordine di probabilità decrescente e la interrompe quando raggiunge un particolare valore specificato da top_p. Quando si regolano i parametri di campionamento, modificare temperature oppure top_p. Non modificare entrambi i parametri contemporaneamente.

    Predefinita Minimo Massimo

    0,999

    0

    1

  • top_k (facoltativo): campionamento eseguito solo dalle opzioni top K per ogni token successivo.

    Utilizza top_k per rimuovere le risposte long tail a bassa probabilità.

    Predefinita Minimo Massimo

    Disabilitato per impostazione predefinita.

    0

    500

  • tools (facoltativo): definizioni di strumenti che il modello può utilizzare.

    Nota

    Richiede un modello Anthropic Claude 3.

    Se si include tools nella richiesta, il modello può restituire blocchi di contenuto tool_use che rappresentano l’utilizzo di tali strumenti da parte del modello. È quindi possibile eseguire tali strumenti utilizzando l’input dello strumento generato dal modello e quindi, facoltativamente, restituire i risultati al modello utilizzando blocchi di contenuto tool_result.

    È possibile passare i seguenti tipi di strumenti:

    Personalizzato

    Definizione di uno strumento personalizzato.

    • type (facoltativo): tipo di strumento. Se definito, utilizzare il valore custom.

    • name: nome dello strumento.

    • descrizione (facoltativa, ma fortemente consigliata): descrizione dello strumento.

    • input_schema: schema JSON per lo strumento.

    Computer

    Definizione del computer utilizzato con l’API per l’utilizzo del computer.

    • type: il valore deve essere computer_20241022.

    • name: il valore deve essere computer.

    • display_height_px (obbligatorio): altezza del display controllato dal modello, in pixel.

      Predefinita Minimo Massimo

      Nessuno

      1

      Nessun valore massimo

    • display_width_px (obbligatorio): larghezza del display controllato dal modello, in pixel.

      Predefinita Minimo Massimo

      Nessuno

      1

      Nessun valore massimo

    • display_number (facoltativo): numero di display da controllare (rilevante solo per gli ambienti X11). Se specificato, allo strumento verrà fornito un numero di display nella definizione dello strumento.

      Predefinita Minimo Massimo

      Nessuno

      0

      N

    bash

    Definizione dello strumento bash utilizzato con l’API per l’utilizzo del computer.

    • type (facoltativo): il valore deve essere bash_20241022.

    • name: il valore deve essere lo strumento bash.

    editor di testo

    Definizione dello strumento editor di testo utilizzato con l’API per l’utilizzo del computer.

    • type (facoltativo): il valore deve essere text_editor_20241022.

    • name: il valore deve essere lo strumento str_replace_editor.

  • tool_choice (facoltativo): specifica la modalità di utilizzo degli strumenti forniti da parte del modello. Il modello può utilizzare uno strumento specifico, qualsiasi strumento disponibile o decidere in modo autonomo.

    Nota

    Richiede un modello Anthropic Claude 3.

    • tipo: tipo dello strumento scelto. I valori possibili sono any (qualsiasi strumento disponibile), auto (decide il modello) e tool (strumento specificato).

    • name (facoltativo): nome dello strumento da utilizzare. Obbligatorio se si specifica tool nel campo type.

Response

I modelli Anthropic Claude restituiscono i campi seguenti per una chiamata di inferenza ai messaggi.

{ "id": string, "model": string, "type" : "message", "role" : "assistant", "content": [ { "type": string, "text": string, "image" :json, "id": string, "name":string, "input": json } ], "stop_reason": string, "stop_sequence": string, "usage": { "input_tokens": integer, "output_tokens": integer } }

Risposte di esempio con nuovi valori stop_reason:

// Example with refusal { "stop_reason": "refusal", "content": [ { "type": "text", "text": "I can't help with that request." } ] } // Example with tool_use { "stop_reason": "tool_use", "content": [ { "type": "tool_use", "id": "toolu_123", "name": "calculator", "input": {"expression": "2+2"} } ] } // Example with model_context_window_exceeded (Claude Sonnet 4.5) { "stop_reason": "model_context_window_exceeded", "content": [ { "type": "text", "text": "The response was truncated due to context window limits..." } ] }
  • id: identificatore univoco per la risposta. Il formato e la lunghezza dell’ID potrebbero cambiare nel tempo.

  • model: ID modello Anthropic Claude che ha effettuato la richiesta.

  • stop_reason: motivo per cui Anthropic Claude ha interrotto la generazione della risposta.

    • end_turn: il modello ha raggiunto un punto d interruzione naturale.

    • max_tokens: il testo generato ha superato il valore del campo di input max_tokens o ha superato il numero massimo di token supportati dal modello.

    • stop_sequence: il modello ha generato una delle sequenze di arresto specificate nel campo di input stop_sequences.

    • refusal: Claude si rifiuta di generare una risposta per motivi di sicurezza.

    • tool_use: Claude sta chiamando uno strumento e si aspetta che l’utente lo esegua.

    • model_context_window_exceeded: il modello ha interrotto la generazione perché ha raggiunto il limite della finestra contestuale.

      • Nuovo in Claude Sonnet 4.5

  • stop_sequence: sequenza di arresto che ha terminato la generazione.

  • type: tipo della risposta. Il valore è sempre message.

  • role: ruolo conversazionale del messaggio generato. Il valore è sempre assistant.

  • content: contenuto generato dal modello. Restituito in forma di array. Esistono tre tipi di contenuto, text, tool_use e image.

    • text: risposta in formato testo.

      • type: tipo del contenuto. Il valore è text.

      • text: se il valore di type è di tipo testo, contiene il testo del contenuto.

    • tool use: richiesta da parte del modello di utilizzare uno strumento.

      • type: tipo del contenuto. Il valore è tool_use.

      • id: ID dello strumento di cui il modello richiede l’utilizzo.

      • name: nome dello strumento richiesto.

      • input: parametri di input da passare allo strumento.

    • Image: richiesta da parte del modello di utilizzare uno strumento.

      • type: tipo del contenuto. Il valore è image.

      • source: contiene l’immagine. Per ulteriori informazioni, consulta Prompt multimodali.

  • usage: container per il numero di token forniti nella richiesta e per quello di token generati dal modello nella risposta.

    • input_tokens: numero di token di input nella richiesta.

    • output_tokens: numero di token generati dal modello nella risposta.

    • stop_sequence: il modello ha generato una delle sequenze di arresto specificate nel campo di input stop_sequences.

Parametro di sforzo (beta)

Il effort parametro è un'alternativa a Thinking Token Budgets for Claude Opus 4.5. Questo parametro indica con Claude quanta generosità dovrebbe spendere i token per ottenere i migliori risultati, adattando l'utilizzo dei token in base al pensiero, alle chiamate agli strumenti e alla comunicazione con l'utente. Può essere usato con o senza la modalità di pensiero estesa.

Il parametro di sforzo può essere impostato su:

  • high(impostazione predefinita): Claude spende tutti i token necessari per ottenere il miglior risultato

  • medium— Utilizzo bilanciato dei token

  • low— Utilizzo conservativo dei token

Per utilizzare questa funzionalità è necessario superare l'intestazione effort-2025-11-24 beta.

Esempio di richiesta:

{ "anthropic_version": "bedrock-2023-05-31", "anthropic_beta": [ "effort-2025-11-24" ], "max_tokens": 4096, "output_config": { "effort": "medium" }, "messages": [{ "role": "user", "content": "Analyze this complex dataset and provide insights" }] }