View a markdown version of this page

Inferenza utilizzando l'API Anthropic Messages - Amazon Bedrock

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Inferenza utilizzando l'API Anthropic Messages

L'API Anthropic Messages fornisce l'accesso nativo ai modelli di Claude utilizzando il formato di richiesta e risposta Anthropic. Puoi utilizzare l'API Messages sia sugli endpoint che sugli bedrock-runtime endpoint, offrendoti la bedrock-mantle flessibilità di scegliere lo stile di autenticazione e integrazione più adatto alla tua applicazione.

Endpoint URL di base Caso d'uso
bedrock-mantle https://bedrock-mantle.{region}.api.aws/anthropic/v1/messages Consigliato per nuove applicazioni. Supporta l'autenticazione delle chiavi API eSpazi di lavoro () Anthropic-compatible.
bedrock-runtime https://bedrock-runtime.{region}.amazonaws.com Utilizzalo con le integrazioni AWS SDK esistenti e la registrazione delle chiamate.

Regioni supportate

L'API Messages è disponibile sull'bedrock-mantleendpoint in tutte le regioni che supportano (vedi). bedrock-mantle Regioni ed endpoint supportati Sull'bedrock-runtimeendpoint, è disponibile in tutte le regioni in cui sono disponibili i modelli Claude. Per informazioni dettagliate, vedi Disponibilità regionale.

Prerequisiti

Prima di utilizzare l'API Messages, assicurati di disporre di quanto segue:

  • Accesso ai modelli: richiedi l'accesso ai modelli Claude nella console Amazon Bedrock. Per informazioni, consulta Richiedi l'accesso ai modelli.

  • Autenticazione: dipende dall'endpoint:

    • bedrock-mantle— Utilizza una chiave API Amazon Bedrock (vediChiavi API) o credenziali AWS SigV4.

    • bedrock-runtime— Usa le credenziali AWS SigV4 tramite l' AWS SDK (boto3, ecc.).

  • Intestazione della versione antropica: tutte le richieste richiedono una versione API:

    • bedrock-mantle: Imposta anthropic-version: 2023-06-01 come intestazione HTTP.

    • bedrock-runtime: impostato "anthropic_version": "bedrock-2023-05-31" nel corpo della richiesta.

Richiesta di base

Per inviare un messaggio di base a un modello Claude, scegli la scheda corrispondente al metodo che preferisci, quindi segui i passaggi:

bedrock-mantle (curl)
curl -X POST https://bedrock-mantle.us-east-1.api.aws/anthropic/v1/messages \ -H "x-api-key: $BEDROCK_API_KEY" \ -H "anthropic-version: 2023-06-01" \ -H "Content-Type: application/json" \ -d '{ "model": "anthropic.claude-sonnet-4-6-v1", "max_tokens": 1024, "messages": [ {"role": "user", "content": "Explain quantum computing in one sentence."} ] }'
bedrock-runtime (Python)
import boto3 import json client = boto3.client("bedrock-runtime", region_name="us-east-1") response = client.invoke_model( modelId="anthropic.claude-sonnet-4-6-v1", body=json.dumps({ "anthropic_version": "bedrock-2023-05-31", "max_tokens": 1024, "messages": [ {"role": "user", "content": "Explain quantum computing in one sentence."} ] }) ) result = json.loads(response["body"].read()) print(result["content"][0]["text"])
bedrock-runtime (curl)

Usa la AWS CLI per richiamare il modello:

aws bedrock-runtime invoke-model \ --model-id anthropic.claude-sonnet-4-6-v1 \ --body '{ "anthropic_version": "bedrock-2023-05-31", "max_tokens": 1024, "messages": [ {"role": "user", "content": "Explain quantum computing in one sentence."} ] }' \ --cli-binary-format raw-in-base64-out \ output.json

Risposte in streaming

Per ricevere i token di risposta in modo incrementale man mano che vengono generati, scegli la scheda corrispondente al tuo metodo preferito, quindi segui i passaggi:

bedrock-mantle (curl)
curl -X POST https://bedrock-mantle.us-east-1.api.aws/anthropic/v1/messages \ -H "x-api-key: $BEDROCK_API_KEY" \ -H "anthropic-version: 2023-06-01" \ -H "Content-Type: application/json" \ -d '{ "model": "anthropic.claude-sonnet-4-6-v1", "max_tokens": 1024, "stream": true, "messages": [ {"role": "user", "content": "Write a short poem about cloud computing."} ] }'
bedrock-runtime (Python)
import boto3 import json client = boto3.client("bedrock-runtime", region_name="us-east-1") response = client.invoke_model_with_response_stream( modelId="anthropic.claude-sonnet-4-6-v1", body=json.dumps({ "anthropic_version": "bedrock-2023-05-31", "max_tokens": 1024, "messages": [ {"role": "user", "content": "Write a short poem about cloud computing."} ] }) ) for event in response["body"]: chunk = json.loads(event["chunk"]["bytes"]) if chunk["type"] == "content_block_delta": print(chunk["delta"]["text"], end="")

Funzionalità supportate

L'API Messages supporta le seguenti funzionalità avanzate con i modelli Claude:

Per il formato completo di richiesta e risposta dell'API Messages, inclusi tutti i parametri e le funzionalità, consulta. Anthropic Claude API Messages di  

Conta i token

Per contare il numero di token di input che una richiesta consumerebbe prima di inviarla per l'inferenza, usa il count_tokens percorso Anthropic sull'endpoint. bedrock-mantle Questo è l'unico percorso di conteggio dei token supportato per i modelli Claude che non sono disponibili su un Region-specific endpoint, inclusi i modelli Claude che vengono avviati solo bedrock-runtime con l'inferenza tra regioni (CRIS). Per informazioni dettagliate e un esempio, consulta Conta i token usando l'endpoint bedrock-mantle.