Regioni supportate Prerequisiti Richiesta di base Risposte in streaming Funzionalità supportate Conta i token

Inferenza utilizzando l'API Anthropic Messages

L'API Anthropic Messages fornisce l'accesso nativo ai modelli di Claude utilizzando il formato di richiesta e risposta Anthropic. Puoi utilizzare l'API Messages sia sugli endpoint che sugli bedrock-runtime endpoint, offrendoti la bedrock-mantle flessibilità di scegliere lo stile di autenticazione e integrazione più adatto alla tua applicazione.

Endpoint	URL di base	Caso d'uso
`bedrock-mantle`	`https://bedrock-mantle.{region}.api.aws/anthropic/v1/messages`	Consigliato per nuove applicazioni. Supporta l'autenticazione delle chiavi API eSpazi di lavoro () Anthropic-compatible.
`bedrock-runtime`	`https://bedrock-runtime.{region}.amazonaws.com`	Utilizzalo con le integrazioni AWS SDK esistenti e la registrazione delle chiamate.

Regioni supportate

L'API Messages è disponibile sull'bedrock-mantleendpoint in tutte le regioni che supportano (vedi). bedrock-mantle Regioni ed endpoint supportati Sull'bedrock-runtimeendpoint, è disponibile in tutte le regioni in cui sono disponibili i modelli Claude. Per informazioni dettagliate, vedi Disponibilità regionale per modello.

Prerequisiti

Prima di utilizzare l'API Messages, assicurati di disporre di quanto segue:

Accesso ai modelli: richiedi l'accesso ai modelli Claude nella console Amazon Bedrock. Per informazioni, consulta Richiedi l'accesso ai modelli.
Autenticazione: dipende dall'endpoint:
- bedrock-mantle— Utilizza una chiave API Amazon Bedrock (vediChiavi API) o credenziali AWS SigV4.
- bedrock-runtime— Usa le credenziali AWS SigV4 tramite l' AWS SDK (boto3, ecc.).
Intestazione della versione antropica: tutte le richieste richiedono una versione API:
- bedrock-mantle: Imposta anthropic-version: 2023-06-01 come intestazione HTTP.
- bedrock-runtime: impostato "anthropic_version": "bedrock-2023-05-31" nel corpo della richiesta.

Richiesta di base

Per inviare un messaggio di base a un modello Claude, scegli la scheda corrispondente al metodo che preferisci, quindi segui i passaggi:

bedrock-mantle (curl)


curl -X POST https://bedrock-mantle.us-east-1.api.aws/anthropic/v1/messages \
  -H "x-api-key: $BEDROCK_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "anthropic.claude-sonnet-4-6-v1",
    "max_tokens": 1024,
    "messages": [
        {"role": "user", "content": "Explain quantum computing in one sentence."}
    ]
  }'

bedrock-runtime (Python)


import boto3
import json

client = boto3.client("bedrock-runtime", region_name="us-east-1")

response = client.invoke_model(
    modelId="anthropic.claude-sonnet-4-6-v1",
    body=json.dumps({
        "anthropic_version": "bedrock-2023-05-31",
        "max_tokens": 1024,
        "messages": [
            {"role": "user", "content": "Explain quantum computing in one sentence."}
        ]
    })
)

result = json.loads(response["body"].read())
print(result["content"][0]["text"])

bedrock-runtime (AWS CLI)

Usa la AWS CLI per richiamare il modello:


aws bedrock-runtime invoke-model \
  --model-id anthropic.claude-sonnet-4-6-v1 \
  --body '{
    "anthropic_version": "bedrock-2023-05-31",
    "max_tokens": 1024,
    "messages": [
        {"role": "user", "content": "Explain quantum computing in one sentence."}
    ]
  }' \
  --cli-binary-format raw-in-base64-out \
  output.json

bedrock-runtime (curl)

Puoi chiamare bedrock-runtime direttamente con curl firmando la richiesta con SigV4. AWS L'esempio seguente utilizza il --aws-sigv4 flag integrato di curl (disponibile in curl 7.75.0 e versioni successive):


curl -X POST \
  "https://bedrock-runtime.us-east-1.amazonaws.com/model/anthropic.claude-sonnet-4-6-v1/invoke" \
  -H "Content-Type: application/json" \
  --aws-sigv4 "aws:amz:us-east-1:bedrock" \
  --user "$AWS_ACCESS_KEY_ID:$AWS_SECRET_ACCESS_KEY" \
  -d '{
    "anthropic_version": "bedrock-2023-05-31",
    "max_tokens": 1024,
    "messages": [
        {"role": "user", "content": "Explain quantum computing in one sentence."}
    ]
  }'

Nota

Se utilizzi credenziali temporanee di AWS STS (ad esempio, un ruolo assunto), passa anche il token di sessione aggiungendolo alla richiesta. -H "X-Amz-Security-Token: $AWS_SESSION_TOKEN" Per la maggior parte dei casi d'uso consigliamo gli AWS SDK o la CLI, che gestiscono automaticamente la firma delle richieste e l'aggiornamento delle credenziali.

Risposte in streaming

Per ricevere i token di risposta in modo incrementale man mano che vengono generati, scegli la scheda corrispondente al tuo metodo preferito, quindi segui i passaggi:

Funzionalità supportate

Oltre alle precedenti sezioni Extended thinking, Adaptive thinking, Structured Output, Compaction, Fallback credit for Reflused Requests (beta) e Mid-conversation System messages, l'API Messages supporta le seguenti funzionalità con i modelli Claude:

Istruzioni di sistema: imposta il comportamento del modello con un parametro. system
Multi-turn conversazioni — Passa messaggi alternati. user assistant
Uso dell'utensile: definisce gli strumenti che il modello può chiamare. Per informazioni, consulta Utilizzo di uno strumento per completare una risposta al modello Amazon Bedrock.
Visione: invia immagini nell'contentarray insieme al testo.
Memorizzazione rapida nella cache: memorizza nella cache il contesto utilizzato di frequente per ridurre latenza e costi.

Per il riferimento completo al campo di richiesta e risposta dell'API Messages, consulta. Richiesta e risposta

Conta i token

Per contare il numero di token di input che una richiesta consumerebbe prima di inviarla per l'inferenza, usa il count_tokens percorso Anthropic sull'endpoint. bedrock-mantle Questo è l'unico percorso di conteggio dei token supportato per i modelli Claude che non sono disponibili su un Region-specific endpoint, inclusi i modelli Claude che vengono avviati solo bedrock-runtime con l'inferenza tra regioni (CRIS). Per informazioni dettagliate e un esempio, consulta Conta i token usando l'endpoint bedrock-mantle.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

API di completamento della chat

Pensiero esteso