

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Inferenza utilizzando l'API Anthropic Messages
<a name="inference-messages-api"></a>

L'API Anthropic Messages fornisce l'accesso nativo ai modelli di Claude utilizzando il formato di richiesta e risposta Anthropic. Puoi utilizzare l'API Messages sia sugli endpoint che sugli `bedrock-runtime` endpoint, offrendoti la `bedrock-mantle` flessibilità di scegliere lo stile di autenticazione e integrazione più adatto alla tua applicazione.


| **Endpoint** | **URL di base** | **Caso d'uso** | 
| --- | --- | --- | 
| bedrock-mantle | https://bedrock-mantle.{region}.api.aws/anthropic/v1/messages | Consigliato per nuove applicazioni. Supporta l'autenticazione delle chiavi API e[Spazi di lavoro () Anthropic-compatible](workspaces.md). | 
| bedrock-runtime | https://bedrock-runtime.{region}.amazonaws.com | Utilizzalo con le integrazioni AWS SDK esistenti e la registrazione delle chiamate. | 

## Regioni supportate
<a name="inference-messages-api-supported"></a>

L'API Messages è disponibile sull'`bedrock-mantle`endpoint in tutte le regioni che supportano (vedi). `bedrock-mantle` [Regioni ed endpoint supportati](bedrock-mantle.md#bedrock-mantle-supported) Sull'`bedrock-runtime`endpoint, è disponibile in tutte le regioni in cui sono disponibili i modelli Claude. Per informazioni dettagliate, vedi [Disponibilità regionale](models-region-compatibility.md).

## Prerequisiti
<a name="inference-messages-api-prereq"></a>

Prima di utilizzare l'API Messages, assicurati di disporre di quanto segue:
+ **Accesso ai modelli**: richiedi l'accesso ai modelli Claude nella console Amazon Bedrock. Per informazioni, consulta [Richiedi l'accesso ai modelli](model-access.md).
+ **Autenticazione**: dipende dall'endpoint:
  + `bedrock-mantle`— Utilizza una chiave API Amazon Bedrock (vedi[Chiavi API](api-keys.md)) o credenziali AWS SigV4.
  + `bedrock-runtime`— Usa le credenziali AWS SigV4 tramite l' AWS SDK (boto3, ecc.).
+ **Intestazione della versione antropica: tutte le richieste richiedono una versione** API:
  + `bedrock-mantle`: Imposta `anthropic-version: 2023-06-01` come intestazione HTTP.
  + `bedrock-runtime`: impostato `"anthropic_version": "bedrock-2023-05-31"` nel corpo della richiesta.

## Richiesta di base
<a name="inference-messages-api-basic"></a>

Per inviare un messaggio di base a un modello Claude, scegli la scheda corrispondente al metodo che preferisci, quindi segui i passaggi:

------
#### [ bedrock-mantle (curl) ]

```
curl -X POST https://bedrock-mantle.us-east-1.api.aws/anthropic/v1/messages \
  -H "x-api-key: $BEDROCK_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "anthropic.claude-sonnet-4-6-v1",
    "max_tokens": 1024,
    "messages": [
        {"role": "user", "content": "Explain quantum computing in one sentence."}
    ]
  }'
```

------
#### [ bedrock-runtime (Python) ]

```
import boto3
import json

client = boto3.client("bedrock-runtime", region_name="us-east-1")

response = client.invoke_model(
    modelId="anthropic.claude-sonnet-4-6-v1",
    body=json.dumps({
        "anthropic_version": "bedrock-2023-05-31",
        "max_tokens": 1024,
        "messages": [
            {"role": "user", "content": "Explain quantum computing in one sentence."}
        ]
    })
)

result = json.loads(response["body"].read())
print(result["content"][0]["text"])
```

------
#### [ bedrock-runtime (curl) ]

Usa la AWS CLI per richiamare il modello:

```
aws bedrock-runtime invoke-model \
  --model-id anthropic.claude-sonnet-4-6-v1 \
  --body '{
    "anthropic_version": "bedrock-2023-05-31",
    "max_tokens": 1024,
    "messages": [
        {"role": "user", "content": "Explain quantum computing in one sentence."}
    ]
  }' \
  --cli-binary-format raw-in-base64-out \
  output.json
```

------

## Risposte in streaming
<a name="inference-messages-api-streaming"></a>

Per ricevere i token di risposta in modo incrementale man mano che vengono generati, scegli la scheda corrispondente al tuo metodo preferito, quindi segui i passaggi:

------
#### [ bedrock-mantle (curl) ]

```
curl -X POST https://bedrock-mantle.us-east-1.api.aws/anthropic/v1/messages \
  -H "x-api-key: $BEDROCK_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "anthropic.claude-sonnet-4-6-v1",
    "max_tokens": 1024,
    "stream": true,
    "messages": [
        {"role": "user", "content": "Write a short poem about cloud computing."}
    ]
  }'
```

------
#### [ bedrock-runtime (Python) ]

```
import boto3
import json

client = boto3.client("bedrock-runtime", region_name="us-east-1")

response = client.invoke_model_with_response_stream(
    modelId="anthropic.claude-sonnet-4-6-v1",
    body=json.dumps({
        "anthropic_version": "bedrock-2023-05-31",
        "max_tokens": 1024,
        "messages": [
            {"role": "user", "content": "Write a short poem about cloud computing."}
        ]
    })
)

for event in response["body"]:
    chunk = json.loads(event["chunk"]["bytes"])
    if chunk["type"] == "content_block_delta":
        print(chunk["delta"]["text"], end="")
```

------

## Funzionalità supportate
<a name="inference-messages-api-features"></a>

L'API Messages supporta le seguenti funzionalità avanzate con i modelli Claude:
+ **Istruzioni di sistema:** imposta il comportamento del modello con un parametro. `system`
+ **Multi-turn conversazioni** — Passa messaggi alternati. `user` `assistant`
+ **Uso dell'utensile**: definisce gli strumenti che il modello può chiamare. Per informazioni, consulta [Utilizzo di uno strumento per completare una risposta al modello Amazon Bedrock](tool-use.md).
+ **Visione**: invia immagini nell'`content`array insieme al testo.
+ **Pensiero esteso**: abilita il ragionamento basato sulla catena di pensiero. Per informazioni, consulta [Migliorare le risposte del modello con il ragionamento basato su modello](inference-reasoning.md).
+ **Memorizzazione rapida nella** cache: memorizza nella cache il contesto utilizzato di frequente per ridurre latenza e costi.

Per il formato completo di richiesta e risposta dell'API Messages, inclusi tutti i parametri e le funzionalità, consulta. [Anthropic Claude API Messages di  ](model-parameters-anthropic-claude-messages.md)

## Conta i token
<a name="inference-messages-api-count-tokens"></a>

Per contare il numero di token di input che una richiesta consumerebbe prima di inviarla per l'inferenza, usa il `count_tokens` percorso Anthropic sull'endpoint. `bedrock-mantle` Questo è l'unico percorso di conteggio dei token supportato per i modelli Claude che non sono disponibili su un Region-specific endpoint, inclusi i modelli Claude che vengono avviati solo `bedrock-runtime` con l'inferenza tra regioni (CRIS). Per informazioni dettagliate e un esempio, consulta [Conta i token usando l'endpoint bedrock-mantle](count-tokens.md#count-tokens-mantle).