As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Inferência usando a API de mensagens antrópicas
<a name="inference-messages-api"></a>

A API Anthropic Messages fornece acesso nativo aos modelos Claude usando o formato de solicitação e resposta do Anthropic. Você pode usar a API de mensagens nos `bedrock-runtime` terminais `bedrock-mantle` e nos terminais, oferecendo flexibilidade para escolher o estilo de autenticação e integração adequado ao seu aplicativo.


| **Endpoint** | **URL base** | **Caso de uso** | 
| --- | --- | --- | 
| bedrock-mantle | https://bedrock-mantle.{region}.api.aws/anthropic/v1/messages | Recomendado para novas aplicações. Suporta autenticação de chave de API e. [Espaços de trabalho () Anthropic-compatible](workspaces.md) | 
| bedrock-runtime | https://bedrock-runtime.{region}.amazonaws.com | Use com integrações de AWS SDK e registro de invocações existentes. | 

## Regiões aceitas
<a name="inference-messages-api-supported"></a>

A API de mensagens está disponível no `bedrock-mantle` endpoint em todas as regiões compatíveis `bedrock-mantle` (consulte[Regiões e endpoints compatíveis](bedrock-mantle.md#bedrock-mantle-supported)). No `bedrock-runtime` endpoint, ele está disponível em todas as regiões em que os modelos Claude estão disponíveis. Para mais detalhes, consulte [Disponibilidade regional](models-region-compatibility.md).

## Pré-requisitos
<a name="inference-messages-api-prereq"></a>

Antes de usar a API de mensagens, verifique se você tem o seguinte:
+ **Acesso ao modelo** — Solicite acesso aos modelos Claude no console Amazon Bedrock. Consulte [Solicitar acesso aos modelos](model-access.md).
+ **Autenticação** — Depende do endpoint:
  + `bedrock-mantle`— Use uma chave de API Amazon Bedrock (consulte[Chaves de API](api-keys.md)) ou credenciais AWS SigV4.
  + `bedrock-runtime`— Use as credenciais AWS SigV4 por meio do AWS SDK (boto3, etc.).
+ **Cabeçalho da versão antrópica** — Todas as solicitações exigem uma versão de API:
  + `bedrock-mantle`: definido `anthropic-version: 2023-06-01` como um cabeçalho HTTP.
  + `bedrock-runtime`: definido `"anthropic_version": "bedrock-2023-05-31"` no corpo da solicitação.

## Solicitação básica
<a name="inference-messages-api-basic"></a>

Para enviar uma mensagem básica para um modelo Claude, escolha a guia do seu método preferido e siga as etapas:

------
#### [ bedrock-mantle (curl) ]

```
curl -X POST https://bedrock-mantle.us-east-1.api.aws/anthropic/v1/messages \
  -H "x-api-key: $BEDROCK_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "anthropic.claude-sonnet-4-6-v1",
    "max_tokens": 1024,
    "messages": [
        {"role": "user", "content": "Explain quantum computing in one sentence."}
    ]
  }'
```

------
#### [ bedrock-runtime (Python) ]

```
import boto3
import json

client = boto3.client("bedrock-runtime", region_name="us-east-1")

response = client.invoke_model(
    modelId="anthropic.claude-sonnet-4-6-v1",
    body=json.dumps({
        "anthropic_version": "bedrock-2023-05-31",
        "max_tokens": 1024,
        "messages": [
            {"role": "user", "content": "Explain quantum computing in one sentence."}
        ]
    })
)

result = json.loads(response["body"].read())
print(result["content"][0]["text"])
```

------
#### [ bedrock-runtime (curl) ]

Use a AWS CLI para invocar o modelo:

```
aws bedrock-runtime invoke-model \
  --model-id anthropic.claude-sonnet-4-6-v1 \
  --body '{
    "anthropic_version": "bedrock-2023-05-31",
    "max_tokens": 1024,
    "messages": [
        {"role": "user", "content": "Explain quantum computing in one sentence."}
    ]
  }' \
  --cli-binary-format raw-in-base64-out \
  output.json
```

------

## Transmita respostas
<a name="inference-messages-api-streaming"></a>

Para receber tokens de resposta incrementalmente à medida que são gerados, escolha a guia do seu método preferido e siga as etapas:

------
#### [ bedrock-mantle (curl) ]

```
curl -X POST https://bedrock-mantle.us-east-1.api.aws/anthropic/v1/messages \
  -H "x-api-key: $BEDROCK_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "anthropic.claude-sonnet-4-6-v1",
    "max_tokens": 1024,
    "stream": true,
    "messages": [
        {"role": "user", "content": "Write a short poem about cloud computing."}
    ]
  }'
```

------
#### [ bedrock-runtime (Python) ]

```
import boto3
import json

client = boto3.client("bedrock-runtime", region_name="us-east-1")

response = client.invoke_model_with_response_stream(
    modelId="anthropic.claude-sonnet-4-6-v1",
    body=json.dumps({
        "anthropic_version": "bedrock-2023-05-31",
        "max_tokens": 1024,
        "messages": [
            {"role": "user", "content": "Write a short poem about cloud computing."}
        ]
    })
)

for event in response["body"]:
    chunk = json.loads(event["chunk"]["bytes"])
    if chunk["type"] == "content_block_delta":
        print(chunk["delta"]["text"], end="")
```

------

## Recursos compatíveis
<a name="inference-messages-api-features"></a>

A API de mensagens oferece suporte aos seguintes recursos avançados com os modelos Claude:
+ **Solicitações do sistema** — Defina o comportamento do modelo com um `system` parâmetro.
+ **Multi-turn conversas** — Passe alternância `user` e `assistant` mensagens.
+ **Uso da ferramenta** — Defina as ferramentas que o modelo pode chamar. Consulte [Use uma ferramenta para concluir uma resposta do modelo do Amazon Bedrock](tool-use.md).
+ **Visão** — Envie imagens na `content` matriz junto com o texto.
+ **Pensamento estendido** — Permita o raciocínio em cadeia de pensamento. Consulte [Melhorar as respostas do modelo com o raciocínio de modelo](inference-reasoning.md).
+ **Cache imediato — Armazene** em cache o contexto usado com frequência para reduzir a latência e o custo.

Para ver o formato completo de solicitação e resposta da API de mensagens, incluindo todos os parâmetros e recursos, consulte[Anthropic Claude API Messages do da](model-parameters-anthropic-claude-messages.md).

## Contar fichas
<a name="inference-messages-api-count-tokens"></a>

Para contar o número de tokens de entrada que uma solicitação consumiria antes de enviá-la para inferência, use o `count_tokens` caminho antrópico no `bedrock-mantle` endpoint. Esse é o único caminho de contagem de tokens compatível com modelos Claude que não estão disponíveis em um Region-specific endpoint, incluindo modelos Claude que são iniciados somente `bedrock-runtime` com inferência entre regiões (CRIS). Para obter detalhes e um exemplo, consulte [Conte os tokens usando o ponto final Bedrock-mantle](count-tokens.md#count-tokens-mantle).