View a markdown version of this page

Inferência usando a API de mensagens antrópicas - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Inferência usando a API de mensagens antrópicas

A API Anthropic Messages fornece acesso nativo aos modelos Claude usando o formato de solicitação e resposta do Anthropic. Você pode usar a API de mensagens nos bedrock-runtime terminais bedrock-mantle e nos terminais, oferecendo flexibilidade para escolher o estilo de autenticação e integração adequado ao seu aplicativo.

Endpoint URL base Caso de uso
bedrock-mantle https://bedrock-mantle.{region}.api.aws/anthropic/v1/messages Recomendado para novas aplicações. Suporta autenticação de chave de API e. Espaços de trabalho () Anthropic-compatible
bedrock-runtime https://bedrock-runtime.{region}.amazonaws.com Use com integrações de AWS SDK e registro de invocações existentes.

Regiões aceitas

A API de mensagens está disponível no bedrock-mantle endpoint em todas as regiões compatíveis bedrock-mantle (consulteRegiões e endpoints compatíveis). No bedrock-runtime endpoint, ele está disponível em todas as regiões em que os modelos Claude estão disponíveis. Para mais detalhes, consulte Disponibilidade regional.

Pré-requisitos

Antes de usar a API de mensagens, verifique se você tem o seguinte:

  • Acesso ao modelo — Solicite acesso aos modelos Claude no console Amazon Bedrock. Consulte Solicitar acesso aos modelos.

  • Autenticação — Depende do endpoint:

    • bedrock-mantle— Use uma chave de API Amazon Bedrock (consulteChaves de API) ou credenciais AWS SigV4.

    • bedrock-runtime— Use as credenciais AWS SigV4 por meio do AWS SDK (boto3, etc.).

  • Cabeçalho da versão antrópica — Todas as solicitações exigem uma versão de API:

    • bedrock-mantle: definido anthropic-version: 2023-06-01 como um cabeçalho HTTP.

    • bedrock-runtime: definido "anthropic_version": "bedrock-2023-05-31" no corpo da solicitação.

Solicitação básica

Para enviar uma mensagem básica para um modelo Claude, escolha a guia do seu método preferido e siga as etapas:

bedrock-mantle (curl)
curl -X POST https://bedrock-mantle.us-east-1.api.aws/anthropic/v1/messages \ -H "x-api-key: $BEDROCK_API_KEY" \ -H "anthropic-version: 2023-06-01" \ -H "Content-Type: application/json" \ -d '{ "model": "anthropic.claude-sonnet-4-6-v1", "max_tokens": 1024, "messages": [ {"role": "user", "content": "Explain quantum computing in one sentence."} ] }'
bedrock-runtime (Python)
import boto3 import json client = boto3.client("bedrock-runtime", region_name="us-east-1") response = client.invoke_model( modelId="anthropic.claude-sonnet-4-6-v1", body=json.dumps({ "anthropic_version": "bedrock-2023-05-31", "max_tokens": 1024, "messages": [ {"role": "user", "content": "Explain quantum computing in one sentence."} ] }) ) result = json.loads(response["body"].read()) print(result["content"][0]["text"])
bedrock-runtime (curl)

Use a AWS CLI para invocar o modelo:

aws bedrock-runtime invoke-model \ --model-id anthropic.claude-sonnet-4-6-v1 \ --body '{ "anthropic_version": "bedrock-2023-05-31", "max_tokens": 1024, "messages": [ {"role": "user", "content": "Explain quantum computing in one sentence."} ] }' \ --cli-binary-format raw-in-base64-out \ output.json

Transmita respostas

Para receber tokens de resposta incrementalmente à medida que são gerados, escolha a guia do seu método preferido e siga as etapas:

bedrock-mantle (curl)
curl -X POST https://bedrock-mantle.us-east-1.api.aws/anthropic/v1/messages \ -H "x-api-key: $BEDROCK_API_KEY" \ -H "anthropic-version: 2023-06-01" \ -H "Content-Type: application/json" \ -d '{ "model": "anthropic.claude-sonnet-4-6-v1", "max_tokens": 1024, "stream": true, "messages": [ {"role": "user", "content": "Write a short poem about cloud computing."} ] }'
bedrock-runtime (Python)
import boto3 import json client = boto3.client("bedrock-runtime", region_name="us-east-1") response = client.invoke_model_with_response_stream( modelId="anthropic.claude-sonnet-4-6-v1", body=json.dumps({ "anthropic_version": "bedrock-2023-05-31", "max_tokens": 1024, "messages": [ {"role": "user", "content": "Write a short poem about cloud computing."} ] }) ) for event in response["body"]: chunk = json.loads(event["chunk"]["bytes"]) if chunk["type"] == "content_block_delta": print(chunk["delta"]["text"], end="")

Recursos compatíveis

A API de mensagens oferece suporte aos seguintes recursos avançados com os modelos Claude:

Para ver o formato completo de solicitação e resposta da API de mensagens, incluindo todos os parâmetros e recursos, consulteAnthropic Claude API Messages do da.

Contar fichas

Para contar o número de tokens de entrada que uma solicitação consumiria antes de enviá-la para inferência, use o count_tokens caminho antrópico no bedrock-mantle endpoint. Esse é o único caminho de contagem de tokens compatível com modelos Claude que não estão disponíveis em um Region-specific endpoint, incluindo modelos Claude que são iniciados somente bedrock-runtime com inferência entre regiões (CRIS). Para obter detalhes e um exemplo, consulte Conte os tokens usando o ponto final Bedrock-mantle.