View a markdown version of this page

Inferencia mediante la API de mensajes antrópicos - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Inferencia mediante la API de mensajes antrópicos

La API de mensajes antrópicos proporciona acceso nativo a los modelos de Claude mediante el formato de solicitud y respuesta de Anthropic. Puede usar la API de mensajes tanto en los bedrock-runtime puntos finales como en bedrock-mantle los terminales, lo que le brinda flexibilidad para elegir el estilo de autenticación e integración que mejor se adapte a su aplicación.

Punto de conexión URL base Caso de uso
bedrock-mantle https://bedrock-mantle.{region}.api.aws/anthropic/v1/messages Recomendado para aplicaciones nuevas. Admite la autenticación de claves API y. Espacios de trabajo () Anthropic-compatible
bedrock-runtime https://bedrock-runtime.{region}.amazonaws.com Úselo con las integraciones de AWS SDK y el registro de invocaciones existentes.

Regiones admitidas

La API de mensajes está disponible en los bedrock-mantle terminales de todas las regiones compatibles bedrock-mantle (consulteRegiones y puntos finales compatibles). En el bedrock-runtime punto final, está disponible en todas las regiones en las que están disponibles los modelos Claude. Para obtener más información, consulte Disponibilidad regional.

Requisitos previos

Antes de usar la API de mensajes, asegúrate de tener lo siguiente:

  • Acceso a modelos: solicite acceso a los modelos Claude en la consola Amazon Bedrock. Consulte Solicita acceso a los modelos.

  • Autenticación: depende del punto final:

    • bedrock-mantle— Utilice una clave de API de Amazon Bedrock (consulteClaves de API) o credenciales AWS SigV4.

    • bedrock-runtime— Utilice las credenciales AWS SigV4 a través del AWS SDK (boto3, etc.).

  • Encabezado de la versión antrópica: todas las solicitudes requieren una versión de API:

    • bedrock-mantle: Se establece anthropic-version: 2023-06-01 como un encabezado HTTP.

    • bedrock-runtime: Se establece "anthropic_version": "bedrock-2023-05-31" en el cuerpo de la solicitud.

Solicitud básica

Para enviar un mensaje básico a un modelo de Claude, elija la pestaña del método que prefiera y, a continuación, siga los pasos:

bedrock-mantle (curl)
curl -X POST https://bedrock-mantle.us-east-1.api.aws/anthropic/v1/messages \ -H "x-api-key: $BEDROCK_API_KEY" \ -H "anthropic-version: 2023-06-01" \ -H "Content-Type: application/json" \ -d '{ "model": "anthropic.claude-sonnet-4-6-v1", "max_tokens": 1024, "messages": [ {"role": "user", "content": "Explain quantum computing in one sentence."} ] }'
bedrock-runtime (Python)
import boto3 import json client = boto3.client("bedrock-runtime", region_name="us-east-1") response = client.invoke_model( modelId="anthropic.claude-sonnet-4-6-v1", body=json.dumps({ "anthropic_version": "bedrock-2023-05-31", "max_tokens": 1024, "messages": [ {"role": "user", "content": "Explain quantum computing in one sentence."} ] }) ) result = json.loads(response["body"].read()) print(result["content"][0]["text"])
bedrock-runtime (curl)

Utilice la AWS CLI para invocar el modelo:

aws bedrock-runtime invoke-model \ --model-id anthropic.claude-sonnet-4-6-v1 \ --body '{ "anthropic_version": "bedrock-2023-05-31", "max_tokens": 1024, "messages": [ {"role": "user", "content": "Explain quantum computing in one sentence."} ] }' \ --cli-binary-format raw-in-base64-out \ output.json

Transmita las respuestas

Para recibir los tokens de respuesta de forma incremental a medida que se generan, selecciona la pestaña del método que prefieras y, a continuación, sigue estos pasos:

bedrock-mantle (curl)
curl -X POST https://bedrock-mantle.us-east-1.api.aws/anthropic/v1/messages \ -H "x-api-key: $BEDROCK_API_KEY" \ -H "anthropic-version: 2023-06-01" \ -H "Content-Type: application/json" \ -d '{ "model": "anthropic.claude-sonnet-4-6-v1", "max_tokens": 1024, "stream": true, "messages": [ {"role": "user", "content": "Write a short poem about cloud computing."} ] }'
bedrock-runtime (Python)
import boto3 import json client = boto3.client("bedrock-runtime", region_name="us-east-1") response = client.invoke_model_with_response_stream( modelId="anthropic.claude-sonnet-4-6-v1", body=json.dumps({ "anthropic_version": "bedrock-2023-05-31", "max_tokens": 1024, "messages": [ {"role": "user", "content": "Write a short poem about cloud computing."} ] }) ) for event in response["body"]: chunk = json.loads(event["chunk"]["bytes"]) if chunk["type"] == "content_block_delta": print(chunk["delta"]["text"], end="")

Características admitidas

La API de mensajes admite las siguientes funciones avanzadas con los modelos Claude:

Para ver el formato completo de solicitud y respuesta de la API de Mensajes, incluidos todos los parámetros y funciones, consulteAnthropic Claude API de Messages de  .

Cuente los tokens

Para contar el número de fichas de entrada que consumiría una solicitud antes de enviarla con fines de inferencia, usa la count_tokens ruta antrópica del bedrock-mantle punto final. Esta es la única ruta de recuento de fichas compatible con los modelos Claude que no están disponibles bedrock-runtime con un Region-specific punto final, incluidos los modelos Claude que se inician únicamente con la inferencia entre regiones (CRIS). Para obtener información detallada y un ejemplo, consulte Cuente las fichas utilizando el punto final rocoso-manto.