Regiones admitidas Requisitos previos Solicitud básica Transmita las respuestas Características admitidas Cuente los tokens

Inferencia mediante la API de mensajes antrópicos

La API de mensajes antrópicos proporciona acceso nativo a los modelos de Claude mediante el formato de solicitud y respuesta de Anthropic. Puede usar la API de mensajes tanto en los bedrock-runtime puntos finales como en bedrock-mantle los terminales, lo que le brinda flexibilidad para elegir el estilo de autenticación e integración que mejor se adapte a su aplicación.

Punto de conexión	URL base	Caso de uso
`bedrock-mantle`	`https://bedrock-mantle.{region}.api.aws/anthropic/v1/messages`	Recomendado para aplicaciones nuevas. Admite la autenticación de claves API y. Espacios de trabajo () Anthropic-compatible
`bedrock-runtime`	`https://bedrock-runtime.{region}.amazonaws.com`	Úselo con las integraciones de AWS SDK y el registro de invocaciones existentes.

Regiones admitidas

La API de mensajes está disponible en los bedrock-mantle terminales de todas las regiones compatibles bedrock-mantle (consulteRegiones y puntos finales compatibles). En el bedrock-runtime punto final, está disponible en todas las regiones en las que están disponibles los modelos Claude. Para obtener más información, consulte Disponibilidad regional por modelos.

Requisitos previos

Antes de usar la API de mensajes, asegúrate de tener lo siguiente:

Acceso a modelos: solicite acceso a los modelos Claude en la consola Amazon Bedrock. Consulte Solicita acceso a los modelos.
Autenticación: depende del punto final:
- bedrock-mantle— Utilice una clave de API de Amazon Bedrock (consulteClaves de API) o credenciales AWS SigV4.
- bedrock-runtime— Utilice las credenciales AWS SigV4 a través del AWS SDK (boto3, etc.).
Encabezado de la versión antrópica: todas las solicitudes requieren una versión de API:
- bedrock-mantle: Se establece anthropic-version: 2023-06-01 como un encabezado HTTP.
- bedrock-runtime: Se establece "anthropic_version": "bedrock-2023-05-31" en el cuerpo de la solicitud.

Solicitud básica

Para enviar un mensaje básico a un modelo de Claude, elija la pestaña del método que prefiera y, a continuación, siga los pasos:

bedrock-mantle (curl)


curl -X POST https://bedrock-mantle.us-east-1.api.aws/anthropic/v1/messages \
  -H "x-api-key: $BEDROCK_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "anthropic.claude-sonnet-4-6-v1",
    "max_tokens": 1024,
    "messages": [
        {"role": "user", "content": "Explain quantum computing in one sentence."}
    ]
  }'

bedrock-runtime (Python)


import boto3
import json

client = boto3.client("bedrock-runtime", region_name="us-east-1")

response = client.invoke_model(
    modelId="anthropic.claude-sonnet-4-6-v1",
    body=json.dumps({
        "anthropic_version": "bedrock-2023-05-31",
        "max_tokens": 1024,
        "messages": [
            {"role": "user", "content": "Explain quantum computing in one sentence."}
        ]
    })
)

result = json.loads(response["body"].read())
print(result["content"][0]["text"])

bedrock-runtime (AWS CLI)

Utilice la AWS CLI para invocar el modelo:


aws bedrock-runtime invoke-model \
  --model-id anthropic.claude-sonnet-4-6-v1 \
  --body '{
    "anthropic_version": "bedrock-2023-05-31",
    "max_tokens": 1024,
    "messages": [
        {"role": "user", "content": "Explain quantum computing in one sentence."}
    ]
  }' \
  --cli-binary-format raw-in-base64-out \
  output.json

bedrock-runtime (curl)

Puede llamar bedrock-runtime directamente con curl firmando la solicitud con AWS SiGv4. El siguiente ejemplo usa el --aws-sigv4 indicador integrado de curl (disponible en curl 7.75.0 y versiones posteriores):


curl -X POST \
  "https://bedrock-runtime.us-east-1.amazonaws.com/model/anthropic.claude-sonnet-4-6-v1/invoke" \
  -H "Content-Type: application/json" \
  --aws-sigv4 "aws:amz:us-east-1:bedrock" \
  --user "$AWS_ACCESS_KEY_ID:$AWS_SECRET_ACCESS_KEY" \
  -d '{
    "anthropic_version": "bedrock-2023-05-31",
    "max_tokens": 1024,
    "messages": [
        {"role": "user", "content": "Explain quantum computing in one sentence."}
    ]
  }'

nota

Si utiliza credenciales temporales de AWS STS (por ejemplo, un rol asumido), -H "X-Amz-Security-Token: $AWS_SESSION_TOKEN" añada también el token de sesión a la solicitud. Para la mayoría de los casos de uso, recomendamos los AWS SDK o la CLI, que gestionan la firma de solicitudes y la actualización de credenciales automáticamente.

Transmita las respuestas

Para recibir los tokens de respuesta de forma incremental a medida que se generan, selecciona la pestaña del método que prefieras y, a continuación, sigue estos pasos:

Características admitidas

Además de las secciones anteriores sobre pensamiento extendido, pensamiento adaptativo, resultados estructurados, compactación, crédito alternativo por solicitudes rechazadas (beta) y mensajes Mid-conversation del sistema, la API de mensajes admite las siguientes funciones con los modelos Claude:

Indicaciones del sistema: defina el comportamiento del modelo con un parámetro. system
Multi-turn conversaciones: pase alternativamente assistant mensajes user y mensajes.
Uso de herramientas: defina las herramientas a las que el modelo puede recurrir. Consulte Uso de una herramienta para completar una respuesta modelo de Amazon Bedrock.
Visión: envíe imágenes de la content matriz junto con el texto.
Almacenamiento rápido en caché: almacene en caché el contexto de uso frecuente para reducir la latencia y el coste.

Para ver la referencia completa de los campos de solicitud y respuesta de la API de Mensajes, consulteSolicitud y respuesta.

Cuente los tokens

Para contar el número de fichas de entrada que consumiría una solicitud antes de enviarla con fines de inferencia, usa la count_tokens ruta antrópica del bedrock-mantle punto final. Esta es la única ruta de recuento de fichas compatible con los modelos Claude que no están disponibles bedrock-runtime con un Region-specific punto final, incluidos los modelos Claude que se inician únicamente con la inferencia entre regiones (CRIS). Para obtener información detallada y un ejemplo, consulte Cuente las fichas utilizando el punto final rocoso-manto.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

API de finalización de chats

Pensamiento extendido