Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Inferencia mediante la API de mensajes antrópicos
<a name="inference-messages-api"></a>

La API de mensajes antrópicos proporciona acceso nativo a los modelos de Claude mediante el formato de solicitud y respuesta de Anthropic. Puede usar la API de mensajes tanto en los `bedrock-runtime` puntos finales como en `bedrock-mantle` los terminales, lo que le brinda flexibilidad para elegir el estilo de autenticación e integración que mejor se adapte a su aplicación.


| **Punto de conexión** | **URL base** | **Caso de uso** | 
| --- | --- | --- | 
| bedrock-mantle | https://bedrock-mantle.{region}.api.aws/anthropic/v1/messages | Recomendado para aplicaciones nuevas. Admite la autenticación de claves API y. [Espacios de trabajo () Anthropic-compatible](workspaces.md) | 
| bedrock-runtime | https://bedrock-runtime.{region}.amazonaws.com | Úselo con las integraciones de AWS SDK y el registro de invocaciones existentes. | 

## Regiones admitidas
<a name="inference-messages-api-supported"></a>

La API de mensajes está disponible en los `bedrock-mantle` terminales de todas las regiones compatibles `bedrock-mantle` (consulte[Regiones y puntos finales compatibles](bedrock-mantle.md#bedrock-mantle-supported)). En el `bedrock-runtime` punto final, está disponible en todas las regiones en las que están disponibles los modelos Claude. Para obtener más información, consulte [Disponibilidad regional](models-region-compatibility.md).

## Requisitos previos
<a name="inference-messages-api-prereq"></a>

Antes de usar la API de mensajes, asegúrate de tener lo siguiente:
+ **Acceso a modelos**: solicite acceso a los modelos Claude en la consola Amazon Bedrock. Consulte [Solicita acceso a los modelos](model-access.md).
+ **Autenticación**: depende del punto final:
  + `bedrock-mantle`— Utilice una clave de API de Amazon Bedrock (consulte[Claves de API](api-keys.md)) o credenciales AWS SigV4.
  + `bedrock-runtime`— Utilice las credenciales AWS SigV4 a través del AWS SDK (boto3, etc.).
+ **Encabezado de la versión antrópica**: todas las solicitudes requieren una versión de API:
  + `bedrock-mantle`: Se establece `anthropic-version: 2023-06-01` como un encabezado HTTP.
  + `bedrock-runtime`: Se establece `"anthropic_version": "bedrock-2023-05-31"` en el cuerpo de la solicitud.

## Solicitud básica
<a name="inference-messages-api-basic"></a>

Para enviar un mensaje básico a un modelo de Claude, elija la pestaña del método que prefiera y, a continuación, siga los pasos:

------
#### [ bedrock-mantle (curl) ]

```
curl -X POST https://bedrock-mantle.us-east-1.api.aws/anthropic/v1/messages \
  -H "x-api-key: $BEDROCK_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "anthropic.claude-sonnet-4-6-v1",
    "max_tokens": 1024,
    "messages": [
        {"role": "user", "content": "Explain quantum computing in one sentence."}
    ]
  }'
```

------
#### [ bedrock-runtime (Python) ]

```
import boto3
import json

client = boto3.client("bedrock-runtime", region_name="us-east-1")

response = client.invoke_model(
    modelId="anthropic.claude-sonnet-4-6-v1",
    body=json.dumps({
        "anthropic_version": "bedrock-2023-05-31",
        "max_tokens": 1024,
        "messages": [
            {"role": "user", "content": "Explain quantum computing in one sentence."}
        ]
    })
)

result = json.loads(response["body"].read())
print(result["content"][0]["text"])
```

------
#### [ bedrock-runtime (curl) ]

Utilice la AWS CLI para invocar el modelo:

```
aws bedrock-runtime invoke-model \
  --model-id anthropic.claude-sonnet-4-6-v1 \
  --body '{
    "anthropic_version": "bedrock-2023-05-31",
    "max_tokens": 1024,
    "messages": [
        {"role": "user", "content": "Explain quantum computing in one sentence."}
    ]
  }' \
  --cli-binary-format raw-in-base64-out \
  output.json
```

------

## Transmita las respuestas
<a name="inference-messages-api-streaming"></a>

Para recibir los tokens de respuesta de forma incremental a medida que se generan, selecciona la pestaña del método que prefieras y, a continuación, sigue estos pasos:

------
#### [ bedrock-mantle (curl) ]

```
curl -X POST https://bedrock-mantle.us-east-1.api.aws/anthropic/v1/messages \
  -H "x-api-key: $BEDROCK_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "anthropic.claude-sonnet-4-6-v1",
    "max_tokens": 1024,
    "stream": true,
    "messages": [
        {"role": "user", "content": "Write a short poem about cloud computing."}
    ]
  }'
```

------
#### [ bedrock-runtime (Python) ]

```
import boto3
import json

client = boto3.client("bedrock-runtime", region_name="us-east-1")

response = client.invoke_model_with_response_stream(
    modelId="anthropic.claude-sonnet-4-6-v1",
    body=json.dumps({
        "anthropic_version": "bedrock-2023-05-31",
        "max_tokens": 1024,
        "messages": [
            {"role": "user", "content": "Write a short poem about cloud computing."}
        ]
    })
)

for event in response["body"]:
    chunk = json.loads(event["chunk"]["bytes"])
    if chunk["type"] == "content_block_delta":
        print(chunk["delta"]["text"], end="")
```

------

## Características admitidas
<a name="inference-messages-api-features"></a>

La API de mensajes admite las siguientes funciones avanzadas con los modelos Claude:
+ **Indicaciones del sistema**: defina el comportamiento del modelo con un `system` parámetro.
+ **Multi-turn conversaciones**: pase alternativamente `assistant` mensajes `user` y mensajes.
+ **Uso de herramientas**: defina las herramientas a las que el modelo puede recurrir. Consulte [Uso de una herramienta para completar una respuesta modelo de Amazon Bedrock](tool-use.md).
+ **Visión**: envíe imágenes de la `content` matriz junto con el texto.
+ **Pensamiento extendido**: habilite el razonamiento en cadena de pensamiento. Consulte [Mejora de las respuestas de los modelos con el razonamiento de modelos](inference-reasoning.md).
+ Almacenamiento **rápido en caché: almacene** en caché el contexto de uso frecuente para reducir la latencia y los costes.

Para ver el formato completo de solicitud y respuesta de la API de Mensajes, incluidos todos los parámetros y funciones, consulte[Anthropic Claude API de Messages de  ](model-parameters-anthropic-claude-messages.md).

## Cuente los tokens
<a name="inference-messages-api-count-tokens"></a>

Para contar el número de fichas de entrada que consumiría una solicitud antes de enviarla con fines de inferencia, usa la `count_tokens` ruta antrópica del `bedrock-mantle` punto final. Esta es la única ruta de recuento de fichas compatible con los modelos Claude que no están disponibles `bedrock-runtime` con un Region-specific punto final, incluidos los modelos Claude que se inician únicamente con la inferencia entre regiones (CRIS). Para obtener información detallada y un ejemplo, consulte [Cuente las fichas utilizando el punto final rocoso-manto](count-tokens.md#count-tokens-mantle).