AI21 Amazon Anthropic Cohere DeepSeek Google Meta MiniMax Mistral Moonshot NVIDIA OpenAI Qwen Stability TwelveLabs Escritor XaI Z.AI Modelos compatibles StartAsyncInvoke InvokeModelWithBidirectionalStream

Compatibilidad de API por modelos

Amazon Bedrock admite cuatro familias de API de tiempo de ejecución, cada una diseñada para diferentes patrones de integración y casos de uso.

Familia Invoke: InvokeModel gestiona llamadas sincrónicas de respuesta única. InvokeModelWithResponseStreamdevuelve las respuestas como una transmisión en tiempo real. InvokeModelWithBidirectionalStreampermite la transmisión dúplex completa para aplicaciones interactivas. AsyncInvokeenvía las solicitudes de larga duración de forma asíncrona y almacena los resultados en Amazon S3.

Familia Converse: Converse proporciona una interfaz unificada e independiente del modelo para conversaciones sincrónicas en varios turnos. ConverseStreamofrece la misma experiencia con la salida de streaming.

OpenAI-compatible familia: ChatCompletions implementa la interfaz OpenAI Chat Completions, lo que permite que las OpenAI-based integraciones existentes se ejecuten en Bedrock con cambios mínimos. Responses La API implementa la interfaz de respuestas de OpenAI, que admite interacciones de agentes con estado con el uso de herramientas integradas y la administración del historial de conversaciones.

Familia de mensajes: Messages implementa la interfaz de Anthropic Messages en el bedrock-mantle terminal, lo que permite que las SDK-based integraciones Anthropic existentes se ejecuten en Bedrock con cambios mínimos.

Ahora veremos la lista de API compatibles con cada modelo.

AI21

Nombre de modelo	Invocación	Converse	Finalización del chat	Respuestas	Mensajes
Jamba 1.5 Large*
Jamba 1.5 Mini*

Amazon

Nombre de modelo	Invocación	Converse	Finalizaciones del chat	Respuestas	Mensajes
Incrustaciones multimodales de Amazon Nova
Nova 2 Lite*
Nova 2 Sonic
Nova Canvas
Nova Lite*
Nova Micro*
Nova Premier*
Nova Pro*
Nova Reel
Nova Sonic*
Titan Embeddings G1 - Text
Titan Image Generator G1 v2
Titan Multimodal Embeddings G1
Titan Text Embeddings V2

Anthropic

Nombre de modelo	Invocación	Converse	Finalizaciones del chat	Respuestas	Mensajes
Claude Soneto 5
Claude Mythos 5
Fábula de Claude 5
Vista previa de Claude Mythos
Claude 3 Haiku*
Claude 3.5 Haiku*
Claude Haiku 4.5*
Claude Opus 4.1*
Claude Opus 4.5*
Claude Opus 4.6*
Claude Opus 4.7*
Claude Opus 4.8*
Claude Sonnet 4*
Soneto Claude 4.5*
Soneto Claude 4.6*

Cohere

Nombre de modelo	Invocación	Converse	Finalizaciones del chat	Respuestas	Mensajes
Command R*
Command R+*
Embed English
Embed Multilingual
Incrustar v4
Rerank 3.5

DeepSeek

Nombre de modelo	Invocación	Converse	Finalizaciones del chat	Respuestas	Mensajes
DeepSeek V3.2*
DeepSeek-R1*
DeepSeek-V3.1*

Google

Nombre de modelo	Invocación	Converse	Finalizaciones del chat	Respuestas	Mensajes
Gemma 3 12B IT*
Gemma 3 27B PT*
Gemma 3 4B IT*

MiniMax

Nombre de modelo	Invocación	Converse	Finalizaciones del chat	Respuestas	Mensajes
MiniMax M2*
MiniMax M2.1*
MiniMax M2.5*

Mistral

Nombre de modelo	Invocación	Converse	Finalizaciones del chat	Respuestas	Mensajes
Devstral 2 123 GB*
Magistral Small 2509*
Ministral 14B 3.0*
Ministral 3 8B*
Ministerial 3B*
Mistral 7B Instruct*
Mistral Large*
Mistral Large 3*
Mistral Pequeño*
Mixtral 8x7B Instruct*
Pixtral Large*
Voxtral Mini 3B 2507*
Voxtral Pequeño 24B 2507*

Moonshot

Nombre de modelo	Invocación	Converse	Finalización del chat	Respuestas	Mensajes
Pensamiento de Kimi K2*
Kimi K2.5*

NVIDIA

Nombre de modelo	Invocación	Converse	Finalizaciones del chat	Respuestas	Mensajes
NVIDIA Nemotron Nano 9B v2*
NVIDIA Nemotron Nano 12B v2 VL BF16*
Nemotron Nano 3 30B*
NVIDIA Nemotron 3 Súper 120B*

OpenAI

Nombre de modelo	Invocación	Converse	Finalizaciones del chat	Respuestas	Mensajes
GPT-5.6 Sol
GPT-5.6 Terra
GPT-5.6 Luna
GPT-5.5
GPT-5.4
GPT OSS Safeguard 120B*
GPT OSS Safeguard 20B*
gpt-oss-120b*
gpt-oss-20b*

Qwen

Nombre de modelo	Invocación	Converse	Finalización del chat	Respuestas	Mensajes
Qwen3 235 B A2 B 2507*
Qwen3 32B*
Codificador Qwen3 480B A35B Instruct*
Qwen3 Coder Next*
Qwen3 Next 80B A3B*
Qwen3 VL 235B A22B*
Qwen3-Coder-30B-A3B-Instruct*

Stability

Nombre de modelo	Invocación	Converse	Finalizaciones del chat	Respuestas	Mensajes
Imagen estable: escala superior conservadora
Croquis de control de imagen estable
Estructura de control de imagen estable
Imagen estable: Creative Upscale
Objeto de borrado de imagen estable
Imagen estable, escalado rápido
Imagen estable en pintura
Pintura de imagen estable
Imagen estable Eliminar fondo
Búsqueda y cambio de color estables de imágenes
Búsqueda y reemplazo de imágenes estables
Guía de estilo de imagen estable
Transferencia estable de estilos de imagen

TwelveLabs

Nombre de modelo	Invocación	Converse	Finalizaciones del chat	Respuestas	Mensajes
Marengo Embedd 3.0
Marengo Embed v2.7
Pegasus v1.2

Escritor

Nombre de modelo	Invocación	Converse	Finalizaciones del chat	Respuestas	Mensajes
Palmyra Vision 7B
Palmyra X4*
Palmyra X5*

XaI

Nombre de modelo	Invocación	Converse	Finalización del chat	Respuestas	Mensajes
Grok 4.3

Z.AI

Nombre de modelo	Invocación	Converse	Finalizaciones del chat	Respuestas	Mensajes
GLM 4.7*
Flash GLM 4.7*
GLM 5*

nota

* Streaming Support: los modelos marcados con un asterisco (*) también son compatiblesInvokeModelWithResponseStream, lo que devuelve las respuestas como una transmisión en tiempo real.

Modelos compatibles StartAsyncInvoke

StartAsyncInvoke es una API de Amazon Bedrock Runtime que permite a las personas que llaman enviar una solicitud de invocación de modelo y recibir inmediatamente un InvocationARN sin esperar a que el modelo termine de procesarse. El trabajo se ejecuta en segundo plano y, una vez completado, el resultado se escribe en un bucket S3 especificado por la persona que llama. Luego, las personas que llaman pueden sondear el estado del trabajo mediante el complemento GetAsyncInvoke y las API. ListAsyncInvokes El patrón está diseñado específicamente para cargas de trabajo que implican entradas grandes o insensibles a la latencia, especialmente la generación de vídeo, audio e incrustaciones masivas, en las que no sería práctico mantener una conexión sincrónica abierta.

En cuanto a los modelos compatibles, son compatibles con los siguientes modelos: StartAsyncInvoke

TwelveLabs Marengo Embed 2.7 (twelvelabs.marengo-embed-2-7-v 1:0): necesario para la entrada de vídeo y audio; solo admite texto e imagen InvokeModel
TwelveLabs Marengo Embed 3.0 (twelvelabs.marengo-embed-3-0-v 1:0): mismo patrón; se requiere asincronización a escala video/audio
Amazon Nova Reel (amazon.nova-reel-v 1:0 y v 1:1): la generación de vídeo es exclusivamente asíncrona; la salida aterriza en S3
Embeddings multimodales de Amazon Nova (amazon.nova-2-multimodal-embeddings-v 1:0): se requiere async para entradas de vídeo de más de 25 MB codificadas en base64; la sincronización está disponible para entradas de texto, imágenes y documentos

InvokeModelWithBidirectionalStream

InvokeModelWithBidirectionalStreames una API de Amazon Bedrock Runtime que establece un canal dúplex completo y persistente entre la persona que llama y el modelo, lo que permite que los datos de audio fluyan en ambas direcciones de forma simultánea y continua. A diferencia de InvokeModelWithResponseStream las API estándar InvokeModel o incluso las API, que siguen un patrón de solicitud y luego respuesta, esta API mantiene la conexión abierta durante toda la sesión para que el modelo pueda procesar el audio entrante a medida que llega y transmitir la voz generada casi en tiempo real, sin esperar a que termine la expresión completa. La interacción se estructura en torno a tres fases: inicialización de la sesión (en la que el cliente envía eventos de configuración para configurar la transmisión), transmisión de audio (en la que el audio capturado se codifica y se envía como una transmisión de eventos continua) y transmisión de respuesta (en la que el modelo devuelve simultáneamente transcripciones textuales del discurso del usuario y la salida de audio sintetizada). InvokeModelWithBidirectionalStreamno se puede usar con las claves de API de Amazon Bedrock y requiere una autenticación estándar basada en credenciales de AWS, lo que refleja su ciclo de vida de sesión más complejo en comparación con otras operaciones de Bedrock Runtime.

Los siguientes modelos son compatibles con esta API:

Familia Amazon Nova Sonic: tanto amazon.nova-sonic-v 1:0 como amazon.nova-2-sonic-v 1:0 la utilizan como su única ruta de invocación, ya que la arquitectura de voz a voz requiere fundamentalmente un canal bidireccional en vivo que ni Converse ni Converse pueden proporcionar. InvokeModel

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Disponibilidad y & compatibilidad del modelo

Disponibilidad de terminales por modelos

Nombre de modelo	Invocación	Converse	Finalizaciones del chat	Respuestas	Mensajes
Llama 3 70B Instruct*
Llama 3 8B Instruct*
Llama 3.1 405B Instruct
Llama 3.1 70B Instruct*
Llama 3.1 8B Instruct*
Llama 3.2 11B Instruct*
Llama 3.2 1B Instruct*
Llama 3.2 3B Instruct*
Llama 3.2 90B Instruct*
Llama 3.3 70B Instruct*
Llama 4 Maverick 17B Instruct*
Llama 4 Scout 17B Instruct*