View a markdown version of this page

Compatibilidad de API - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Compatibilidad de API

Amazon Bedrock admite cuatro familias de API de tiempo de ejecución, cada una diseñada para diferentes patrones de integración y casos de uso.

Familia Invoke: InvokeModel gestiona llamadas sincrónicas de respuesta única. InvokeModelWithResponseStreamdevuelve las respuestas como una transmisión en tiempo real. InvokeModelWithBidirectionalStreampermite la transmisión dúplex completa para aplicaciones interactivas. AsyncInvokeenvía las solicitudes de larga duración de forma asíncrona y almacena los resultados en Amazon S3.

Familia Converse: Converse proporciona una interfaz unificada e independiente del modelo para conversaciones sincrónicas en varios turnos. ConverseStreamofrece la misma experiencia con la salida de streaming.

OpenAI-compatible familia: ChatCompletions implementa la interfaz OpenAI Chat Completions, lo que permite que las OpenAI-based integraciones existentes se ejecuten en Bedrock con cambios mínimos. Responses La API implementa la interfaz de respuestas de OpenAI, que admite interacciones de agentes con estado con el uso de herramientas integradas y la administración del historial de conversaciones.

Familia de mensajes: Messages implementa la interfaz de Anthropic Messages en el bedrock-mantle terminal, lo que permite que las SDK-based integraciones Anthropic existentes se ejecuten en Bedrock con cambios mínimos.

Ahora veremos la lista de API compatibles con cada modelo.

AI21

Nombre de modelo Invocación Converse Finalización del chat Respuestas Mensajes
Jamba 1.5 Large*
Jamba 1.5 Mini*

Amazon

Anthropic

Cohere

Nombre de modelo Invocación Converse Finalizaciones del chat Respuestas Mensajes
Command R*
Command R+*
Embed English
Embed Multilingual
Incrustar v4
Rerank 3.5

DeepSeek

Nombre de modelo Invocación Converse Finalizaciones del chat Respuestas Mensajes
DeepSeek V3.2*
DeepSeek-R1*
DeepSeek-V3.1*

Google

Nombre de modelo Invocación Converse Finalizaciones del chat Respuestas Mensajes
Gemma 3 12B IT*
Gemma 3 27B PT*
Gemma 3 4B IT*

Meta

MiniMax

Nombre de modelo Invocación Converse Finalizaciones del chat Respuestas Mensajes
MiniMax M2*
MiniMax M2.1*
MiniMax M2.5*

Mistral

Moonshot

Nombre de modelo Invocación Converse Finalización del chat Respuestas Mensajes
Pensamiento de Kimi K2*
Kimi K2.5*

NVIDIA

Nombre de modelo Invocación Converse Finalizaciones del chat Respuestas Mensajes
NVIDIA Nemotron Nano 9B v2*
NVIDIA Nemotron Nano 12B v2 VL BF16*
Nemotron Nano 3 30B*
NVIDIA Nemotron 3 Súper 120B*

OpenAI

Nombre de modelo Invocación Converse Finalizaciones del chat Respuestas Mensajes
GPT OSS Safeguard 120B*
GPT OSS Safeguard 20B*
gpt-oss-120b*
gpt-oss-20b*

Qwen

Stability

TwelveLabs

Nombre de modelo Invocación Converse Finalizaciones del chat Respuestas Mensajes
Marengo Embedd 3.0
Marengo Embed v2.7
Pegasus v1.2

Escritor

Nombre de modelo Invocación Converse Finalizaciones del chat Respuestas Mensajes
Palmyra Vision 7B
Palmyra X4*
Palmyra X5*

Z.AI

Nombre de modelo Invocación Converse Finalizaciones del chat Respuestas Mensajes
GLM 4.7*
Flash GLM 4.7*
GLM 5*
nota

* Streaming Support: los modelos marcados con un asterisco (*) también son compatiblesInvokeModelWithResponseStream, lo que devuelve las respuestas como una transmisión en tiempo real.

Modelos compatibles StartAsyncInvoke

StartAsyncInvoke es una API de Amazon Bedrock Runtime que permite a las personas que llaman enviar una solicitud de invocación de modelo y recibir inmediatamente un InvocationARN sin esperar a que el modelo termine de procesarse. El trabajo se ejecuta en segundo plano y, una vez completado, el resultado se escribe en un bucket S3 especificado por la persona que llama. Luego, las personas que llaman pueden sondear el estado del trabajo mediante el complemento GetAsyncInvoke y las API. ListAsyncInvokes El patrón está diseñado específicamente para cargas de trabajo que implican entradas grandes o insensibles a la latencia, especialmente la generación de vídeo, audio e incrustaciones masivas, en las que no sería práctico mantener una conexión sincrónica abierta.

En cuanto a los modelos compatibles, son compatibles con los siguientes modelos: StartAsyncInvoke

  • TwelveLabs Marengo Embed 2.7 (twelvelabs.marengo-embed-2-7-v 1:0): necesario para la entrada de vídeo y audio; solo admite texto e imagen InvokeModel

  • TwelveLabs Marengo Embed 3.0 (twelvelabs.marengo-embed-3-0-v 1:0): mismo patrón; se requiere asincronización a escala video/audio

  • Amazon Nova Reel (amazon.nova-reel-v 1:0 y v 1:1): la generación de vídeo es exclusivamente asíncrona; la salida aterriza en S3

  • Embeddings multimodales de Amazon Nova (amazon.nova-2-multimodal-embeddings-v 1:0): se requiere async para entradas de vídeo de más de 25 MB codificadas en base64; la sincronización está disponible para entradas de texto, imágenes y documentos

InvokeModelWithBidirectionalStream

InvokeModelWithBidirectionalStreames una API de Amazon Bedrock Runtime que establece un canal dúplex completo y persistente entre la persona que llama y el modelo, lo que permite que los datos de audio fluyan en ambas direcciones de forma simultánea y continua. A diferencia de InvokeModelWithResponseStream las API estándar InvokeModel o incluso las API, que siguen un patrón de solicitud y luego respuesta, esta API mantiene la conexión abierta durante toda la sesión para que el modelo pueda procesar el audio entrante a medida que llega y transmitir la voz generada casi en tiempo real, sin esperar a que termine la expresión completa. La interacción se estructura en torno a tres fases: inicialización de la sesión (en la que el cliente envía eventos de configuración para configurar la transmisión), transmisión de audio (en la que el audio capturado se codifica y se envía como una transmisión de eventos continua) y transmisión de respuesta (en la que el modelo devuelve simultáneamente transcripciones textuales del discurso del usuario y la salida de audio sintetizada). InvokeModelWithBidirectionalStreamno se puede usar con las claves de API de Amazon Bedrock y requiere una autenticación estándar basada en credenciales de AWS, lo que refleja su ciclo de vida de sesión más complejo en comparación con otras operaciones de Bedrock Runtime.

Los siguientes modelos son compatibles con esta API:

  • Familia Amazon Nova Sonic: tanto amazon.nova-sonic-v 1:0 como amazon.nova-2-sonic-v 1:0 la utilizan como su única ruta de invocación, ya que la arquitectura de voz a voz requiere fundamentalmente un canal bidireccional en vivo que ni Converse ni Converse pueden proporcionar. InvokeModel