View a markdown version of this page

Compatibilidade de API - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Compatibilidade de API

O Amazon Bedrock oferece suporte a quatro famílias de APIs de tempo de execução, cada uma projetada para diferentes padrões de integração e casos de uso.

Família Invoke: InvokeModel lida com chamadas síncronas de resposta única. InvokeModelWithResponseStreamretorna respostas como um fluxo em tempo real. InvokeModelWithBidirectionalStreampermite streaming full-duplex para aplicativos interativos. AsyncInvokeenvia solicitações de longa duração de forma assíncrona, armazenando a saída no Amazon S3.

Família Converse: Converse fornece uma interface unificada e independente de modelo para conversas síncronas de vários turnos. ConverseStreamoferece a mesma experiência com a saída de streaming.

OpenAI-compatible família: ChatCompletions implementa a interface OpenAI Chat Completions, permitindo que as integrações OpenAI-based existentes sejam executadas no Bedrock com o mínimo de alterações. Responses A API implementa a interface do OpenAI Responses, oferecendo suporte a interações dinâmicas e dinâmicas com o uso de ferramentas integradas e o gerenciamento do histórico de conversas.

Família de mensagens: Messages implementa a interface Anthropic Messages no bedrock-mantle endpoint, permitindo que as SDK-based integrações antrópicas existentes sejam executadas no Bedrock com o mínimo de alterações.

Agora veremos a lista de APIs suportadas por cada modelo.

AI21

Nome do modelo Invocar Converse Conclusões de bate-papo Respostas Mensagens
Jamba 1.5 Large*
Jamba 1.5 Mini*

Amazon

Anthropic

Cohere

Nome do modelo Invocar Converse Conclusões de bate-papo Respostas Mensagens
Comando R*
Command R+*
Embed em inglês
Embed multilíngue
Incorporar v4
Rerank 3.5

DeepSeek

Nome do modelo Invocar Converse Conclusões de bate-papo Respostas Mensagens
DeepSeek V3.2*
DeepSeek-R1*
DeepSeek-V3.1*

Google

Nome do modelo Invocar Converse Conclusões de bate-papo Respostas Mensagens
Gemma 3 12B IT*
Gemma 3 27B PT*
Gemma 3 4B IT*

Meta

MiniMax

Nome do modelo Invocar Converse Conclusões de bate-papo Respostas Mensagens
MiniMax M2*
MiniMax M2.1*
MiniMax M2.5*

Mistral

Moonshot

Nome do modelo Invocar Converse Conclusões de bate-papo Respostas Mensagens
Kimi K2 Pensando*
Kimi K2.5*

NVIDIA

Nome do modelo Invocar Converse Conclusões de bate-papo Respostas Mensagens
NVIDIA Nemotron Nano 9B v2*
NVIDIA Nemotron Nano 12B v2 VL BF16*
Nemotron Nano 3 30B*
NVIDIA Nemotron 3 Super 120B*

OpenAI

Nome do modelo Invocar Converse Conclusões de bate-papo Respostas Mensagens
GPT OSS Safeguard 120B*
GPT OSS Safeguard 20B*
gpt-oss-120b*
gpt-oss-20b*

Qwen

Estabilidade

TwelveLabs

Nome do modelo Invocar Converse Conclusões de bate-papo Respostas Mensagens
Marengo Embed 3.0
Marengo Embed v2.7
Pegasus v1.2

Gravador

Nome do modelo Invocar Converse Conclusões de bate-papo Respostas Mensagens
Palmyra Vision 7B
Palmyra X4*
Palmyra X5*

Z.AI

Nome do modelo Invocar Converse Conclusões de bate-papo Respostas Mensagens
GLM 4,7*
GLM 4.7 Flash*
GLM 5*
nota

* Suporte de streaming: modelos marcados com um asterisco (*) também são compatíveisInvokeModelWithResponseStream, o que retorna respostas como uma transmissão em tempo real.

Modelos de suporte StartAsyncInvoke

StartAsyncInvoke é uma API Amazon Bedrock Runtime que permite que os chamadores enviem uma solicitação de invocação de modelo e recebam imediatamente de volta um InvocationARN sem esperar que o modelo termine o processamento. O trabalho é executado em segundo plano e a saída é gravada em um bucket S3 especificado pelo chamador depois de concluída. Os chamadores podem então pesquisar o status do trabalho usando o complemento GetAsyncInvoke e ListAsyncInvokes as APIs. O padrão foi criado especificamente para cargas de trabalho que envolvem entradas grandes ou insensíveis à latência, especialmente vídeo, áudio e geração de incorporação em massa, onde manter uma conexão síncrona aberta seria impraticável.

Em termos de quais modelos o suportam, os seguintes modelos suportam StartAsyncInvoke:

  • TwelveLabs Marengo Embed 2.7 (twelvelabs.marengo-embed-2-7-v 1:0) — necessário para entrada de vídeo e áudio; só lida com texto e imagem InvokeModel

  • TwelveLabs Marengo Embed 3.0 (twelvelabs.marengo-embed-3-0-v 1:0) — mesmo padrão; é necessário usar assíncrono em grande escala video/audio

  • Amazon Nova Reel (amazon.nova-reel-v 1:0 e v 1:1) — a geração de vídeo é exclusivamente assíncrona; a saída chega ao S3

  • Amazon Nova Multimodal Embeddings (amazon.nova-2-multimodal-embeddings-v 1:0) — o modo assíncrono é necessário para entradas de vídeo maiores que 25 MB codificadas em base64; a sincronização está disponível para entradas de texto, imagem e documentos

InvokeModelWithBidirectionalStream

InvokeModelWithBidirectionalStreamé uma API Amazon Bedrock Runtime que estabelece um canal full-duplex persistente entre o chamador e o modelo, permitindo que os dados de áudio fluam em ambas as direções simultaneamente e continuamente. Diferentemente das InvokeModelWithResponseStream APIs padrão InvokeModel ou mesmo das APIs, que seguem um padrão de solicitação e resposta, essa API mantém a conexão aberta durante a sessão para que o modelo possa processar o áudio recebido à medida que ele chega e transmitir a fala gerada quase em tempo real, sem esperar que uma declaração completa termine. A interação é estruturada em três fases: inicialização da sessão (em que o cliente envia eventos de configuração para configurar o fluxo), streaming de áudio (em que o áudio capturado é codificado e enviado como um fluxo contínuo de eventos) e streaming de resposta (em que o modelo retorna simultaneamente transcrições de texto da fala do usuário e saída de áudio sintetizada). InvokeModelWithBidirectionalStreamnão pode ser usado com as chaves de API do Amazon Bedrock e requer autenticação padrão baseada em credenciais da AWS, refletindo seu ciclo de vida de sessão mais complexo em comparação com outras operações do Bedrock Runtime.

Os modelos a seguir oferecem suporte a essa API:

  • Família Amazon Nova Sonic: Tanto o amazon.nova-sonic-v 1:0 quanto o amazon.nova-2-sonic-v 1:0 o usam como seu único caminho de invocação, já que a arquitetura de conversão de fala em voz requer fundamentalmente um canal bidirecional ao vivo que nem a Converse podem fornecer. InvokeModel