View a markdown version of this page

API 兼容性 - Amazon Bedrock

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

API 兼容性

Amazon Bedrock 支持四个运行时 API 系列,每个系列都针对不同的集成模式和用例而设计。

调用家族InvokeModel处理同步的单响应呼叫。 InvokeModelWithResponseStream以实时流的形式返回响应。 InvokeModelWithBidirectionalStream为交互式应用程序启用全双工流式传输。 AsyncInvoke异步提交长时间运行的请求,将输出存储到 Amazon S3。

Converse 系列Converse为同步多回合对话提供统一的、与模型无关的接口。 ConverseStream通过流媒体输出提供相同的体验。

OpenAI-compatible famil y:ChatCompletions实现 OpenAI 聊天完成界面,使现有 OpenAI-based 集成只需最少的更改即可在 Bedrock 上运行。 ResponsesAPI 实现了 OpenAI Responses 接口,通过内置工具使用和对话历史记录管理支持有状态的代理互动。

消息家族:在bedrock-mantle端点上Messages实现 Anthropic Messages 接口,使现有的 Anthropic SDK-based 集成只需最少的更改即可在 Bedrock 上运行。

现在,我们将查看每个模型支持的 API 列表。

AI21

模型名称 调用 Converse 聊天完成次数 响应 消息
Jamba 1.5 Large*
Jamba 1.5 Mini*

Amazon

Anthropic

Cohere

模型名称 调用 Converse 聊天完成次数 响应 消息
Command R*
Command R+*
Embed(英文版)
Embed(多语版)
嵌入 v4
Rerank 3.5

DeepSeek

模型名称 调用 Converse 聊天完成次数 响应 消息
DeepSeek V3.2*
DeepSeek-R1*
DeepSeek-V3.1*

Google

模型名称 调用 Converse 聊天完成次数 响应 消息
Gemma 3 12B IT*
Gemma 3 27B PT*
Gemma 3 4B IT*

Meta

MiniMax

模型名称 调用 Converse 聊天完成次数 响应 消息
MiniMax M2*
MiniMax M2.1*
MiniMax M2.5*

Mistral

登月

模型名称 调用 Converse 聊天完成次数 响应 消息
Kimi K2 Thinking*
Kimi K2.5*

NVIDIA

OpenAI

模型名称 调用 Converse 聊天完成次数 响应 消息
GPT OSS Safeguard*
GPT OSS Safeguard*
gpt-oss-120b*
gpt-oss-20b*

Qwen

稳定性

TwelveLabs

模型名称 调用 Converse 聊天完成次数 响应 消息
Marengo 嵌入 3.0
Marengo Embed v2.7
Pegasus v1.2

写入器

模型名称 调用 Converse 聊天完成次数 响应 消息
Palmyra Vision 7B
Palmyra X4*
Palmyra X5*

Z.AI

模型名称 调用 Converse 聊天完成次数 响应 消息
GLM 4.7*
GLM 4.7 Flash*
GLM 5*
注意

* Streaming Support:标有星号 (*) 的模型也支持InvokeModelWithResponseStream,它以实时流的形式返回响应。

支持的型号 StartAsyncInvoke

StartAsyncInvoke 是一个 Amazon Bedrock 运行时 API,它允许调用者提交模型调用请求并立即接收 InvocationArn,而无需等待模型完成处理。任务在后台运行,完成后输出将写入调用者指定的 S3 存储桶。然后,来电者可以使用配套 GetAsyncInvoke 和 ListAsyncInvokes API 来轮询任务状态。该模式专为涉及大量或对延迟不敏感的输入的工作负载而构建,尤其是视频、音频和批量嵌入生成,在这些工作负载中,保持开放的同步连接是不切实际的。

就支持哪些型号而言,以下型号支持 StartAsyncInvoke:

  • TwelveLabs Marengo Embed 2.7(twelvelabs.marengo-embed-2-7-v 1:0)— 视频和音频输入所必需的;仅处理文本和图像 InvokeModel

  • TwelveLabs Marengo Embed 3.0(twelvelabs.marengo-embed-3-0-v 1:0)— 模式相同;大规模需要异步 video/audio

  • Amazon Nova Reel(amazon.nova-reel-v 1:0 和 v 1:1)— 视频生成完全是异步的;输出在 S3 中

  • Amazon Nova 多模态嵌入(amazon.nova-2-multimodal-embeddings-v 1:0)— 大于 25MB base64 编码的视频输入需要异步;文本、图像和文档输入可以使用同步

InvokeModelWithBidirectionalStream

InvokeModelWithBidirectionalStream是一个 Amazon Bedrock Runtime API,它在呼叫者和模型之间建立了一个永久的全双工通道,允许音频数据同时连续地双向流动。与遵循先请求后响应模式的标准InvokeModel甚至 InvokeModelWithResponseStream API 不同,此 API 在会话期间保持连接处于打开状态,这样模型就可以在传入的音频到达时对其进行处理,并以近乎实时的方式将生成的语音流回去,而无需等待完整的语音完成。交互分为三个阶段:会话初始化(客户端发送配置事件以设置流)、音频流(其中捕获的音频被编码并作为连续事件流发送)和响应流(模型同时返回用户语音的文本转录和合成音频输出)。 InvokeModelWithBidirectionalStream不能与 Amazon Bedrock API 密钥一起使用,并且需要基于 AWS 凭证的标准身份验证,这反映了与其他 Bedrock 运行时操作相比,其会话生命周期更为复杂。

以下模型支持此 API:

  • 亚马逊 Nova Sonic 系列:amazon.nova-sonic-v 1:0 和 amazon.nova-2-sonic-v 1:0 都将其用作唯一的调用路径,因为语音转语音架构从根本上需要一个双向直播频道,而匡威都无法提供。 InvokeModel