View a markdown version of this page

API-Kompatibilität - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

API-Kompatibilität

Amazon Bedrock unterstützt vier Familien von Runtime-APIs, die jeweils für unterschiedliche Integrationsmuster und Anwendungsfälle konzipiert sind.

Invoke-Familie: InvokeModel verarbeitet synchrone Anrufe mit einer einzigen Antwort. InvokeModelWithResponseStreamgibt Antworten als Echtzeit-Stream zurück. InvokeModelWithBidirectionalStreamermöglicht Vollduplex-Streaming für interaktive Anwendungen. AsyncInvokesendet Anfragen mit langer Laufzeit asynchron und speichert die Ausgabe in Amazon S3.

Converse-Produktreihe: Converse bietet eine einheitliche, modellunabhängige Schnittstelle für synchrone Multi-Turn-Konversationen. ConverseStreambietet das gleiche Erlebnis bei der Streaming-Ausgabe.

OpenAI-compatible Familie: ChatCompletions implementiert die OpenAI Chat Completions-Schnittstelle, sodass bestehende OpenAI-based Integrationen mit minimalen Änderungen auf Bedrock ausgeführt werden können. Responses Die API implementiert die OpenAI Response-Schnittstelle und unterstützt statusbehaftete, agentische Interaktionen mit integrierter Toolnutzung und Verwaltung des Konversationsverlaufs.

Nachrichtenfamilie: Messages implementiert die Schnittstelle Anthropic Messages auf dem bedrock-mantle Endpunkt, sodass bestehende SDK-based Anthropic-Integrationen mit minimalen Änderungen auf Bedrock ausgeführt werden können.

Wir werden uns nun die Liste der APIs ansehen, die von den einzelnen Modellen unterstützt werden.

AI21

Modellname Invoke Converse Chat-Abschlüsse Antworten Nachrichten
Jamba 1.5 Large*
Jamba 1.5 Mini*

Amazon

Anthropic

Cohere

Modellname Invoke Converse Chat-Abschlüsse Antworten Nachrichten
Command R*
Command R+*
Embed English
Embed Multilingual
v4 einbetten
Rerank 3.5

DeepSeek

Modellname Invoke Converse Chat-Abschlüsse Antworten Nachrichten
DeepSeek V3.2*
DeepSeek-R1*
DeepSeek-V3.1*

Google

Modellname Invoke Converse Chat-Abschlüsse Antworten Nachrichten
Gemma 3 12B IT*
Gemma 3 27B PT*
Gemma 3 4B IT*

Meta

MiniMax

Modellname Invoke Converse Chat-Abschlüsse Antworten Nachrichten
MiniMax M2*
MiniMax M2.1*
MiniMax M2.5*

Mistral

Mondschuss

Modellname Invoke Converse Chat-Abschlüsse Antworten Nachrichten
Kimi K2 denkt*
Kimi K2.5*

NVIDIA

Modellname Invoke Converse Chat-Abschlüsse Antworten Nachrichten
NVIDIA Nemotron Nano 9B v2*
NVIDIA Nemotron Nano 12B v2 VL BF16*
Nemotron Nano 3 30B*
NVIDIA Nemotron 3 Super 120 B*

OpenAI

Modellname Invoke Converse Chat-Abschlüsse Antworten Nachrichten
GPT OSS Safeguard 120B*
GPT OSS Safeguard 20B*
gpt-oss-120b*
gpt-oss-20b*

Qwen

Stabilität

TwelveLabs

Modellname Invoke Converse Chat-Abschlüsse Antworten Nachrichten
Marengo Embed 3.0
Marengo Embed v2.7
Pegasus v1.2

Writer

Modellname Invoke Converse Chat-Abschlüsse Antworten Nachrichten
Palmyra Vision 7 B
Palmyra X4*
Palmyra X5*

Z.AI

Modellname Invoke Converse Chat-Abschlüsse Antworten Nachrichten
GLM 4,7*
GLM 4.7 Flash*
GLM 5*
Anmerkung

* Streaming-Unterstützung: Modelle, die mit einem Sternchen (*) gekennzeichnet sindInvokeModelWithResponseStream, unterstützen ebenfalls, sodass Antworten als Echtzeit-Stream zurückgegeben werden.

Unterstützende Modelle StartAsyncInvoke

StartAsyncInvoke ist eine Amazon Bedrock Runtime-API, die es Aufrufern ermöglicht, eine Modellaufrufanforderung einzureichen und sofort einen InvocationARN zurückzuerhalten, ohne darauf warten zu müssen, dass das Modell die Verarbeitung abgeschlossen hat. Der Job wird im Hintergrund ausgeführt, und die Ausgabe wird nach Abschluss in einen vom Aufrufer angegebenen S3-Bucket geschrieben. Anrufer können dann mithilfe des GetAsyncInvoke Companions und der APIs den Auftragsstatus abfragen. ListAsyncInvokes Das Muster wurde speziell für Workloads mit großen oder latenzunempfindlichen Eingaben entwickelt, insbesondere bei der Generierung von Video-, Audio- und Masseneinbettungen, bei denen es nicht praktikabel wäre, eine offene synchrone Verbindung aufrechtzuerhalten.

In Bezug darauf, welche Modelle es unterstützen, unterstützen die folgenden Modelle: StartAsyncInvoke

  • TwelveLabs Marengo Embed 2.7 (twelvelabs.marengo-embed-2-7-v 1:0) — erforderlich für die Video- und Audioeingabe; verarbeitet nur Text und Bild InvokeModel

  • TwelveLabs Marengo Embed 3.0 (twelvelabs.marengo-embed-3-0-v 1:0) — gleiches Muster; asynchron erforderlich für at scale video/audio

  • Amazon Nova Reel (amazon.nova-reel-v 1:0 und v 1:1) — Die Videogenerierung erfolgt ausschließlich asynchron; die Ausgabe landet in S3

  • Amazon Nova Multimodal Embeddings (amazon.nova-2-multimodal-embeddings-v 1:0) — Async ist für Base64-codierte Videoeingänge mit mehr als 25 MB erforderlich; Sync ist für Text-, Bild- und Dokumenteingaben verfügbar

InvokeModelWithBidirectionalStream

InvokeModelWithBidirectionalStreamist eine Amazon Bedrock Runtime-API, die einen dauerhaften Vollduplex-Kanal zwischen dem Anrufer und dem Modell einrichtet, sodass Audiodaten gleichzeitig und kontinuierlich in beide Richtungen fließen können. Im Gegensatz zu den Standard InvokeModel - oder sogar InvokeModelWithResponseStream APIs, die einem Muster von Anfrage und Antwort folgen, hält diese API die Verbindung für die Dauer einer Sitzung offen, sodass das Modell eingehende Audiodaten verarbeiten kann, sobald sie eintreffen, und generierte Sprache nahezu in Echtzeit zurückstreamen kann, ohne auf den Abschluss einer vollständigen Äußerung warten zu müssen. Die Interaktion ist in drei Phasen gegliedert: Sitzungsinitialisierung (bei der der Client Konfigurationsereignisse sendet, um den Stream einzurichten), Audiostreaming (bei dem das aufgenommene Audio codiert und als kontinuierlicher Ereignisstream gesendet wird) und Antwortstreaming (bei dem das Modell gleichzeitig Texttranskriptionen der Benutzersprache und synthetisierte Audioausgabe zurückgibt). InvokeModelWithBidirectionalStreamkann nicht mit Amazon Bedrock API-Schlüsseln verwendet werden und erfordert eine standardmäßige AWS-Authentifizierung auf Basis von Anmeldeinformationen, was den komplexeren Sitzungslebenszyklus im Vergleich zu anderen Bedrock Runtime-Vorgängen widerspiegelt.

Die folgenden Modelle unterstützen diese API:

  • Amazon Nova Sonic-Familie: Sowohl amazon.nova-sonic-v 1:0 als auch amazon.nova-2-sonic-v 1:0 verwenden ihn als ihren einzigen Aufrufpfad, da die Speech-to-Speech-Architektur grundsätzlich einen bidirektionalen Live-Kanal erfordert, den weder Converse noch Converse bereitstellen können. InvokeModel