Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Inferenz mithilfe der Responses API
Amazon Bedrock stellt die OpenAI Responses API über den bedrock-mantle Endpunkt bereit, unterstützt von Mantle, einer verteilten Inferenz-Engine für die Bereitstellung von Modellen im großen Maßstab für maschinelles Lernen. Dieser Endpunkt ermöglicht es Ihnen, vertraute OpenAI SDKs und Tools mit Amazon Bedrock-Modellen zu verwenden, sodass Sie bestehende Anwendungen mit minimalen Codeänderungen migrieren können — aktualisieren Sie einfach Ihre Basis-URL und Ihren API-Schlüssel.
Wichtig
Wenn Sie das OpenAI SDK mit Amazon Bedrock verwenden, müssen Sie es auf den Amazon Bedrock-Endpunkt verweisen, nicht auf den OpenAI Endpunkt. Legen Sie die folgenden Umgebungsvariablen fest:
OPENAI_BASE_URL="https://bedrock-mantle.<your-region>.api.aws/v1" OPENAI_API_KEY="<your Bedrock API key>"
Verwenden Sie nicht Ihren OpenAI API-Schlüssel oder die OpenAI Basis-URL (https://api.openai.com/v1). Diese stellen eine OpenAI direkte Verbindung zu Amazon Bedrock her, nicht zu Amazon Bedrock. Informationen zum Erstellen eines Amazon Bedrock API-Schlüssels finden Sie unterAPI-Schlüssel.
Zu den wichtigsten Vorteilen gehören:
-
Asynchrone Inferenz — Support für Inferenz-Workloads mit langer Laufzeit über die Responses API
-
Statusorientiertes Konversationsmanagement — Der Kontext wird automatisch neu erstellt, ohne den Konversationsverlauf bei jeder Anfrage manuell weiterzugeben
-
Vereinfachter Einsatz von Tools — Optimierte Integration für behördliche Arbeitsabläufe
-
Flexible Antwortmodi — Support für Streaming- und Nicht-Streaming-Antworten
-
Einfache Migration — Kompatibel mit bestehenden OpenAI SDK-Codebasen
Unterstützte Regionen und Endpunkte
Der bedrock-mantle Endpunkt ist in den folgenden AWS Regionen verfügbar:
| Name der Region | Region | Endpoint |
|---|---|---|
| USA Ost (Ohio) | us-east-2 | bedrock-mantle.us-east-2.api.aws |
| USA Ost (Nord-Virginia) | us-east-1 | bedrock-mantle.us-east-1.api.aws |
| USA West (Oregon) | us-west-2 | bedrock-mantle.us-west-2.api.aws |
| Asien-Pazifik (Jakarta) | ap-southeast-3 | bedrock-mantle.ap-southeast-3.api.aws |
| Asien-Pazifik (Mumbai) | ap-south-1 | grundsteinmantel.ap-south-1.api.aws |
| Asien-Pazifik (Sydney) | ap-southeast-2 | bedrock-mantle.ap-southeast-2.api.aws |
| Asien-Pazifik (Tokio) | ap-northeast-1 | grundsteinmantel.ap-northeast-1.api.aws |
| Europa (Frankfurt) | eu-central-1 | bedrock-mantle.eu-central-1.api.aws |
| Europa (Irland) | eu-west-1 | bedrock-mantle.eu-west-1.api.aws |
| Europa (London) | eu-west-2 | bedrock-mantle.eu-west-2.api.aws |
| Europa (Milan) | eu-south-1 | bedrock-mantle.eu-sued-1.api.aws |
| Europa (Stockholm) | eu-north-1 | bedrock-mantle.eu-nord-1.api.aws |
| Südamerika (São Paulo) | sa-east-1 | bedrock-mantle.sa-east-1.api.aws |
Voraussetzungen
Bevor Sie APIs verwenden, stellen Sie sicher, dass Sie über Folgendes verfügen: OpenAI
-
Authentifizierung — Sie können sich authentifizieren mit:
-
Amazon Bedrock API-Schlüssel (für OpenAI SDK erforderlich)
-
AWS Anmeldeinformationen (unterstützt für HTTP-Anfragen)
-
-
OpenAISDK (optional) — Installieren Sie das OpenAI Python-SDK, wenn Sie SDK-based Anfragen verwenden.
-
Umgebungsvariablen — Legen Sie die folgenden Umgebungsvariablen fest:
-
OPENAI_API_KEY— Stellen Sie Ihren Amazon Bedrock API-Schlüssel ein -
OPENAI_BASE_URL— Stellen Sie den Amazon Bedrock-Endpunkt für Ihre Region ein (z. B.https://bedrock-mantle.us-east-1.api.aws/v1)
-
Modelle-API
Die Models-API ermöglicht es Ihnen, verfügbare Modelle in Amazon Bedrock powered by Mantle zu entdecken. Verwenden Sie diese API, um eine Liste von Modellen abzurufen, die Sie mit der Responses API verwenden können. Vollständige API-Details finden Sie in der OpenAIModelldokumentation
Verfügbare Modelle auflisten
Um die verfügbaren Modelle aufzulisten, wählen Sie die Registerkarte für Ihre bevorzugte Methode und gehen Sie dann wie folgt vor:
Antworten-API
Die Responses API bietet zustandsorientiertes Konversationsmanagement mit Unterstützung für Streaming, Hintergrundverarbeitung und Multi-Turn-Interaktionen. Vollständige API-Details finden Sie in der OpenAIResponse-Dokumentation
Anmerkung
Nicht alle Modelle unterstützen die Responses API. Informationen darüber, welche Modelle die Responses API unterstützen, finden Sie unterAPI-Kompatibilität.
Wie die Responses API den Konversationsstatus speichert
Die Responses API kann den gespeicherten Status verwenden, um Multi-Turn-Konversationen zu ermöglichen und es Ihnen zu ermöglichen, über den previous_response_id Parameter auf vorherige Runden zu verweisen. Der Speicher ist standardmäßig aktiviert, kann aber pro Anfrage über den store Parameter deaktiviert werden. Gespeicherte Antworten werden vom Projekt abgegrenzt. Eine Antwort aus einem Projekt kann nicht als vorherige Antwort verwendet oder in einem zweiten Projekt gelesen werden. Weitere Informationen zu Projekten finden Sie unterProjekte (OpenAI-compatible).
-
Wenn
storedies der Fall isttrue(Standardeinstellung), speichert Amazon Bedrock die Antwort, einschließlich der Eingabe und Ausgabe, 30 Tage lang in der Quellregion der Anfrage. Während dieses Zeitfensters können Sie Folgeanfragen verketten, indem Sie die Antwort mitGET /v1/responses/{id}weiterleitenprevious_response_idund abrufen. Nach 30 Tagen wird die Antwort automatisch gelöscht und ist nicht mehr abrufbar. -
Wenn
storejafalse, speichert Amazon Bedrock keine Daten aus der Anfrage oder Antwort. Derprevious_response_idParameter kann nicht verwendet werden, um die Konversation fortzusetzen.
Der Standardwert true entspricht der OpenAI Response-API-Spezifikation. Kunden, die nicht möchten, dass Amazon Bedrock Gesprächsdaten speichert, sollten dies false bei jeder Anfrage ausdrücklich angeben. store Gespeicherte Daten werden in der Quellregion der Anfrage gespeichert, im Ruhezustand verschlüsselt und der Projektressource des anrufenden AWS Accounts zugeordnet. Die Daten werden ausschließlich zur Bearbeitung Ihrer Anfragen gespeichert und nicht für andere Zwecke verwendet oder aufbewahrt.
Grundlegende Anfrage
Um eine Antwort zu erstellen, wählen Sie die Registerkarte für Ihre bevorzugte Methode und folgen Sie dann den Schritten:
Antworten streamen
Um schrittweise Antwortereignisse zu empfangen, wählen Sie die Registerkarte für Ihre bevorzugte Methode und gehen Sie dann wie folgt vor: