

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Inferenz mithilfe der Responses API
<a name="bedrock-mantle"></a>

Amazon Bedrock stellt die OpenAI Responses API über den `bedrock-mantle` Endpunkt bereit, unterstützt von Mantle, einer verteilten Inferenz-Engine für die Bereitstellung von Modellen im großen Maßstab für maschinelles Lernen. Dieser Endpunkt ermöglicht es Ihnen, vertraute OpenAI SDKs und Tools mit Amazon Bedrock-Modellen zu verwenden, sodass Sie bestehende Anwendungen mit minimalen Codeänderungen migrieren können — aktualisieren Sie einfach Ihre Basis-URL und Ihren API-Schlüssel.

**Wichtig**  
Wenn Sie das OpenAI SDK mit Amazon Bedrock verwenden, müssen Sie es auf den Amazon Bedrock-Endpunkt verweisen, nicht auf den OpenAI Endpunkt. Legen Sie die folgenden Umgebungsvariablen fest:  

```
OPENAI_BASE_URL="https://bedrock-mantle.<your-region>.api.aws/v1"
OPENAI_API_KEY="<your Bedrock API key>"
```
Verwenden Sie nicht Ihren OpenAI API-Schlüssel oder die OpenAI Basis-URL (`https://api.openai.com/v1`). Diese stellen eine OpenAI direkte Verbindung zu Amazon Bedrock her, nicht zu Amazon Bedrock. Informationen zum Erstellen eines Amazon Bedrock API-Schlüssels finden Sie unter[API-Schlüssel](api-keys.md).

Zu den wichtigsten Vorteilen gehören:
+ **Asynchrone Inferenz** — Support für Inferenz-Workloads mit langer Laufzeit über die Responses API
+ **Statusorientiertes Konversationsmanagement** — Der Kontext wird automatisch neu erstellt, ohne den Konversationsverlauf bei jeder Anfrage manuell weiterzugeben
+ **Vereinfachter Einsatz von Tools** — Optimierte Integration für behördliche Arbeitsabläufe
+ **Flexible Antwortmodi** — Support für Streaming- und Nicht-Streaming-Antworten
+ **Einfache Migration** — Kompatibel mit bestehenden OpenAI SDK-Codebasen

## Unterstützte Regionen und Endpunkte
<a name="bedrock-mantle-supported"></a>

Der `bedrock-mantle` Endpunkt ist in den folgenden AWS Regionen verfügbar:


| Name der Region | Region | Endpoint | 
| --- | --- | --- | 
| USA Ost (Ohio) | us-east-2 | bedrock-mantle.us-east-2.api.aws | 
| USA Ost (Nord-Virginia) | us-east-1 | bedrock-mantle.us-east-1.api.aws | 
| USA West (Oregon) | us-west-2 | bedrock-mantle.us-west-2.api.aws | 
| Asien-Pazifik (Jakarta) | ap-southeast-3 | bedrock-mantle.ap-southeast-3.api.aws | 
| Asien-Pazifik (Mumbai) | ap-south-1 | grundsteinmantel.ap-south-1.api.aws | 
| Asien-Pazifik (Sydney) | ap-southeast-2 | bedrock-mantle.ap-southeast-2.api.aws | 
| Asien-Pazifik (Tokio) | ap-northeast-1 | grundsteinmantel.ap-northeast-1.api.aws | 
| Europa (Frankfurt) | eu-central-1 | bedrock-mantle.eu-central-1.api.aws | 
| Europa (Irland) | eu-west-1 | bedrock-mantle.eu-west-1.api.aws | 
| Europa (London) | eu-west-2 | bedrock-mantle.eu-west-2.api.aws | 
| Europa (Milan) | eu-south-1 | bedrock-mantle.eu-sued-1.api.aws | 
| Europa (Stockholm) | eu-north-1 | bedrock-mantle.eu-nord-1.api.aws | 
| Südamerika (São Paulo) | sa-east-1 | bedrock-mantle.sa-east-1.api.aws | 

## Voraussetzungen
<a name="bedrock-mantle-prereq"></a>

Bevor Sie APIs verwenden, stellen Sie sicher, dass Sie über Folgendes verfügen: OpenAI
+ **Authentifizierung** — Sie können sich authentifizieren mit:
  + Amazon Bedrock API-Schlüssel (für OpenAI SDK erforderlich)
  + AWS Anmeldeinformationen (unterstützt für HTTP-Anfragen)
+ **OpenAISDK** (optional) — Installieren Sie das OpenAI Python-SDK, wenn Sie SDK-based Anfragen verwenden.
+ **Umgebungsvariablen** — Legen Sie die folgenden Umgebungsvariablen fest:
  + `OPENAI_API_KEY`— Stellen Sie Ihren Amazon Bedrock API-Schlüssel ein
  + `OPENAI_BASE_URL`— Stellen Sie den Amazon Bedrock-Endpunkt für Ihre Region ein (z. B.` https://bedrock-mantle.us-east-1.api.aws/v1`)

## Modelle-API
<a name="bedrock-mantle-models"></a>

Die Models-API ermöglicht es Ihnen, verfügbare Modelle in Amazon Bedrock powered by Mantle zu entdecken. Verwenden Sie diese API, um eine Liste von Modellen abzurufen, die Sie mit der Responses API verwenden können. Vollständige API-Details finden Sie in der [OpenAIModelldokumentation](https://developers.openai.com/api/reference/resources/models).

### Verfügbare Modelle auflisten
<a name="bedrock-mantle-models-list"></a>

Um die verfügbaren Modelle aufzulisten, wählen Sie die Registerkarte für Ihre bevorzugte Methode und gehen Sie dann wie folgt vor:

------
#### [ OpenAI SDK (Python) ]

```
# List all available models using the OpenAI SDK
# Requires OPENAI_API_KEY and OPENAI_BASE_URL environment variables

from openai import OpenAI

client = OpenAI()

models = client.models.list()

for model in models.data:
    print(model.id)
```

------
#### [ HTTP request ]

Stellen Sie eine GET-Anfrage an`/v1/models`:

```
# List all available models
# Requires OPENAI_API_KEY and OPENAI_BASE_URL environment variables

curl -X GET $OPENAI_BASE_URL/models \
   -H "Authorization: Bearer $OPENAI_API_KEY"
```

------

## Antworten-API
<a name="bedrock-mantle-responses"></a>

Die Responses API bietet zustandsorientiertes Konversationsmanagement mit Unterstützung für Streaming, Hintergrundverarbeitung und Multi-Turn-Interaktionen. Vollständige API-Details finden Sie in der [OpenAIResponse-Dokumentation](https://developers.openai.com/api/reference/resources/responses).

**Anmerkung**  
Nicht alle Modelle unterstützen die Responses API. Informationen darüber, welche Modelle die Responses API unterstützen, finden Sie unter[API-Kompatibilität](models-api-compatibility.md).

### Wie die Responses API den Konversationsstatus speichert
<a name="bedrock-mantle-responses-state"></a>

Die Responses API kann den gespeicherten Status verwenden, um Multi-Turn-Konversationen zu ermöglichen und es Ihnen zu ermöglichen, über den `previous_response_id` Parameter auf vorherige Runden zu verweisen. Der Speicher ist standardmäßig aktiviert, kann aber pro Anfrage über den `store` Parameter deaktiviert werden. Gespeicherte Antworten werden vom Projekt abgegrenzt. Eine Antwort aus einem Projekt kann nicht als vorherige Antwort verwendet oder in einem zweiten Projekt gelesen werden. Weitere Informationen zu Projekten finden Sie unter[Projekte (OpenAI-compatible)](projects.md).
+ Wenn `store` dies der Fall ist `true` (Standardeinstellung), speichert Amazon Bedrock die Antwort, einschließlich der Eingabe und Ausgabe, 30 Tage lang in der Quellregion der Anfrage. Während dieses Zeitfensters können Sie Folgeanfragen verketten, indem Sie die Antwort mit `GET /v1/responses/{id}` weiterleiten `previous_response_id` und abrufen. Nach 30 Tagen wird die Antwort automatisch gelöscht und ist nicht mehr abrufbar.
+ Wenn `store` ja`false`, speichert Amazon Bedrock keine Daten aus der Anfrage oder Antwort. Der `previous_response_id` Parameter kann nicht verwendet werden, um die Konversation fortzusetzen.

Der Standardwert `true` entspricht der OpenAI Response-API-Spezifikation. Kunden, die nicht möchten, dass Amazon Bedrock Gesprächsdaten speichert, sollten dies `false` bei jeder Anfrage ausdrücklich angeben. `store` Gespeicherte Daten werden in der Quellregion der Anfrage gespeichert, im Ruhezustand verschlüsselt und der Projektressource des anrufenden AWS Accounts zugeordnet. Die Daten werden ausschließlich zur Bearbeitung Ihrer Anfragen gespeichert und nicht für andere Zwecke verwendet oder aufbewahrt.

### Grundlegende Anfrage
<a name="bedrock-mantle-responses-create"></a>

Um eine Antwort zu erstellen, wählen Sie die Registerkarte für Ihre bevorzugte Methode und folgen Sie dann den Schritten:

------
#### [ OpenAI SDK (Python) ]

```
# Create a basic response using the OpenAI SDK
# Requires OPENAI_API_KEY and OPENAI_BASE_URL environment variables

from openai import OpenAI

client = OpenAI()

response = client.responses.create(
    model="openai.gpt-oss-120b",
    input=[
        {"role": "user", "content": "Hello! How can you help me today?"}
    ]
)

print(response)
```

------
#### [ HTTP request ]

Stellen Sie eine POST-Anfrage an`/v1/responses`:

```
# Create a basic response
# Requires OPENAI_API_KEY and OPENAI_BASE_URL environment variables

curl -X POST $OPENAI_BASE_URL/responses \
   -H "Content-Type: application/json" \
   -H "Authorization: Bearer $OPENAI_API_KEY" \
   -d '{
    "model": "openai.gpt-oss-120b",
    "input": [
        {"role": "user", "content": "Hello! How can you help me today?"}
    ]
}'
```

------

### Antworten streamen
<a name="bedrock-mantle-responses-streaming"></a>

Um schrittweise Antwortereignisse zu empfangen, wählen Sie die Registerkarte für Ihre bevorzugte Methode und gehen Sie dann wie folgt vor:

------
#### [ OpenAI SDK (Python) ]

```
# Stream response events incrementally using the OpenAI SDK
# Requires OPENAI_API_KEY and OPENAI_BASE_URL environment variables

from openai import OpenAI

client = OpenAI()

stream = client.responses.create(
    model="openai.gpt-oss-120b",
    input=[{"role": "user", "content": "Tell me a story"}],
    stream=True
)

for event in stream:
    print(event)
```

------
#### [ HTTP request ]

Stellen Sie eine POST-Anfrage an `/v1/responses` mit `stream` folgender Einstellung: `true`

```
# Stream response events incrementally
# Requires OPENAI_API_KEY and OPENAI_BASE_URL environment variables

curl -X POST $OPENAI_BASE_URL/responses \
   -H "Content-Type: application/json" \
   -H "Authorization: Bearer $OPENAI_API_KEY" \
   -d '{
    "model": "openai.gpt-oss-120b",
    "input": [
        {"role": "user", "content": "Tell me a story"}
    ],
    "stream": true
}'
```

------