Régions et points de terminaison pris en charge Conditions préalables API de modèles API de réponses

Inférence à l'aide de l'API Responses

Amazon Bedrock fournit l'API OpenAI Responses via le bedrock-mantle point de terminaison, alimenté par Mantle, un moteur d'inférence distribué destiné à la diffusion de modèles d'apprentissage automatique à grande échelle. Ce point de terminaison vous permet d'utiliser des OpenAI SDK et des outils familiers avec les modèles Amazon Bedrock, ce qui vous permet de migrer des applications existantes avec un minimum de modifications de code. Il vous suffit de mettre à jour votre URL de base et votre clé d'API.

Important

Lorsque vous utilisez le OpenAI SDK avec Amazon Bedrock, vous devez le pointer vers le point de terminaison Amazon Bedrock, et non vers le point de terminaison. OpenAI Définissez les variables d'environnement suivantes :


OPENAI_BASE_URL="https://bedrock-mantle.<your-region>.api.aws/v1"
OPENAI_API_KEY="<your Bedrock API key>"

N'utilisez pas votre clé OpenAI d'API ni l'URL OpenAI de base (https://api.openai.com/v1). Ils se connectent OpenAI directement à Amazon Bedrock, et non à Amazon Bedrock. Pour créer une clé d'API Amazon Bedrock, consultezclés d’API.

Les principaux avantages sont les suivants :

Inférence asynchrone — Support pour les charges de travail d'inférence de longue durée via l'API Responses
Gestion dynamique des conversations : reconstruisez automatiquement le contexte sans transmettre manuellement l'historique des conversations à chaque demande
Utilisation simplifiée des outils — Intégration rationalisée pour les flux de travail agentiques
Modes de réponse flexibles — Support pour les réponses en streaming et hors streaming
Migration facile — Compatible avec les bases de OpenAI code SDK existantes

Le trafic d'inférence vers le bedrock-mantle point de terminaison est régi par un ensemble de quotas distinct de celui du point de bedrock-runtime terminaison. Pour plus de détails sur les quotas de jetons d'entrée et de sortie et sur la manière de demander des augmentations, consultezQuotas pour la limite entre le substrat rocheux et le manteau.

Régions et points de terminaison pris en charge

Le bedrock-mantle point de terminaison est disponible dans les AWS régions suivantes :

Nom de la région	Région	Endpoint
USA Est (Ohio)	us-east-2	bedrock-mantle.us-east-2.api.aws
USA Est (Virginie du Nord)	us-east-1	bedrock-mantle.us-east-1.api.aws
USA Ouest (Oregon)	us-west-2	bedrock-mantle.us-west-2.api.aws
Asie-Pacifique (Jakarta)	ap-southeast-3	bedrock-mantle.ap-southeast-3.api.aws
Asie-Pacifique (Mumbai)	ap-south-1	bedrock-mantle.ap-south-1.api.aws
Asie-Pacifique (Sydney)	ap-southeast-2	bedrock-mantle.ap-southeast-2.api.aws
Asie-Pacifique (Tokyo)	ap-northeast-1	bedrock-mantle.ap-northeast-1.api.aws
Europe (Francfort)	eu-central-1	bedrock-mantle.eu-central-1.api.aws
Europe (Irlande)	eu-west-1	bedrock-mantle.eu-west-1.api.aws
Europe (Londres)	eu-west-2	bedrock-mantle.eu-west-2.api.aws
Europe (Milan)	eu-south-1	bedrock-mantle.eu-south-1.api.aws
Europe (Stockholm)	eu-north-1	bedrock-mantle.eu-north-1.api.aws
Amérique du Sud (São Paulo)	sa-east-1	bedrock-mantle.sa-east-1.api.aws
AWS GovCloud (US-West)	us-gov-west-1	bedrock-mantle.us-gov-west-1.api.aws

Conditions préalables

Avant d'utiliser OpenAI les API, assurez-vous de disposer des éléments suivants :

Authentification — Vous pouvez vous authentifier en utilisant :
- Clé d'API Amazon Bedrock (requise pour le OpenAI SDK)
- AWSinformations d'identification (prises en charge pour les requêtes HTTP)
OpenAISDK (facultatif) — Installez le SDK OpenAI Python si vous utilisez SDK-based des requêtes.
Variables d'environnement : définissez les variables d'environnement suivantes :
- OPENAI_API_KEY— Réglé sur votre clé d'API Amazon Bedrock
- OPENAI_BASE_URL— Définissez le point de terminaison Amazon Bedrock de votre région (par exemple,https://bedrock-mantle.us-east-1.api.aws/v1)

API de modèles

L'API Models vous permet de découvrir les modèles disponibles dans Amazon Bedrock propulsé par Mantle. Utilisez cette API pour récupérer la liste des modèles que vous pouvez utiliser avec l'API Responses. Pour obtenir des informations complètes sur l'API, consultez la documentation sur OpenAI les modèles.

Liste des modèles disponibles

Pour répertorier les modèles disponibles, choisissez l'onglet correspondant à votre méthode préférée, puis suivez les étapes suivantes :

API de réponses

L'API Responses fournit une gestion dynamique des conversations avec prise en charge du streaming, du traitement en arrière-plan et des interactions à plusieurs tours. Pour obtenir des informations complètes sur l'API, consultez la documentation sur OpenAI les réponses.

Note

Tous les modèles ne prennent pas en charge l'API Responses. Pour savoir quels modèles prennent en charge l'API Responses, consultezCompatibilité des API par modèle.

Comment l'API Responses stocke l'état de la conversation

L'API Responses peut utiliser l'état stocké pour activer les conversations à plusieurs tours et vous permettre de référencer les tours précédents par le biais du previous_response_id paramètre. Le stockage est activé par défaut mais peut être désactivé par demande via le store paramètre. Les réponses stockées sont définies par projet. La réponse d'un projet ne peut pas être utilisée comme réponse précédente ni lue dans un second projet. Pour plus d'informations sur les projets, consultezProjets (OpenAI-compatible).

Lorsque store c'est le cas true (valeur par défaut), Amazon Bedrock conserve la réponse, y compris les entrées et les sorties, pendant 30 jours dans la région source de la demande. Au cours de cette fenêtre, vous pouvez enchaîner les demandes de suivi en previous_response_id les transmettant et en récupérant la réponse avecGET /v1/responses/{id}. Après 30 jours, la réponse est automatiquement supprimée et n'est plus récupérable.
Dans store ce casfalse, Amazon Bedrock ne conserve aucune donnée provenant de la demande ou de la réponse. Le previous_response_id paramètre ne peut pas être utilisé pour poursuivre la conversation.

La valeur par défaut doit correspondre true à la spécification de l'API OpenAI Responses. Les clients qui ne souhaitent pas qu'Amazon Bedrock conserve les données de conversation doivent explicitement store définir cette valeur false sur chaque demande. Les données stockées sont conservées dans la région source de la demande, cryptées au repos et limitées à la ressource de projet du AWS compte appelant. Les données sont stockées uniquement pour répondre à vos demandes et ne sont ni utilisées ni conservées à d'autres fins.

Demande de base

Pour créer une réponse, choisissez l'onglet correspondant à votre méthode préférée, puis suivez les étapes suivantes :

Diffusez les réponses

Pour recevoir les événements de réponse de manière incrémentielle, choisissez l'onglet correspondant à votre méthode préférée, puis suivez les étapes suivantes :

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Faire des demandes d'inférence

API de complétion des discussions