View a markdown version of this page

Grok 4.3 - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Grok 4.3

Icône représentant le logo XAi. Xai — Grok 4.3

Détails du modèle

Grok 4.3 est un modèle axé sur le raisonnement qui offre un effort de raisonnement permanent et configurable (aucun, faible, moyen, élevé). Le raisonnement étant toujours actif plutôt qu'facultatif, il se comporte de manière plus cohérente dans les boucles d'agents en plusieurs étapes que les modèles qui peuvent ignorer la réflexion. Il offre également de solides capacités d'utilisation des outils et de suivi des instructions pour créer des agents en plusieurs étapes, ainsi qu'une efficacité symbolique pour garantir la rentabilité de l'inférence de volumes élevés. Grok 4.3 est particulièrement bien adapté aux charges de travail des entreprises telles que la révision des contrats, les recherches jurisprudentielles, l'analyse des contrats de crédit et les questions-réponses sur les documents financiers, tout en fournissant des résultats cohérents et de haute qualité dans le cadre de l'IA conversationnelle, de la recherche, du chat et des flux de travail multitours. Grok 4.3 fonctionne sur Mantle, un nouveau moteur d'inférence d'Amazon Bedrock conçu pour optimiser les prix, avec prise en charge de l'appel d'outils, de la sortie structurée et du streaming des réponses.

  • Date de lancement du modèle : 15 juin 2026

  • Date EOL du modèle : N/A

  • Contrats de licence utilisateur final et conditions d'utilisation : Afficher

  • Cycle de vie du modèle : actif

  • Fenêtre contextuelle : 1 million de jetons

  • Raisonnement : pris en charge (configurable : faible, moyen, élevé)

Modalités de saisie Modalités de sortie API prises en charge Endpoints pris en charge
Red circle with white X icon indicating error, cancel, or close action.AudioRed circle with white X icon indicating error, cancel, or close action.IntégrationGreen circle with white checkmark icon. Chat CompletionsRed circle with white X icon indicating error, cancel, or close action. bedrock-runtime
Green circle with white checkmark icon.ImageRed circle with white X icon indicating error, cancel, or close action.ImageGreen circle with white checkmark icon. ResponsesGreen circle with white checkmark icon. bedrock-mantle
Red circle with white X icon indicating error, cancel, or close action.DiscoursRed circle with white X icon indicating error, cancel, or close action.DiscoursRed circle with white X icon indicating error, cancel, or close action. Invoke
Green circle with white checkmark icon.TexteGreen circle with white checkmark icon.TexteRed circle with white X icon indicating error, cancel, or close action. Converse
Red circle with white X icon indicating error, cancel, or close action.VidéoRed circle with white X icon indicating error, cancel, or close action.Vidéo
Note

Ce modèle est disponible sur le openai/v1/responses chemin du bedrock-mantle point de terminaison. Ce chemin est différent du v1/responses chemin utilisé par les autres modèles sur le point de terminaison des réponses.

Capacités et fonctionnalités

Caractéristiques de Bedrock

Fonctionnalités prises en charge avec bedrock-mantle Endpoint

Soutenu Non pris en charge

Tarification

Pour connaître les tarifs, consultez la page de tarification d'Amazon Bedrock.

Accès programmatique

Utilisez les ID de modèle et les URL de point de terminaison suivants pour accéder à ce modèle par programmation. Pour plus d'informations sur les API et les points de terminaison disponibles, consultez les sections API prises en charge et Points de terminaison pris en charge.

Point de terminaison ID du modèle In-Region URL du terminal Identifiant d'inférence géographique ID d'inférence global
bedrock-mantle xai.grok-4.3 https://bedrock-mantle.{region}.api.aws/openai/v1 Non pris en charge Non pris en charge

Par exemple, si la région est us-west-2 (Oregon), l'URL du point de terminaison bedrock-mantle sera « ». https://bedrock-mantle.us-west-2.api.aws/openai/v1

Niveaux de service

Amazon Bedrock propose plusieurs niveaux de service pour répondre à vos exigences en matière de charge de travail. Standard fournit un accès au paiement par jeton sans engagement. Priority offre un débit plus élevé avec un engagement basé sur le temps. Flex fournit un accès à moindre coût pour les charges de travail flexibles et non urgentes. Reserved fournit un débit dédié avec un engagement à terme pour des charges de travail prévisibles. Pour plus d'informations, consultez la section niveaux de service.

Standard Priorité Flex Réservé
Green circle with white checkmark icon. Green circle with white checkmark icon. Green circle with white checkmark icon. Red circle with white X icon indicating error, cancel, or close action.

Disponibilité par région

La disponibilité régionale en un coup d'œil

Bedrock propose trois options d'inférence : In-Regionconserver les demandes dans une seule région pour une conformité stricte, Cross-Regiongéo-itinéraires entre les régions d'une même zone géographique (États-Unis, UE, etc.) pour un débit plus élevé tout en respectant la résidence des données, et Cross-Region itinéraires mondiaux partout dans le monde pour un débit maximal en l'absence de contraintes de résidence. Reportez-vous à la Disponibilité régionale par modèle page pour plus de détails.

Région In-Region Géo Solution internationale
us-west-2(Oregon)Green circle with white checkmark icon.Red circle with white X icon indicating error, cancel, or close action.Red circle with white X icon indicating error, cancel, or close action.
us-east-1(Virginie du Nord)Green circle with white checkmark icon.Red circle with white X icon indicating error, cancel, or close action.Red circle with white X icon indicating error, cancel, or close action.
us-east-2(Ohio)Green circle with white checkmark icon.Red circle with white X icon indicating error, cancel, or close action.Red circle with white X icon indicating error, cancel, or close action.

Quotas et limites

Votre compte AWS dispose de quotas par défaut pour maintenir les performances du service et garantir une utilisation appropriée d'Amazon Bedrock. Les quotas par défaut attribués à un compte peuvent être mis à jour en fonction de facteurs régionaux, de l'historique des paiements, de l'utilisation frauduleuse ou de and/or l'approbation d'une demande d'augmentation de quota. Pour plus de détails, reportez-vous à Quotas pour Amazon Bedrock la documentation et aux limites du modèle.

Lorsque vous consommez du débit à la demande sur le bedrock-mantle terminal, le débit disponible évolue au fil du temps. Le succès de toutes les demandes dans les limites de votre quota n'est pas garanti pendant les périodes de forte demande. Il est donc important de les accélérer progressivement. Pour ce modèle, les limites par défaut ne sont pas directement définies par le biais des Quotas de Service. Nous vous recommandons donc de suivre la rampe comme guide.

Exemple de code

Étape 1 - Compte AWS : si vous possédez déjà un compte AWS, ignorez cette étape. Si vous utilisez AWS pour la première fois, créez un compte AWS.

Étape 2 - Clé d'API : accédez à la console Amazon Bedrock et générez une clé d'API à long terme.

Étape 3 - Téléchargez le SDK : pour utiliser ce guide de démarrage, Python doit déjà être installé. Installez ensuite le logiciel approprié en fonction des API que vous utilisez.

Chat Completions API
pip install openai
Responses API
pip install openai

Étape 4 - Définissez les variables d'environnement : configurez votre environnement pour utiliser la clé API pour l'authentification.

Chat Completions API
OPENAI_API_KEY="<provide your Bedrock API key>" OPENAI_BASE_URL="https://bedrock-mantle.us-west-2.api.aws/openai/v1"
Responses API
OPENAI_API_KEY="<provide your Bedrock API key>" OPENAI_BASE_URL="https://bedrock-mantle.us-west-2.api.aws/openai/v1"

Étape 5 - Exécutez votre première demande d'inférence : enregistrez le fichier sous bedrock-first-request.py

Chat Completions API
from openai import OpenAI client = OpenAI() response = client.chat.completions.create( model="xai.grok-4.3", messages=[ {"role": "user", "content": "Can you explain the features of Amazon Bedrock?"} ] ) print(response)
Responses API
from openai import OpenAI client = OpenAI() response = client.responses.create( model="xai.grok-4.3", input="Can you explain the features of Amazon Bedrock?" ) print(response)

Considérations et limites d'utilisation

  • Effort de raisonnement — Le raisonnement est toujours actif par défaut. Vous pouvez configurer l'effort via le reasoning paramètre : {"effort": "none"} (désactive le raisonnement), "low" (par défaut) ou"high". "medium" Le contenu de Reasoning est crypté et peut être renvoyé include: ["reasoning.encrypted_content"] en transmettant la demande d'API Responses. Vous pouvez renvoyer le contenu crypté lors des tours suivants afin de fournir un contexte de raisonnement pour les conversations à plusieurs tours. L'API Chat Completions ne renvoie pas de jetons de raisonnement.

    response = client.responses.create( model="xai.grok-4.3", reasoning={"effort": "high"}, include=["reasoning.encrypted_content"], input="Explain quantum entanglement simply." ) print(response.output_text)
  • Paramètres par défaut — Grok 4.3 utilise des valeurs par défaut différentes de la spécification standard de l'API OpenAI : la valeur par temperature défaut est 0.7 (non1), la valeur par défaut est (non) et la top_p valeur par défaut est1. 0.95 max_completion_tokens 131072 Ajustez ces valeurs de manière explicite si votre application nécessite un comportement différent.