View a markdown version of this page

Größe 4,3 - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Größe 4,3

Symbol mit dem XAi-Logo. xAi — Grok 4.3

Modelldetails

Grok 4.3 ist ein Modell, bei dem das Denken an erster Stelle steht und einen ständig verfügbaren und konfigurierbaren Argumentationsaufwand bietet (kein, niedrig, mittel, hoch). Da Argumentation immer aktiv und nicht optional ist, verhält es sich in mehrstufigen Agentenschleifen konsistenter als Modelle, bei denen das Denken übersprungen werden kann. Darüber hinaus bietet es umfassende Funktionen zur Verwendung von Tools und zur Befolgung von Anweisungen für die Erstellung von mehrstufigen Agenten sowie Token-Effizienz, um umfangreiche Inferenzen kostengünstig zu gestalten. Grok 4.3 eignet sich besonders gut für Unternehmens-Workloads wie Vertragsprüfung, Rechtsprechungsforschung, Analyse von Kreditverträgen und Fragen und Antworten zu Finanzdokumenten und liefert gleichzeitig konsistente, qualitativ hochwertige Ergebnisse in Konversations-KI-, Such-, Chat- und Multi-Turn-Workflows. Grok 4.3 läuft auf Mantle, einer neuen Inferenz-Engine in Amazon Bedrock, die auf ein gutes Preis-Leistungs-Verhältnis ausgelegt ist und Tool-Calls, strukturierte Ausgaben und Antwort-Streaming unterstützt.

Eingabemodalitäten Ausgabemodalitäten Unterstützte APIs Unterstützte Endpunkte
Red circle with white X icon indicating error, cancel, or close action.AudioRed circle with white X icon indicating error, cancel, or close action.EinbettenGreen circle with white checkmark icon. Chat CompletionsRed circle with white X icon indicating error, cancel, or close action. bedrock-runtime
Green circle with white checkmark icon.BildRed circle with white X icon indicating error, cancel, or close action.BildGreen circle with white checkmark icon. ResponsesGreen circle with white checkmark icon. bedrock-mantle
Red circle with white X icon indicating error, cancel, or close action.RedeRed circle with white X icon indicating error, cancel, or close action.RedeRed circle with white X icon indicating error, cancel, or close action. Invoke
Green circle with white checkmark icon.TextGreen circle with white checkmark icon.TextRed circle with white X icon indicating error, cancel, or close action. Converse
Red circle with white X icon indicating error, cancel, or close action.-VideoRed circle with white X icon indicating error, cancel, or close action.-Video
Anmerkung

Dieses Modell ist auf dem openai/v1/responses Pfad auf dem bedrock-mantle Endpunkt verfügbar. Dies unterscheidet sich von dem v1/responses Pfad, der von anderen Modellen auf dem Antwortendpunkt verwendet wird.

Fähigkeiten und Funktionen

Eigenschaften von Bedrock

Funktionen, die mithilfe bedrock-mantle von Endpoint unterstützt werden

Wird unterstützt Wird nicht unterstützt

Preisgestaltung

Die Preise finden Sie auf der Seite mit den Preisen von Amazon Bedrock.

Programmatischer Zugriff

Verwenden Sie die folgenden Modell-IDs und Endpunkt-URLs, um programmgesteuert auf dieses Modell zuzugreifen. Weitere Informationen zu den verfügbaren APIs und Endpunkten finden Sie unter Unterstützte APIs und Unterstützte Endpunkte.

Endpunkt Modell-ID In-Region Endpunkt-URL Geoinferenz-ID Globale Inferenz-ID
bedrock-mantle xai.grok-4.3 https://bedrock-mantle.{region}.api.aws/openai/v1 Nicht unterstützt Nicht unterstützt

Wenn die Region beispielsweise us-west-2 (Oregon) ist, dann lautet die URL des Bedrock-Mantel-Endpunkts "„. https://bedrock-mantle.us-west-2.api.aws/openai/v1

Dienststufen

Amazon Bedrock bietet mehrere Servicestufen, um Ihren Workload-Anforderungen gerecht zu werden. Standard bietet unverbindlichen Pay-per-Token-Zugriff. Priority bietet einen höheren Durchsatz mit einer zeitbasierten Verpflichtung. Flex bietet kostengünstigeren Zugriff für flexible, nicht zeitkritische Workloads. Reserved bietet einen dedizierten Durchsatz mit einer festen Laufzeit für vorhersehbare Workloads. Weitere Informationen finden Sie unter Servicestufen.

Standard Priorität Flex Reserviert
Green circle with white checkmark icon. Green circle with white checkmark icon. Green circle with white checkmark icon. Red circle with white X icon indicating error, cancel, or close action.

Regionale Verfügbarkeit

Die regionale Verfügbarkeit auf einen Blick

Bedrock bietet drei Inferenzoptionen: In-Regiondie Erfassung von Anfragen innerhalb einer einzigen Region, um die strikte Einhaltung der Vorschriften zu gewährleisten, geografische Cross-Region Routen zwischen Regionen innerhalb einer Region (USA, EU usw.) für einen höheren Durchsatz bei gleichzeitiger Wahrung der Datenresidenz und globale Cross-Region Routen überall auf der Welt für maximalen Durchsatz, wenn es keine Einschränkungen bezüglich des Wohnsitzes gibt. Weitere Informationen finden Sie auf der Regionale Verfügbarkeit nach Modellen Seite.

Region In-Region Geo Global
us-west-2(Oregon)Green circle with white checkmark icon.Red circle with white X icon indicating error, cancel, or close action.Red circle with white X icon indicating error, cancel, or close action.
us-east-1(Nord-Virginia)Green circle with white checkmark icon.Red circle with white X icon indicating error, cancel, or close action.Red circle with white X icon indicating error, cancel, or close action.
us-east-2(Ohio)Green circle with white checkmark icon.Red circle with white X icon indicating error, cancel, or close action.Red circle with white X icon indicating error, cancel, or close action.

Kontingente und Einschränkungen

Ihr AWS-Konto verfügt über Standardkontingente, um die Leistung des Service aufrechtzuerhalten und eine angemessene Nutzung von Amazon Bedrock sicherzustellen. Die einem Konto zugewiesenen Standardkontingente können je nach regionalen Faktoren, Zahlungsverlauf, betrügerischer Nutzung und and/or Genehmigung einer Anfrage zur Erhöhung des Kontingents aktualisiert werden. Weitere Informationen finden Sie in der Kontingente für Amazon Bedrock Dokumentation und in den Grenzwerten für das Modell.

Wenn der On-Demand-Durchsatz auf dem bedrock-mantle Endpunkt genutzt wird, skaliert der verfügbare Durchsatz mit der Zeit. Es ist nicht garantiert, dass alle Anfragen innerhalb Ihres Kontingents in Zeiten hoher Nachfrage erfolgreich sind. Daher ist eine schrittweise Erhöhung wichtig. Bei diesem Modell werden die Standardlimits nicht direkt über die Service Quotas angezeigt. Wir empfehlen daher, sich an die Rampe zu halten.

Beispiel-Code

Schritt 1 — AWS-Konto: Wenn Sie bereits ein AWS-Konto haben, überspringen Sie diesen Schritt. Wenn Sie neu bei AWS sind, registrieren Sie sich für ein AWS-Konto.

Schritt 2 — API-Schlüssel: Rufen Sie die Amazon Bedrock-Konsole auf und generieren Sie einen langfristigen API-Schlüssel.

Schritt 3 — Holen Sie sich das SDK: Um dieses Handbuch für die ersten Schritte verwenden zu können, muss Python bereits installiert sein. Installieren Sie dann die entsprechende Software, je nachdem, welche APIs Sie verwenden.

Chat Completions API
pip install openai
Responses API
pip install openai

Schritt 4 — Umgebungsvariablen festlegen: Konfigurieren Sie Ihre Umgebung so, dass der API-Schlüssel für die Authentifizierung verwendet wird.

Chat Completions API
OPENAI_API_KEY="<provide your Bedrock API key>" OPENAI_BASE_URL="https://bedrock-mantle.us-west-2.api.aws/openai/v1"
Responses API
OPENAI_API_KEY="<provide your Bedrock API key>" OPENAI_BASE_URL="https://bedrock-mantle.us-west-2.api.aws/openai/v1"

Schritt 5 — Führen Sie Ihre erste Inferenzanfrage aus: Speichern Sie die Datei unter bedrock-first-request.py

Chat Completions API
from openai import OpenAI client = OpenAI() response = client.chat.completions.create( model="xai.grok-4.3", messages=[ {"role": "user", "content": "Can you explain the features of Amazon Bedrock?"} ] ) print(response)
Responses API
from openai import OpenAI client = OpenAI() response = client.responses.create( model="xai.grok-4.3", input="Can you explain the features of Amazon Bedrock?" ) print(response)

Überlegungen zur Verwendung und Einschränkungen

  • Argumentationsaufwand — Die Argumentation ist standardmäßig immer aktiv. Sie können den Aufwand über den folgenden reasoning Parameter konfigurieren: {"effort": "none"} (deaktiviert Argumentation), "low" (Standard), oder. "medium" "high" Der Inhalt der Argumentation ist verschlüsselt und kann zurückgegeben werden, indem die Responses include: ["reasoning.encrypted_content"] API-Anfrage übergeben wird. Sie können den verschlüsselten Inhalt in aufeinanderfolgenden Runden zurücksenden, um den Argumentationskontext für Konversationen mit mehreren Runden bereitzustellen. Die Chat Completions API gibt keine Argumentationstoken zurück.

    response = client.responses.create( model="xai.grok-4.3", reasoning={"effort": "high"}, include=["reasoning.encrypted_content"], input="Explain quantum entanglement simply." ) print(response.output_text)
  • Standardparameter — Grok 4.3 verwendet Standardwerte, die sich von der Standard-OpenAI-API-Spezifikation unterscheiden: temperature standardmäßig auf 0.7 (nicht1), top_p standardmäßig auf 0.95 (nicht1) und standardmäßig auf. max_completion_tokens 131072 Passen Sie diese Werte explizit an, wenn Ihre Anwendung ein anderes Verhalten erfordert.