View a markdown version of this page

Grok 4.3 - Amazon Bedrock

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Grok 4.3

Icona che mostra il logo XAI. Xai — Grok 4.3

Dettagli del modello

Grok 4.3 è un modello basato sul ragionamento che offre uno sforzo di ragionamento sempre attivo e configurabile (nessuno, basso, medio, alto). Poiché il ragionamento è sempre attivo anziché facoltativo, si comporta in modo più coerente nei cicli di agenti in più fasi rispetto ai modelli che possono ignorare il pensiero. Offre inoltre un forte utilizzo degli strumenti e funzionalità di seguire le istruzioni per la creazione di agenti in più fasi, nonché l'efficienza dei token per aiutare a mantenere l'inferenza ad alto volume conveniente. Grok 4.3 è particolarmente adatto ai carichi di lavoro aziendali come la revisione dei contratti, la ricerca giurisprudenziale, l'analisi dei contratti di credito e le domande e risposte sui documenti finanziari, offrendo al contempo risultati coerenti e di alta qualità attraverso l'intelligenza artificiale conversazionale, la ricerca, la chat e i flussi di lavoro a più turni. Grok 4.3 funziona su Mantle, un nuovo motore di inferenza di Amazon Bedrock progettato per un rapporto prezzo/prestazioni, con supporto per la chiamata di strumenti, l'output strutturato e lo streaming di risposte.

Modalità di input Modalità di output API supportate Endpoint supportati
Red circle with white X icon indicating error, cancel, or close action.AudioRed circle with white X icon indicating error, cancel, or close action.IncorporamentoGreen circle with white checkmark icon. Chat CompletionsRed circle with white X icon indicating error, cancel, or close action. bedrock-runtime
Green circle with white checkmark icon.ImmagineRed circle with white X icon indicating error, cancel, or close action.ImmagineGreen circle with white checkmark icon. ResponsesGreen circle with white checkmark icon. bedrock-mantle
Red circle with white X icon indicating error, cancel, or close action.DiscorsoRed circle with white X icon indicating error, cancel, or close action.DiscorsoRed circle with white X icon indicating error, cancel, or close action. Invoke
Green circle with white checkmark icon.TestoGreen circle with white checkmark icon.TestoRed circle with white X icon indicating error, cancel, or close action. Converse
Red circle with white X icon indicating error, cancel, or close action.VideoRed circle with white X icon indicating error, cancel, or close action.Video
Nota

Questo modello è disponibile sul openai/v1/responses percorso dell'bedrock-mantleendpoint. Questo è diverso dal v1/responses percorso utilizzato da altri modelli sull'endpoint delle risposte.

Funzionalità e caratteristiche

Caratteristiche di base

Funzionalità supportate tramite endpoint bedrock-mantle

Supportato Non supportato

Prezzi

Per i prezzi, consulta la pagina dei prezzi di Amazon Bedrock.

Accesso programmatico

Utilizza i seguenti ID di modello e URL degli endpoint per accedere a questo modello a livello di codice. Per ulteriori informazioni sulle API e sugli endpoint disponibili, consulta API supportate e Endpoint supportati.

Endpoint ID del modello In-Region URL dell'endpoint ID di inferenza geografica ID di inferenza globale
bedrock-mantle xai.grok-4.3 https://bedrock-mantle.{region}.api.aws/openai/v1 Non supportata Non supportata

Ad esempio, se la regione è us-west-2 (Oregon), l'URL dell'endpoint bedrock-mantle sarà "». https://bedrock-mantle.us-west-2.api.aws/openai/v1

Livelli di servizio

Amazon Bedrock offre diversi livelli di servizio per soddisfare i tuoi requisiti di carico di lavoro. Standard offre un accesso pay-per-token senza impegno. Priority offre una maggiore produttività con un impegno basato sul tempo. Flex offre un accesso a basso costo per carichi di lavoro flessibili e non urgenti. Reserved offre un throughput dedicato con un impegno a termine per carichi di lavoro prevedibili. Per ulteriori informazioni, consulta i livelli di servizio.

Standard Priorità Flex riservato
Green circle with white checkmark icon. Green circle with white checkmark icon. Green circle with white checkmark icon. Red circle with white X icon indicating error, cancel, or close action.

Disponibilità regionale

Disponibilità regionale a colpo d'occhio

Bedrock offre tre opzioni di inferenza: In-Regionmantiene le richieste all'interno di una singola regione per garantire la massima conformità, instradamenti Cross-Regiongeografici tra regioni all'interno di un'area geografica (Stati Uniti, UE, ecc.) per una maggiore velocità di trasmissione nel rispetto della residenza dei dati e Cross-Region percorsi globali ovunque in tutto il mondo per la massima velocità di trasmissione quando non ci sono vincoli di residenza. Consulta la pagina per maggiori dettagli. Disponibilità regionale per modello

Region In-Region Geo Globale
us-west-2(Oregon)Green circle with white checkmark icon.Red circle with white X icon indicating error, cancel, or close action.Red circle with white X icon indicating error, cancel, or close action.
us-east-1(Virginia settentrionale)Green circle with white checkmark icon.Red circle with white X icon indicating error, cancel, or close action.Red circle with white X icon indicating error, cancel, or close action.
us-east-2(Ohio)Green circle with white checkmark icon.Red circle with white X icon indicating error, cancel, or close action.Red circle with white X icon indicating error, cancel, or close action.

Quote e limiti

Il tuo account AWS dispone di quote predefinite per mantenere le prestazioni del servizio e garantire un uso appropriato di Amazon Bedrock. Le quote predefinite assegnate a un account potrebbero essere aggiornate in base a fattori regionali, alla cronologia dei pagamenti, all'utilizzo fraudolento, all' and/or approvazione di una richiesta di aumento delle quote. Per maggiori dettagli, consulta la Quote per Amazon Bedrock documentazione e consulta i limiti del modello.

Quando si utilizza il throughput on-demand sull'bedrock-mantleendpoint, il throughput disponibile aumenta nel tempo. Non è garantito il successo di tutte le richieste che rientrano nella quota stabilita durante i periodi di forte domanda, quindi è importante aumentare gradualmente. Per questo modello, i limiti predefiniti non vengono indicati direttamente tramite Service Quotas, quindi ti consigliamo di seguire la rampa come guida.

Codice di esempio

Fase 1 - Account AWS: se hai già un account AWS, salta questo passaggio. Se non conosci AWS, registrati per un account AWS.

Fase 2 - Chiave API: vai alla console Amazon Bedrock e genera una chiave API a lungo termine.

Passaggio 3 - Scarica l'SDK: per utilizzare questa guida introduttiva, devi avere Python già installato. Quindi installa il software pertinente in base alle API che stai utilizzando.

Chat Completions API
pip install openai
Responses API
pip install openai

Passaggio 4 - Imposta le variabili di ambiente: configura l'ambiente per utilizzare la chiave API per l'autenticazione.

Chat Completions API
OPENAI_API_KEY="<provide your Bedrock API key>" OPENAI_BASE_URL="https://bedrock-mantle.us-west-2.api.aws/openai/v1"
Responses API
OPENAI_API_KEY="<provide your Bedrock API key>" OPENAI_BASE_URL="https://bedrock-mantle.us-west-2.api.aws/openai/v1"

Passaggio 5 - Esegui la tua prima richiesta di inferenza: salva il file come bedrock-first-request.py

Chat Completions API
from openai import OpenAI client = OpenAI() response = client.chat.completions.create( model="xai.grok-4.3", messages=[ {"role": "user", "content": "Can you explain the features of Amazon Bedrock?"} ] ) print(response)
Responses API
from openai import OpenAI client = OpenAI() response = client.responses.create( model="xai.grok-4.3", input="Can you explain the features of Amazon Bedrock?" ) print(response)

Considerazioni e limitazioni sull'utilizzo

  • Sforzo di ragionamento: il ragionamento è sempre attivo per impostazione predefinita. È possibile configurare lo sforzo tramite il reasoning parametro: {"effort": "none"} (disabilita il ragionamento), "low" (impostazione predefinita) o. "medium" "high" Il contenuto del ragionamento è crittografato e può essere restituito inviando la richiesta dell'include: ["reasoning.encrypted_content"]API Responses. Puoi inviare il contenuto crittografato nei turni successivi per fornire un contesto di ragionamento per conversazioni a turni multipli. L'API Chat Completions non restituisce token di ragionamento.

    response = client.responses.create( model="xai.grok-4.3", reasoning={"effort": "high"}, include=["reasoning.encrypted_content"], input="Explain quantum entanglement simply." ) print(response.output_text)
  • Parametri predefiniti: Grok 4.3 utilizza valori predefiniti che differiscono dalle specifiche standard dell'API OpenAI: i valori predefiniti sono 0.7 (non1), temperature i valori predefiniti sono (non) e i top_p valori predefiniti sono. 0.95 1 max_completion_tokens 131072 Modifica questi valori in modo esplicito se l'applicazione richiede un comportamento diverso.