本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
Grok 4.3
xAI — Grok 4.3
模型詳細資訊
Grok 4.3 是推理第一模型,提供永遠開啟且可設定的推理工作 (無、低、中、高)。由於推理一律處於作用中而非選用狀態,因此其跨多步驟代理程式迴圈的行為比可略過思考的模型更一致。它還提供強大的工具使用和指示遵循功能,用於建置多步驟代理程式,以及字符效率,以協助保持高容量推論的成本效益。Grok 4.3 特別適合合約審查、案例法研究、信用協議分析和財務文件問答等企業工作負載,同時跨對話式 AI、搜尋、聊天和多迴轉工作流程提供一致、高品質的結果。Grok 4.3 在 Mantle 上執行,這是 Amazon Bedrock 中專為價格效能而設計的新推論引擎,支援工具呼叫、結構化輸出和回應串流。
模型啟動日期:2026 年 6 月 15 日
模型 EOL 日期:不適用
最終使用者授權合約和使用條款:檢視
模型生命週期:作用中
內容視窗:1M 字符
原因:支援 (可設定:低、中、高)
注意
此模型可在bedrock-mantle端點的 openai/v1/responses 路徑上使用。這與回應端點上其他模型使用的v1/responses路徑不同。
功能和功能
Bedrock 功能
使用bedrock-mantle端點支援的功能
定價
如需定價,請參閱 Amazon Bedrock 定價
程式設計存取
使用以下模型 IDs和端點 URLs以程式設計方式存取此模型。如需可用 APIs和端點的詳細資訊,請參閱支援的 APIs和支援的端點。
| 端點 | 模型 ID | 區域端點 URL | 地理推論 ID | 全域推論 ID |
|---|---|---|---|---|
bedrock-mantle |
xai.grok-4.3 |
https://bedrock-mantle.{region}.api.aws/openai/v1 |
不支援 | 不支援 |
例如,如果 region 是 us-west-2 (奧勒岡),則 bedrock-mantle 端點 URL 將為 "https://bedrock-mantle.us-west-2.api.aws/openai/v1"。
服務層
Amazon Bedrock 提供多個服務層,以符合您的工作負載需求。Standard 提供pay-per-token存取。優先順序透過以時間為基礎的承諾提供更高的輸送量。Flex 為彈性、non-time-sensitive的工作負載提供低成本存取。預留提供專用輸送量,並承諾可預測工作負載的期限。如需詳細資訊,請參閱 服務方案。
| 標準 | 優先順序 | Flex | 預留 |
|---|---|---|---|
區域可用性
區域可用性一目了然
Bedrock 提供三種推論選項:為嚴格合規,區域內將請求保留在單一 區域內,地理位置 (美國、歐洲等) 內區域間的地理跨區域路由可提高輸送量,同時遵守資料駐留,而全球跨區域路由則可在無駐留限制的情況下,在全球任何地方提供最大輸送量。如需詳細資訊,請參閱 依模型的區域可用性頁面。
| 區域 | 區域內 | 地理 | 全域 |
|---|---|---|---|
us-west-2 (奧勒岡) | |||
us-east-1 (維吉尼亞北部) | |||
us-east-2 (俄亥俄) |
配額和限制
您的 AWS 帳戶具有預設配額,可維持服務的效能,並確保適當使用 Amazon Bedrock。指派給帳戶的預設配額可能會根據區域因素、付款歷史記錄、詐騙使用量和/或配額增加請求的核准而更新。如需詳細資訊,請參閱 Amazon Bedrock 的配額 文件並查看模型的限制。
在bedrock-mantle端點上消耗隨需輸送量時,可用的輸送量會隨著時間而擴展。並非所有配額內的請求都保證在高需求期間成功,因此逐步漸進很重要。對於此模型,預設限制不會直接透過 Service Quotas 顯示,因此我們建議您遵循漸進測試作為指南。
範例程式碼
步驟 1 - AWS 帳戶:如果您已經有 AWS 帳戶,請略過此步驟。如果您是初次使用 AWS,請註冊 AWS 帳戶
步驟 2 - API 金鑰:前往 Amazon Bedrock 主控台
步驟 3 - 取得 SDK:若要使用此入門指南,您必須已安裝 Python。然後,根據您使用的 APIs相關軟體。
步驟 4 - 設定環境變數:設定您的環境以使用 API 金鑰進行身分驗證。
步驟 5 - 執行您的第一個推論請求:將檔案儲存為 bedrock-first-request.py
用量考量和限制
原因工作 — 預設情況下,原因一律處於作用中狀態。您可以透過
reasoning參數設定工作:{"effort": "none"}(停用推理)、"low"(預設)"medium"、 或"high"。原因內容已加密,並可透過傳入include: ["reasoning.encrypted_content"]回應 API 請求傳回。您可以後續輪流傳送加密的內容,以提供多轉對話的推理內容。聊天完成 API 不會傳回推理權杖。response = client.responses.create( model="xai.grok-4.3", reasoning={"effort": "high"}, include=["reasoning.encrypted_content"], input="Explain quantum entanglement simply." ) print(response.output_text)預設參數 — Grok 4.3 使用與標準 OpenAI API 規格不同的預設值:
temperature預設為0.7(而非1)、top_p預設為0.95(而非1),以及max_completion_tokens預設為131072。如果您的應用程式需要不同的行為,請明確調整這些值。