本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
Grok 4.3
xAi — Grok 4.3
模型详细信息
Grok 4.3 是一种推理优先模型,可提供始终在线且可配置的推理工作(无、低、中、高)。由于推理始终是活动的,而不是可选的,因此与可以跳过思考的模型相比,它在多步代理循环中的行为更加一致。它还为构建多步代理提供了强大的工具使用和指令跟踪功能,并提供了令牌效率,有助于保持大批量推理的成本效益。Grok 4.3 特别适合企业工作负载,例如合同审查、判例法研究、信用协议分析和财务文件问答,同时在对话式 AI、搜索、聊天和多回合工作流程中提供一致、高质量的结果。Grok 4.3 在 Mantle 上运行,Mantle 是 Amazon Bedrock 中的一款全新推理引擎,专为性价比而设计,支持工具调用、结构化输出和响应流。
模型发布日期:2026 年 6 月 15 日
型号停产日期: N/A
最终用户许可协议和使用条款:查看
模型生命周期:活跃
上下文窗口:100 万个代币
推理:支持(可配置:低、中、高)
注意
此模型可在bedrock-mantle端点上的openai/v1/responses路径上使用。这与其他模型在响应端点上使用的v1/responses路径不同。
功能和特点
基岩特征
使用bedrock-mantle端点支持的功能
| 支持的 | 不支持 |
|---|---|
|
— |
定价
有关定价,请参阅 Amazon Bedrock 定价
以编程方式访问
使用以下模型 ID 和端点 URL 以编程方式访问此模型。有关可用 API 和终端节点的更多信息,请参阅支持的 API 和支持的终端节点。
| Endpoint | 型号标识 | In-Region 端点网址 | 地理推理 ID | 全局推理 ID |
|---|---|---|---|---|
bedrock-mantle |
xai.grok-4.3 |
https://bedrock-mantle.{region}.api.aws/openai/v1 |
不支持 | 不支持 |
例如,如果区域是 us-west-2(俄勒冈州),则基岩地幔端点 URL 将是 “”。https://bedrock-mantle.us-west-2.api.aws/openai/v1
服务等级
Amazon Bedrock 提供多个服务等级,以满足您的工作负载要求。标准版提供按令牌付费的访问权限,无需任何承诺。P@@ ri ority 通过基于时间的承诺提供更高的吞吐量。Flex 为灵活、非时间敏感型工作负载提供更低成本的访问权限。Reserved 为可预测的工作负载提供@@ 专用吞吐量和定期承诺。有关更多信息,请参阅服务等级。
| Standard | 优先级 | Flex | 已保留 |
|---|---|---|---|
区域可用性
地区供应情况一览
Bedrock 提供三种推断选项:In-Region将请求保留在单个区域内以实现严格合规;在尊重数据驻留的情况下跨地理区域(美国、欧盟等)进行地理 Cross-Region路由,以提高吞吐量;以及全球任何地方的全球 Cross-Region路由,以便在没有驻留限制的情况下实现最大吞吐量。有关更多详细信息,请参阅该各型号的地区供货情况页面。
| 区域 | In-Region | Geo | Global |
|---|---|---|---|
us-west-2(俄勒冈州) | |||
us-east-1(弗吉尼亚北部) | |||
us-east-2(俄亥俄州) |
配额和限制
您的 AWS 账户具有默认配额,用于维持服务性能并确保适当使用 Amazon Bedrock。分配给账户的默认配额可能会根据地区因素、付款历史记录、欺诈性使用情况、增加配额请求的 and/or 批准而更新。有关更多详细信息,请参阅Amazon Bedrock 的配额文档并查看该模型的限制。
在bedrock-mantle终端上使用按需吞吐量时,可用吞吐量会随着时间的推移而扩展。在需求旺盛时期,并非所有在配额内的请求都能保证成功,因此逐步增加请求非常重要。对于此模型,默认限制不会直接通过 Service Quotas 浮出水面,因此我们建议您以此为指导。
示例代码
第 1 步-AWS 账户:如果您已有 AWS 账户,请跳过此步骤。如果您不熟悉 AWS,请注册一个 A WS 账户
第 2 步-API 密钥:前往 Amazon Bedrock 控制台
第 3 步-获取 SDK:要使用本入门指南,必须已安装 Python。然后根据您使用的 API 安装相关软件。
第 4 步-设置环境变量:将您的环境配置为使用 API 密钥进行身份验证。
第 5 步-运行您的第一个推理请求:将文件另存为 bedrock-first-request.py
使用注意事项和限制
推理工作-默认情况下,推理始终处于活动状态。您可以通过
reasoning参数配置工作量:{"effort": "none"}(禁用推理)、"low"(默认)或"high"。"medium"推理内容经过加密,可以通过传入 Responsinclude: ["reasoning.encrypted_content"]es API 请求来返回。你可以在后续回合中将加密的内容发送回去,为多回合对话提供推理背景。聊天完成 API 不返回推理标记。response = client.responses.create( model="xai.grok-4.3", reasoning={"effort": "high"}, include=["reasoning.encrypted_content"], input="Explain quantum entanglement simply." ) print(response.output_text)默认参数 — Grok 4.3 使用的默认值与标准 OpenAI API 规范不同
temperature:默认为(不是),默认为0.7(1不是)top_p,默认为0.95(1不是)max_completion_tokens,默认为。131072如果您的应用程序需要不同的行为,请明确调整这些值。