显示 xAi 徽标的图标。 xAi — Grok 4.3 模型详细信息功能和特点定价以编程方式访问服务等级区域可用性配额和限制示例代码使用注意事项和限制

Grok 4.3

xAi — Grok 4.3

模型详细信息

Grok 4.3 是一种推理优先模型，可提供始终在线且可配置的推理工作（无、低、中、高）。由于推理始终是活动的，而不是可选的，因此与可以跳过思考的模型相比，它在多步代理循环中的行为更加一致。它还为构建多步代理提供了强大的工具使用和指令跟踪功能，并提供了令牌效率，有助于保持大批量推理的成本效益。Grok 4.3 特别适合企业工作负载，例如合同审查、判例法研究、信用协议分析和财务文件问答，同时在对话式 AI、搜索、聊天和多回合工作流程中提供一致、高质量的结果。Grok 4.3 在 Mantle 上运行，Mantle 是 Amazon Bedrock 中的一款全新推理引擎，专为性价比而设计，支持工具调用、结构化输出和响应流。

模型发布日期：2026 年 6 月 15 日
型号停产日期： N/A
最终用户许可协议和使用条款：查看
模型生命周期：活跃
上下文窗口：100 万个代币
推理：支持（可配置：低、中、高）

输入模式	输出模式	支持的 API	支持的终端节点
音频	嵌入	`Chat Completions`	`bedrock-runtime`
图片	图片	`Responses`	`bedrock-mantle`
演讲	演讲	`Invoke`
文本	文本	`Converse`
视频	视频

注意

此模型可在bedrock-mantle端点上的openai/v1/responses路径上使用。这与其他模型在响应端点上使用的v1/responses路径不同。

功能和特点

基岩特征

使用bedrock-mantle端点支持的功能

支持的	不支持
Client-side 工具调用推理项目滥用检测响应直播结构化输出	—

定价

有关定价，请参阅 Amazon Bedrock 定价页面。

以编程方式访问

使用以下模型 ID 和端点 URL 以编程方式访问此模型。有关可用 API 和终端节点的更多信息，请参阅支持的 API 和支持的终端节点。

Endpoint	型号标识	In-Region 端点网址	地理推理 ID	全局推理 ID
`bedrock-mantle`	`xai.grok-4.3`	`https://bedrock-mantle.{region}.api.aws/openai/v1`	不支持	不支持

例如，如果区域是 us-west-2（俄勒冈州），则基岩地幔端点 URL 将是 “”。https://bedrock-mantle.us-west-2.api.aws/openai/v1

服务等级

Amazon Bedrock 提供多个服务等级，以满足您的工作负载要求。标准版提供按令牌付费的访问权限，无需任何承诺。P@@ ri ority 通过基于时间的承诺提供更高的吞吐量。Flex 为灵活、非时间敏感型工作负载提供更低成本的访问权限。Reserved 为可预测的工作负载提供@@ 专用吞吐量和定期承诺。有关更多信息，请参阅服务等级。

Standard	优先级	Flex	已保留

区域可用性

地区供应情况一览

Bedrock 提供三种推断选项：In-Region将请求保留在单个区域内以实现严格合规；在尊重数据驻留的情况下跨地理区域（美国、欧盟等）进行地理 Cross-Region路由，以提高吞吐量；以及全球任何地方的全球 Cross-Region路由，以便在没有驻留限制的情况下实现最大吞吐量。有关更多详细信息，请参阅该各型号的地区供货情况页面。

区域	In-Region	Geo	Global
`us-west-2`（俄勒冈州）
`us-east-1`（弗吉尼亚北部）
`us-east-2`（俄亥俄州）

配额和限制

您的 AWS 账户具有默认配额，用于维持服务性能并确保适当使用 Amazon Bedrock。分配给账户的默认配额可能会根据地区因素、付款历史记录、欺诈性使用情况、增加配额请求的 and/or 批准而更新。有关更多详细信息，请参阅Amazon Bedrock 的配额文档并查看该模型的限制。

在bedrock-mantle终端上使用按需吞吐量时，可用吞吐量会随着时间的推移而扩展。在需求旺盛时期，并非所有在配额内的请求都能保证成功，因此逐步增加请求非常重要。对于此模型，默认限制不会直接通过 Service Quotas 浮出水面，因此我们建议您以此为指导。

示例代码

第 1 步-AWS 账户：如果您已有 AWS 账户，请跳过此步骤。如果您不熟悉 AWS，请注册一个 A WS 账户。

第 2 步-API 密钥：前往 Amazon Bedrock 控制台生成长期 API 密钥。

第 3 步-获取 SDK：要使用本入门指南，必须已安装 Python。然后根据您使用的 API 安装相关软件。

第 4 步-设置环境变量：将您的环境配置为使用 API 密钥进行身份验证。

第 5 步-运行您的第一个推理请求：将文件另存为 bedrock-first-request.py

使用注意事项和限制

推理工作-默认情况下，推理始终处于活动状态。您可以通过reasoning参数配置工作量：{"effort": "none"}（禁用推理）、"low"（默认）或"high"。"medium"推理内容经过加密，可以通过传入 Respons include: ["reasoning.encrypted_content"] es API 请求来返回。你可以在后续回合中将加密的内容发送回去，为多回合对话提供推理背景。聊天完成 API 不返回推理标记。
```
response = client.responses.create(
    model="xai.grok-4.3",
    reasoning={"effort": "high"},
    include=["reasoning.encrypted_content"],
    input="Explain quantum entanglement simply."
)
print(response.output_text)
```
默认参数 — Grok 4.3 使用的默认值与标准 OpenAI API 规范不同temperature：默认为（不是），默认为0.7（1不是）top_p，默认为0.95（1不是）max_completion_tokens，默认为。131072如果您的应用程序需要不同的行为，请明确调整这些值。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

文档惯例

xAi

Z.AI