Qwen3 VL 235B A2B - Amazon Bedrock

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Qwen3 VL 235B A2B

Qwen — Qwen3 VL 235B A22B

模型详细信息

Qwen3 VL 235B A22B 是 Qwen 的视觉语言 mixture-of-experts模型,它处理文本和图像以实现视觉推理和文档理解。有关模型开发和性能的更多信息,请参阅模型/服务卡片。

  • 车型发布日期:2025年9月23日

  • 型号停产日期:N/ A

  • 最终用户许可协议和使用条款:查看

  • 模型生命周期:活跃

  • 上下文窗口:12.8 万个代币

  • 最大输出代币:8K

输入模式 输出模式 APIs 支持的 支持的终端节点
No音频No嵌入No ResponsesYes bedrock-runtime
Yes图片No图片Yes Chat CompletionsYes bedrock-mantle
No演讲No演讲Yes Invoke
Yes文本Yes文本Yes Converse
No视频No视频
注意

我们建议您尽可能使用bedrock-mantle终端节点。

功能和特点

基岩特征

使用bedrock-mantle端点支持的功能

使用bedrock-runtime端点支持的功能

定价

有关定价,请参阅 Amazon Bedrock 定价页面。

以编程方式访问

使用以下模型 IDs 和端点 URLs 以编程方式访问此模型。有关可用 APIs 和终端节点的更多信息,请参阅APIs 支持的和支持的终端节点

Endpoint 型号标识 区域内终端节点 URL 地理推理 ID 全局推理 ID
bedrock-runtime qwen.qwen3-vl-235b-a22b https://bedrock-runtime.{region}.amazonaws.com 不支持 不支持
bedrock-mantle qwen.qwen3-vl-235b-a22b-instruct https://bedrock-mantle.{region}.api.aws/v1 不支持 不支持

例如,如果区域为 us-east-1(弗吉尼亚北部),则基岩运行时端点 URL 将为 “”,基岩地幔的终端节点 URL 将https://bedrock-runtime.us-east-1.amazonaws.com为” https://bedrock-mantle.us-east-1.api.aws/v1 “。

服务等级

Amazon Bedrock 提供多个服务等级,以满足您的工作负载要求。标准版提供 pay-per-token访问权限,无需任何承诺。P@@ ri ority 通过基于时间的承诺提供更高的吞吐量。Flex 为灵活 non-time-sensitive的工作负载提供更低成本的访问权限。Reserved 为可预测的工作负载提供@@ 专用吞吐量和定期承诺。有关更多信息,请参阅服务等级

Standard 优先级 Flex 已保留
Yes Yes Yes No

区域可用性

地区供应情况一览

Bedrock 提供三种推理选项:区域内将请求保留在单个区域内以严格合规;跨地理区域(美国、欧盟等)进行跨区域路由以提高吞吐量,同时尊重数据驻留;全球跨区域路由,以便在没有居住限制的情况下实现最大吞吐量。有关更多详细信息,请参阅该区域可用性页面。

区域 区域内 Geo Global
us-east-1(弗吉尼亚北部)YesNoNo
us-east-2(俄亥俄州)YesNoNo
us-west-2(俄勒冈州)YesNoNo
eu-south-1(米兰)YesNoNo
eu-west-1(爱尔兰)YesNoNo
eu-west-2(伦敦)YesNoNo
ap-northeast-1(东京)YesNoNo
ap-south-1(孟买)YesNoNo
ap-southeast-2(悉尼)YesNoNo
sa-east-1(圣保罗)YesNoNo

配额和限制

您的 AWS 账户具有默认配额,用于维持服务性能并确保适当使用 Amazon Bedrock。分配给账户的默认配额可能会根据地区因素、付款历史记录、欺诈性使用情况、增加配额请求的 and/or 批准而更新。有关更多详细信息,请参阅Amazon Bedrock 的配额文档并查看该模型的限制

示例代码

第 1 步-AWS 账户:如果您已有 AWS 账户,请跳过此步骤。如果您不熟悉 AWS,请注册一个 A WS 账户

第 2 步-API 密钥:前往 Amazon Bedrock 控制台生成长期 API 密钥。

第 3 步-获取 SDK:要使用本入门指南,必须已安装 Python。然后根据 APIs 您使用的软件安装相关软件。

Responses/Chat Completions API
pip install boto3 openai
Invoke/Converse API
pip install boto3

第 4 步-设置环境变量:将您的环境配置为使用 API 密钥进行身份验证。

Responses/Chat Completions API
OPENAI_API_KEY="<provide your Bedrock API key>" OPENAI_BASE_URL="https://bedrock-mantle.<your-region>.api.aws/v1"
Invoke/Converse API
AWS_BEARER_TOKEN_BEDROCK="<provide your Bedrock API key>"

第 5 步-运行您的第一个推理请求:将文件另存为 bedrock-first-request.py

Responses API
from openai import OpenAI client = OpenAI() response = client.responses.create( model="qwen.qwen3-vl-235b-a22b-instruct", input="Can you explain the features of Amazon Bedrock?" ) print(response)
Chat Completions API
from openai import OpenAI client = OpenAI() response = client.chat.completions.create( model="qwen.qwen3-vl-235b-a22b-instruct", messages=[{"role": "user", "content": "Can you explain the features of Amazon Bedrock?"}] ) print(response)
Invoke API
import json import boto3 client = boto3.client('bedrock-runtime', region_name='us-east-1') response = client.invoke_model( modelId='qwen.qwen3-vl-235b-a22b', body=json.dumps({ 'messages': [{ 'role': 'user', 'content': 'Can you explain the features of Amazon Bedrock?'}], 'max_tokens': 1024 }) ) print(json.loads(response['body'].read()))
Converse API
import boto3 client = boto3.client('bedrock-runtime', region_name='us-east-1') response = client.converse( modelId='qwen.qwen3-vl-235b-a22b', messages=[ { 'role': 'user', 'content': [{'text': 'Can you explain the features of Amazon Bedrock?'}] } ] ) print(response)