Qwen3 Coder 480B A35B Instruktor - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Qwen3 Coder 480B A35B Instruktor

Qwen — Qwen3 Coder 480B A35B Einweisen

Modelldetails

Qwen3 Coder 480B A35B ist das größte auf Codierung spezialisierte Modell von Qwen mit insgesamt 480 B und 35 B aktiven Parametern für Softwareentwicklungsaufgaben. mixture-of-experts Weitere Informationen zur Modellentwicklung und Leistung finden Sie auf der Modell-/Servicekarte.

  • Datum der Markteinführung des Modells: 23. Juli 2025

  • EOL-Datum des Modells: N/A

  • Endbenutzer-Lizenzverträge und Nutzungsbedingungen: Ansicht

  • Modelllebenszyklus: Aktiv

  • Kontextfenster: 128.000 Token

  • Max. Ausgabetokens: 16K

Eingabemodalitäten Ausgabemodalitäten APIs unterstützt Unterstützte Endpunkte
NoAudioNoEinbettenNo ResponsesYes bedrock-runtime
NoBildNoBildYes Chat CompletionsYes bedrock-mantle
NoRedeNoRedeYes Invoke
YesTextYesTextYes Converse
No-VideoNo-Video
Anmerkung

Wann immer möglich, empfehlen wir Ihnen, den bedrock-mantle Endpunkt zu verwenden.

Fähigkeiten und Funktionen

Eigenschaften von Bedrock

Funktionen, die mithilfe bedrock-mantle von Endpoint unterstützt werden

Wird unterstützt Wird nicht unterstützt

Funktionen, die mithilfe bedrock-runtime von Endpoint unterstützt werden

Preisgestaltung

Die Preise finden Sie auf der Seite mit den Preisen von Amazon Bedrock.

Programmatischer Zugriff

Verwenden Sie das folgende Modell IDs und den folgenden Endpunkt URLs , um programmgesteuert auf dieses Modell zuzugreifen. Weitere Informationen zu den verfügbaren Endpunkten APIs und Endpunkten finden Sie unter APIs Unterstützte Endgeräte und Unterstützte Endgeräte.

Endpunkt Modell-ID Endpunkt-URL in der Region Geoinferenz-ID Globale Inferenz-ID
bedrock-runtime qwen.qwen3-coder-480b-a35b-v1:0 https://bedrock-runtime.{region}.amazonaws.com Nicht unterstützt Nicht unterstützt
bedrock-mantle qwen.qwen3-coder-480b-a35b-instruct https://bedrock-mantle.{region}.api.aws/v1 Nicht unterstützt Nicht unterstützt

Wenn Region beispielsweise us-east-1 (Nord-Virginia) ist, dann lautet die URL des Bedrock-Runtime-Endpunkts "" und für Bedrock-Mantle https://bedrock-runtime.us-east-1.amazonaws.com "https://bedrock-mantle.us-east-1.api.aws/v1“.

Dienststufen

Amazon Bedrock bietet mehrere Servicestufen, um Ihren Workload-Anforderungen gerecht zu werden. Standard bietet pay-per-token unverbindlichen Zugriff. Priority bietet einen höheren Durchsatz mit einer zeitbasierten Verpflichtung. Flex bietet kostengünstigeren Zugriff für flexible Workloads. non-time-sensitive Reserved bietet einen dedizierten Durchsatz mit einer Laufzeit für vorhersehbare Workloads. Weitere Informationen finden Sie unter Servicestufen.

Standard Priorität Flex Reserviert
Yes Yes Yes No

Regionale Verfügbarkeit

Die regionale Verfügbarkeit auf einen Blick

Bedrock bietet drei Inferenzoptionen: Innerhalb der Region werden Anfragen innerhalb einer einzigen Region aufbewahrt, um die strikte Einhaltung der Vorschriften zu gewährleisten, regionsübergreifende geografische Routen zwischen Regionen innerhalb einer Region (USA, EU usw.) für einen höheren Durchsatz bei gleichzeitiger Wahrung der Datenresidenz und globale, regionsübergreifende Routen überall auf der Welt für maximalen Durchsatz, wenn es keine Aufenthaltsbeschränkungen gibt. Weitere Informationen finden Sie auf der Seite. Regionale Verfügbarkeit

Region In der Region Geo Global
us-east-2(Ohio)YesNoNo
us-west-2(Oregon)YesNoNo
eu-north-1(Stockholm)YesNoNo
eu-west-2(Londres)YesNoNo
ap-northeast-1(Tokio)YesNoNo
ap-south-1(Mumbai)YesNoNo
ap-southeast-2(Sydney)YesNoNo
ap-southeast-3(Jakarta)YesNoNo

Kontingente und Einschränkungen

Ihr AWS-Konto verfügt über Standardkontingente, um die Leistung des Service aufrechtzuerhalten und eine angemessene Nutzung von Amazon Bedrock sicherzustellen. Die einem Konto zugewiesenen Standardkontingente können je nach regionalen Faktoren, Zahlungsverlauf, betrügerischer Nutzung und and/or Genehmigung einer Anfrage zur Erhöhung des Kontingents aktualisiert werden. Weitere Informationen finden Sie in der Kontingente für Amazon Bedrock Dokumentation und in den Grenzwerten für das Modell.

Beispiel-Code

Schritt 1 — AWS-Konto: Wenn Sie bereits ein AWS-Konto haben, überspringen Sie diesen Schritt. Wenn Sie neu bei AWS sind, registrieren Sie sich für ein AWS-Konto.

Schritt 2 — API-Schlüssel: Rufen Sie die Amazon Bedrock-Konsole auf und generieren Sie einen langfristigen API-Schlüssel.

Schritt 3 — Holen Sie sich das SDK: Um dieses Handbuch für die ersten Schritte verwenden zu können, muss Python bereits installiert sein. Installieren Sie dann die entsprechende Software, je nachdem, welche APIs Sie verwenden.

Responses/Chat Completions API
pip install boto3 openai
Invoke/Converse API
pip install boto3

Schritt 4 — Umgebungsvariablen festlegen: Konfigurieren Sie Ihre Umgebung so, dass sie den API-Schlüssel für die Authentifizierung verwendet.

Responses/Chat Completions API
OPENAI_API_KEY="<provide your Bedrock API key>" OPENAI_BASE_URL="https://bedrock-mantle.<your-region>.api.aws/v1"
Invoke/Converse API
AWS_BEARER_TOKEN_BEDROCK="<provide your Bedrock API key>"

Schritt 5 — Führen Sie Ihre erste Inferenzanfrage aus: Speichern Sie die Datei unter bedrock-first-request.py

Responses API
from openai import OpenAI client = OpenAI() response = client.responses.create( model="qwen.qwen3-coder-480b-a35b-instruct", input="Can you explain the features of Amazon Bedrock?" ) print(response)
Chat Completions API
from openai import OpenAI client = OpenAI() response = client.chat.completions.create( model="qwen.qwen3-coder-480b-a35b-instruct", messages=[{"role": "user", "content": "Can you explain the features of Amazon Bedrock?"}] ) print(response)
Invoke API
import json import boto3 client = boto3.client('bedrock-runtime', region_name='us-east-1') response = client.invoke_model( modelId='qwen.qwen3-coder-480b-a35b-v1:0', body=json.dumps({ 'messages': [{ 'role': 'user', 'content': 'Can you explain the features of Amazon Bedrock?'}], 'max_tokens': 1024 }) ) print(json.loads(response['body'].read()))
Converse API
import boto3 client = boto3.client('bedrock-runtime', region_name='us-east-1') response = client.converse( modelId='qwen.qwen3-coder-480b-a35b-v1:0', messages=[ { 'role': 'user', 'content': [{'text': 'Can you explain the features of Amazon Bedrock?'}] } ] ) print(response)