NVIDIA — NVIDIA Nemotron 3 Super 120 B Modelldetails Fähigkeiten und Funktionen Preisgestaltung Programmatischer Zugriff Dienststufen Regionale Verfügbarkeit Kontingente und Einschränkungen Beispiel-Code

NVIDIA Nemotron 3 Super 120 B

NVIDIA — NVIDIA Nemotron 3 Super 120 B

Modelldetails

NVIDIA Nemotron 3 Super ist ein 120 B-parameter offenes Hybrid-MoE-Modell, das nur 12 B-Parameter aktiviert, um maximale Recheneffizienz und Genauigkeit in komplexen Multi-Agent-Anwendungen zu erzielen. Es bietet einen bis zu 7-mal höheren Durchsatz und ermöglicht schnelle, kosteneffiziente Inferenz für behördliche Aufgaben. Ein langes Kontextfenster bietet dem Modell ein Langzeitgedächtnis, wodurch verhindert wird, dass KI-Agenten den Fokus auf lange, mehrstufige Aufgaben verlieren, und gewährleistet hochgenaue Ergebnisse. Es ist vollständig mit Gewichten, Datensätzen und Rezepten geöffnet und ermöglicht eine einfache Anpassung und sichere Bereitstellung. Weitere Informationen zur Modellentwicklung und Leistung finden Sie auf der model/service Karte.

Datum der Markteinführung des Modells: 11. März 2026
EOL-Datum des Modells: N/A
Endbenutzer-Lizenzvereinbarungen und Nutzungsbedingungen: Ansicht
Modelllebenszyklus: Aktiv
Kontextfenster: 256.000 Token
Max. Ausgabetokens: 32 KB

Eingabemodalitäten	Ausgabemodalitäten	Unterstützte APIs	Unterstützte Endpunkte
Audio	Einbetten	`Responses`	`bedrock-runtime`
Bild	Bild	`Chat Completions`	`bedrock-mantle`
Rede	Rede	`Invoke`
Text	Text	`Converse`
-Video	-Video

Anmerkung

Wann immer möglich, empfehlen wir Ihnen, den bedrock-mantle Endpunkt zu verwenden.

Fähigkeiten und Funktionen

Eigenschaften von Bedrock

Funktionen, die mithilfe bedrock-mantle von Endpoint unterstützt werden

Unterstützt	Nicht unterstützt
Projekte Client-side Tools aufrufen	Server-side Tool aufrufen

Funktionen, die mithilfe von bedrock-runtime Endpoint unterstützt werden

Unterstützt	Nicht unterstützt
Streaming von Antworten Leitplanken Bewertung des Modells Schnelle Verwaltung Ströme Agenten Strukturierte Ergebnisse	Intelligentes Routing von Eing Erkennung von Missbrauch Sofortige Optimierung Zählen Sie Tokens Wissensbasis

Preisgestaltung

Die Preise finden Sie auf der Seite mit den Preisen von Amazon Bedrock.

Programmatischer Zugriff

Verwenden Sie die folgenden Modell-IDs und Endpunkt-URLs, um programmgesteuert auf dieses Modell zuzugreifen. Weitere Informationen zu den verfügbaren APIs und Endpunkten finden Sie unter Unterstützte APIs und Unterstützte Endpunkte.

Endpunkt	Modell-ID	In-Region Endpunkt-URL	Geoinferenz-ID	Globale Inferenz-ID
`bedrock-runtime`	`nvidia.nemotron-super-3-120b`	`https://bedrock-runtime.{region}.amazonaws.com`	`us-gov.nvidia.nemotron-super-3-120b`	Nicht unterstützt
`bedrock-mantle`	`nvidia.nemotron-super-3-120b`	`https://bedrock-mantle.{region}.api.aws/v1`	Nicht unterstützt	Nicht unterstützt

Wenn Region beispielsweise us-east-1 (Nord-Virginia) ist, dann lautet die URL des Bedrock-Runtime-Endpunkts "" und für Bedrock-Mantle https://bedrock-runtime.us-east-1.amazonaws.com "“. https://bedrock-mantle.us-east-1.api.aws/v1

Dienststufen

Amazon Bedrock bietet mehrere Servicestufen, um Ihren Workload-Anforderungen gerecht zu werden. Standard bietet unverbindlichen Pay-per-Token-Zugriff. Priority bietet einen höheren Durchsatz mit einer zeitbasierten Verpflichtung. Flex bietet kostengünstigeren Zugriff für flexible, nicht zeitkritische Workloads. Reserved bietet einen dedizierten Durchsatz mit einer festen Laufzeit für vorhersehbare Workloads. Weitere Informationen finden Sie unter Servicestufen.

Standard	Priorität	Flex	Reserviert

Regionale Verfügbarkeit

Die regionale Verfügbarkeit auf einen Blick

Bedrock bietet drei Inferenzoptionen: In-Regiondie Erfassung von Anfragen innerhalb einer einzigen Region, um die strikte Einhaltung der Vorschriften zu gewährleisten, geografische Cross-Region Routen zwischen Regionen innerhalb einer Region (USA, EU usw.) für einen höheren Durchsatz bei gleichzeitiger Wahrung der Datenresidenz und globale Cross-Region Routen überall auf der Welt für maximalen Durchsatz, wenn es keine lokalen Beschränkungen gibt. Weitere Informationen finden Sie auf der Regionale Verfügbarkeit Seite.

Region	In-Region	Geo	Global
`us-east-1`(Nord-Virginia)
`us-east-2`(Ohio)
`us-west-2`(Oregon)
`eu-south-1`(Mailand)
`eu-west-1`(Irland)
`eu-west-2`(London)
`ap-northeast-1`(Tokio)
`ap-south-1`(Mumbai)
`ap-southeast-2`(Sydney)
`sa-east-1`(Sao Paulo)
`ap-southeast-4`(Melbourne)
`us-gov-west-1` (GovCloud)

Einzelheiten zur Geo CRIS-Inferenz

US CRIS GovCloud

US GovCloud CRIS-Inferenz-ID: us-gov.nvidia.nemotron-super-3-120b

Quellregion	Zielregionen
us-gov-west-1 (Westen) GovCloud	us-gov-west-1 (West), us-gov-east-1 (Ost) GovCloud GovCloud
us-gov-east-1 (GovCloud Ost)	us-gov-west-1 (West), us-gov-east-1 (Ost) GovCloud GovCloud

Kontingente und Einschränkungen

Ihr AWS-Konto verfügt über Standardkontingente, um die Leistung des Service aufrechtzuerhalten und eine angemessene Nutzung von Amazon Bedrock sicherzustellen. Die einem Konto zugewiesenen Standardkontingente können je nach regionalen Faktoren, Zahlungsverlauf, betrügerischer Nutzung und and/or Genehmigung einer Anfrage zur Erhöhung des Kontingents aktualisiert werden. Weitere Informationen finden Sie in der Kontingente für Amazon Bedrock Dokumentation und in den Grenzwerten für das Modell.

Beispiel-Code

Schritt 1 — AWS-Konto: Wenn Sie bereits ein AWS-Konto haben, überspringen Sie diesen Schritt. Wenn Sie neu bei AWS sind, registrieren Sie sich für ein AWS-Konto.

Schritt 2 — API-Schlüssel: Rufen Sie die Amazon Bedrock-Konsole auf und generieren Sie einen langfristigen API-Schlüssel.

Schritt 3 — Holen Sie sich das SDK: Um dieses Handbuch für die ersten Schritte verwenden zu können, muss Python bereits installiert sein. Installieren Sie dann die entsprechende Software, je nachdem, welche APIs Sie verwenden.

Schritt 4 — Umgebungsvariablen festlegen: Konfigurieren Sie Ihre Umgebung so, dass der API-Schlüssel für die Authentifizierung verwendet wird.

Schritt 5 — Führen Sie Ihre erste Inferenzanfrage aus: Speichern Sie die Datei unter bedrock-first-request.py

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Nemotron Nano 3 30B

OpenAI