Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Nova Micro
Amazon — Nova Micro
Modelldetails
Nova Micro ist das schnellste reine Textmodell von Amazon, das für Geschwindigkeit und geringe Kosten bei Aufgaben wie Zusammenfassung, Übersetzung und Klassifizierung optimiert wurde. Weitere Informationen zur Modellentwicklung und Leistung finden Sie auf der model/service Karte.
Datum der Markteinführung des Modells: 05. Dezember 2024
EOL-Datum des Modells: Frühestens /2025 12/4
Endbenutzer-Lizenzverträge und Nutzungsbedingungen: Ansicht
Modelllebenszyklus: Aktiv
Kontextfenster: 128.000 Token
Max. Ausgabetokens: 5.000
Knowledge-Frist: Oktober 2024
| Eingabemodalitäten | Ausgabemodalitäten | Unterstützte APIs | Unterstützte Endpunkte |
|---|---|---|---|
Responses | bedrock-runtime | ||
Chat Completions | bedrock-mantle | ||
Invoke | |||
Converse | |||
Fähigkeiten und Funktionen
Eigenschaften von Bedrock
Funktionen, die mithilfe bedrock-runtime von Endpoint unterstützt werden
| Wird unterstützt | Nicht unterstützt |
|---|---|
Sofortiges Caching mithilfe des Endpunkts bedrock-runtime
Weitere Informationen finden Sie unter Prompt-Caching für schnellere Modellinferenz.
| Promptes Caching wird unterstützt | Mindestanzahl an Tokens pro Cache-Checkpoint | Max. Cache-Checkpoints pro Anfrage | TTL wird unterstützt | Felder, die Prompt-Cache-Checkpoints akzeptieren |
|---|---|---|---|---|
| Ja | 1K* | 4 | 5 Minuten | system und messages |
* Amazon Nova-Modelle unterstützen maximal 20.000 Token für schnelles Caching.
Preisgestaltung
Die Preise finden Sie auf der Seite mit den Preisen von Amazon Bedrock
Programmatischer Zugriff
Verwenden Sie die folgenden Modell-IDs und Endpunkt-URLs, um programmgesteuert auf dieses Modell zuzugreifen. Weitere Informationen zu den verfügbaren APIs und Endpunkten finden Sie unter Unterstützte APIs und Unterstützte Endpunkte.
| Endpunkt | Modell-ID | In-Region Endpunkt-URL | Geoinferenz-ID | Globale Inferenz-ID |
|---|---|---|---|---|
bedrock-runtime |
amazon.nova-micro-v1:0 |
https://bedrock-runtime.{region}.amazonaws.com |
|
Nicht unterstützt |
Wenn Region beispielsweise us-east-1 (Nord-Virginia) ist, dann lautet die URL des Bedrock-Runtime-Endpunkts "" und für Bedrock-Mantle https://bedrock-runtime.us-east-1.amazonaws.com "“. https://bedrock-mantle.us-east-1.api.aws/v1
Dienststufen
Amazon Bedrock bietet mehrere Servicestufen, um Ihren Workload-Anforderungen gerecht zu werden. Standard bietet unverbindlichen Pay-per-Token-Zugriff. Priority bietet einen höheren Durchsatz mit einer zeitbasierten Verpflichtung. Flex bietet kostengünstigeren Zugriff für flexible, nicht zeitkritische Workloads. Reserved bietet einen dedizierten Durchsatz mit einer festen Laufzeit für vorhersehbare Workloads. Weitere Informationen finden Sie unter Servicestufen.
| Standard | Priorität | Flex | Reserviert |
|---|---|---|---|
Regionale Verfügbarkeit
Die regionale Verfügbarkeit auf einen Blick
Bedrock bietet drei Inferenzoptionen: In-Regiondie Erfassung von Anfragen innerhalb einer einzigen Region, um die strikte Einhaltung der Vorschriften zu gewährleisten, geografische Cross-Region Routen zwischen Regionen innerhalb einer Region (USA, EU usw.) für einen höheren Durchsatz bei gleichzeitiger Wahrung der Datenresidenz und globale Cross-Region Routen überall auf der Welt für maximalen Durchsatz, wenn es keine lokalen Beschränkungen gibt. Weitere Informationen finden Sie auf der Regionale Verfügbarkeit Seite.
| Region | In-Region | Geo | Global |
|---|---|---|---|
us-east-1(Nord-Virginia) | |||
us-east-2(Ohio) | |||
us-west-2(Oregon) | |||
us-gov-west-1 (GovCloud) | |||
eu-central-1(Frankfurt) | |||
eu-north-1(Stockholm) | |||
eu-south-1(Mailand) | |||
eu-south-2(Spanien) | |||
eu-west-1(Irland) | |||
eu-west-2(London) | |||
eu-west-3(Paris) | |||
ap-southeast-2(Sydney) | |||
il-central-1(Tel Aviv) |
Einzelheiten zur Geoinferenz
Geo: USA
Geo-Inferenz-ID: us.amazon.nova-micro-v1:0
| Quellregion | Zielregionen |
|---|---|
| us-east-1 (N. Virginia) | us-east-1 (Nord-Virginia), us-east-2 (Ohio), US-West-2 (Oregon) |
| us-east-2 (Ohio) | us-east-1 (Nord-Virginia), us-east-2 (Ohio), US-West-2 (Oregon) |
| us-west-2 (Oregon) | us-east-1 (Nord-Virginia), us-east-2 (Ohio), US-West-2 (Oregon) |
Geo: EU
Geo-Inferenz-ID: eu.amazon.nova-micro-v1:0
| Quellregion | Zielregionen |
|---|---|
| eu-central-1 (Frankfurt) | eu-central-1 (Frankfurt), eu-north-1 (Stockholm), eu-west-1 (Irland), eu-west-3 (Paris) |
| eu-nord-1 (Stockholm) | eu-central-1 (Frankfurt), eu-north-1 (Stockholm), eu-west-1 (Irland), eu-west-3 (Paris) |
| eu-south-1 (Mailand) | eu-central-1 (Frankfurt), eu-north-1 (Stockholm), eu-south-1 (Mailand), eu-west-1 (Irland), eu-west-3 (Paris) |
| eu-south-2 (Spanien) | eu-central-1 (Frankfurt), eu-north-1 (Stockholm), eu-south-2 (Spanien), eu-west-1 (Irland), eu-west-3 (Paris) |
| eu-west-1 (Ireland) | eu-central-1 (Frankfurt), eu-north-1 (Stockholm), eu-west-1 (Irland), eu-west-3 (Paris) |
| eu-west-3 (Paris) | eu-central-1 (Frankfurt), eu-north-1 (Stockholm), eu-west-1 (Irland), eu-west-3 (Paris) |
| il-central-1 (Tel Aviv) | eu-central-1 (Frankfurt), eu-nord-1 (Stockholm), eu-south-1 (Mailand), eu-west-1 (Irland), eu-west-3 (Paris), il-central-1 (Tel Aviv) |
Kontingente und Einschränkungen
Ihr AWS-Konto verfügt über Standardkontingente, um die Leistung des Service aufrechtzuerhalten und eine angemessene Nutzung von Amazon Bedrock sicherzustellen. Die einem Konto zugewiesenen Standardkontingente können je nach regionalen Faktoren, Zahlungsverlauf, betrügerischer Nutzung und and/or Genehmigung einer Anfrage zur Erhöhung des Kontingents aktualisiert werden. Weitere Informationen finden Sie in der Kontingente für Amazon Bedrock Dokumentation und in den Grenzwerten für das Modell.
Beispiel-Code
Schritt 1 — AWS-Konto: Wenn Sie bereits ein AWS-Konto haben, überspringen Sie diesen Schritt. Wenn Sie neu bei AWS sind, registrieren Sie sich für ein AWS-Konto
Schritt 2 — API-Schlüssel: Rufen Sie die Amazon Bedrock-Konsole
Schritt 3 — Holen Sie sich das SDK: Um dieses Handbuch für die ersten Schritte verwenden zu können, muss Python bereits installiert sein. Installieren Sie dann die entsprechende Software, je nachdem, welche APIs Sie verwenden.
pip install boto3
Schritt 4 — Umgebungsvariablen festlegen: Konfigurieren Sie Ihre Umgebung so, dass der API-Schlüssel für die Authentifizierung verwendet wird.
AWS_BEARER_TOKEN_BEDROCK="<provide your Bedrock API key>"
Schritt 5 — Führen Sie Ihre erste Inferenzanfrage aus: Speichern Sie die Datei unter bedrock-first-request.py
Das vollständige Anfrage- und Antwortschema, einschließlich aller unterstützten Parameter wie system Eingabeaufforderungen,temperature, und topP stopSequencestoolConfig, finden Sie unter Vollständiges Anforderungsschema im Amazon Nova-Benutzerhandbuch.