View a markdown version of this page

Nova Micro - Amazon Bedrock

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Nova Micro

Amazon — Nova Micro

Dettagli del modello

Nova Micro è il modello di solo testo più veloce di Amazon, ottimizzato per garantire velocità e costi contenuti in attività come riepilogo, traduzione e classificazione. Per ulteriori informazioni sullo sviluppo e sulle prestazioni del modello, consulta la scheda. model/service

  • Data di lancio del modello: 5 dicembre 2024

  • Data di scadenza del modello: non prima del /2025 12/4

  • Contratti di licenza con l'utente finale e condizioni d'uso: Visualizza

  • Ciclo di vita del modello: attivo

  • Finestra contestuale: 128K token

  • Token di output massimi: 5K

  • Limite delle conoscenze: ottobre 2024

Modalità di input Modalità di output API supportate Endpoint supportati
AudioIncorporamento Responses bedrock-runtime
ImmagineImmagine Chat Completions bedrock-mantle
DiscorsoDiscorso Invoke
TestoTesto Converse
VideoVideo

Funzionalità e caratteristiche

Caratteristiche Bedrock

Funzionalità supportate tramite endpoint bedrock-runtime

Memorizzazione rapida nella cache tramite endpoint bedrock-runtime

Per ulteriori informazioni, consulta Prompt caching per un'inferenza più rapida del modello.

Memorizzazione rapida nella cache supportata Numero minimo di token per checkpoint della cache Numero massimo di checkpoint della cache per richiesta TTL supportato Campi che accettano checkpoint di cache rapidi
1K* 4 5 minuti system e messages

* I modelli Amazon Nova supportano un massimo di 20.000 token per la memorizzazione rapida nella cache.

Prezzi

Per i prezzi, consulta la pagina dei prezzi di Amazon Bedrock.

Accesso programmatico

Utilizza i seguenti ID di modello e URL degli endpoint per accedere a questo modello a livello di codice. Per ulteriori informazioni sulle API e sugli endpoint disponibili, consulta API supportate e Endpoint supportati.

Endpoint ID del modello In-Region URL dell'endpoint ID di inferenza geografica ID di inferenza globale
bedrock-runtime amazon.nova-micro-v1:0 https://bedrock-runtime.{region}.amazonaws.com

us.amazon.nova-micro-v1:0

eu.amazon.nova-micro-v1:0

Non supportata

Ad esempio, se region è us-east-1 (Virginia settentrionale), l'URL dell'endpoint bedrock-runtime sarà "" e per bedrock-mantle sarà https://bedrock-runtime.us-east-1.amazonaws.com "». https://bedrock-mantle.us-east-1.api.aws/v1

Livelli di servizio

Amazon Bedrock offre diversi livelli di servizio per soddisfare i tuoi requisiti di carico di lavoro. Standard offre un accesso pay-per-token senza impegno. Priority offre un throughput più elevato con un impegno basato sul tempo. Flex offre un accesso a basso costo per carichi di lavoro flessibili e non urgenti. Reserved offre un throughput dedicato con un impegno a termine per carichi di lavoro prevedibili. Per ulteriori informazioni, consulta i livelli di servizio.

Standard Priorità Flex riservato

Disponibilità regionale

Disponibilità regionale a colpo d'occhio

Bedrock offre tre opzioni di inferenza: In-Regionmantiene le richieste all'interno di una singola regione per garantire la massima conformità, instradamenti Cross-Regiongeografici tra regioni all'interno di un'area geografica (Stati Uniti, UE, ecc.) per una maggiore velocità di trasmissione nel rispetto della residenza dei dati e Cross-Region percorsi globali ovunque in tutto il mondo per la massima velocità di trasmissione quando non ci sono vincoli di residenza. Consulta la pagina per maggiori dettagli. Disponibilità regionale

Region In-Region Geo Globale
us-east-1(Virginia settentrionale)
us-east-2(Ohio)
us-west-2(Oregon)
us-gov-west-1 (GovCloud)
eu-central-1(Francoforte)
eu-north-1(Stoccolma)
eu-south-1(Milano)
eu-south-2(Spagna)
eu-west-1(Irlanda)
eu-west-2(Londra)
eu-west-3(Parigi)
ap-southeast-2(Sydney)
il-central-1(Tel Aviv)

Dettagli di geo-inferenza

Geo: USA

ID di inferenza geografica: us.amazon.nova-micro-v1:0

Regione di origine Regioni di destinazione
us-east-1 (Virginia settentrionale)us-east-1 (Virginia settentrionale), us-east-2 (Ohio), us-west-2 (Oregon)
us-east-2 (Ohio)us-east-1 (Virginia settentrionale), us-east-2 (Ohio), us-west-2 (Oregon)
us-west-2 (Oregon)us-east-1 (Virginia settentrionale), us-east-2 (Ohio), us-west-2 (Oregon)

Geografia: UE

ID di inferenza geografica: eu.amazon.nova-micro-v1:0

Regione di origine Regioni di destinazione
eu-central-1 (Francoforte)eu-central-1 (Francoforte), eu-north-1 (Stoccolma), eu-west-1 (Irlanda), eu-west-3 (Parigi)
eu-north-1 (Stoccolma)eu-central-1 (Francoforte), eu-north-1 (Stoccolma), eu-west-1 (Irlanda), eu-west-3 (Parigi)
eu-south-1 (Milano)eu-central-1 (Francoforte), eu-north-1 (Stoccolma), eu-south-1 (Milano), eu-west-1 (Irlanda), eu-west-3 (Parigi)
eu-south-2 (Spagna)eu-central-1 (Francoforte), eu-north-1 (Stoccolma), eu-south-2 (Spagna), eu-west-1 (Irlanda), eu-west-3 (Parigi)
eu-west-1 (Irlanda)eu-central-1 (Francoforte), eu-north-1 (Stoccolma), eu-west-1 (Irlanda), eu-west-3 (Parigi)
eu-west-3 (Parigi)eu-central-1 (Francoforte), eu-north-1 (Stoccolma), eu-west-1 (Irlanda), eu-west-3 (Parigi)
il-central-1 (Tel Aviv)eu-central-1 (Francoforte), eu-north-1 (Stoccolma), eu-south-1 (Milano), eu-west-1 (Irlanda), eu-west-3 (Parigi), il-central-1 (Tel Aviv)

Quote e limiti

Il tuo account AWS dispone di quote predefinite per mantenere le prestazioni del servizio e garantire un uso appropriato di Amazon Bedrock. Le quote predefinite assegnate a un account potrebbero essere aggiornate in base a fattori regionali, alla cronologia dei pagamenti, all'utilizzo fraudolento, all' and/or approvazione di una richiesta di aumento delle quote. Per maggiori dettagli, consulta la Quote per Amazon Bedrock documentazione e consulta i limiti del modello.

Codice di esempio

Fase 1 - Account AWS: se hai già un account AWS, salta questo passaggio. Se non conosci AWS, registrati per un account AWS.

Fase 2 - Chiave API: vai alla console Amazon Bedrock e genera una chiave API a lungo termine.

Passaggio 3 - Scarica l'SDK: per utilizzare questa guida introduttiva, devi avere Python già installato. Quindi installa il software pertinente in base alle API che stai utilizzando.

pip install boto3

Passaggio 4 - Imposta le variabili di ambiente: configura l'ambiente per utilizzare la chiave API per l'autenticazione.

AWS_BEARER_TOKEN_BEDROCK="<provide your Bedrock API key>"

Passaggio 5 - Esegui la tua prima richiesta di inferenza: salva il file come bedrock-first-request.py

Per lo schema completo di richiesta e risposta, inclusi tutti i parametri supportati come system prompt,,, e temperature topP stopSequencestoolConfig, consulta Schema completo di richiesta nella Amazon Nova User Guide.

Invoke API
import json import boto3 client = boto3.client('bedrock-runtime', region_name='us-east-1') response = client.invoke_model( modelId='amazon.nova-micro-v1:0', body=json.dumps({ 'messages': [{ 'role': 'user', 'content': [{'text': 'Can you explain the features of Amazon Bedrock?'}] }], 'inferenceConfig': { 'maxTokens': 1024 } }) ) print(json.loads(response['body'].read()))
Converse API
import boto3 client = boto3.client('bedrock-runtime', region_name='us-east-1') response = client.converse( modelId='amazon.nova-micro-v1:0', messages=[ { 'role': 'user', 'content': [{'text': 'Can you explain the features of Amazon Bedrock?'}] } ] ) print(response)