Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Palmyra X4
Scrittore — Palmyra X4
Dettagli del modello
Palmyra X4 è il LLM aziendale di Writer ottimizzato per la scrittura aziendale, la generazione di contenuti e il knowledge work con un forte seguito di istruzioni. Per ulteriori informazioni sullo sviluppo e sulle prestazioni del modello, consulta la scheda modello/servizio.
Data di lancio del modello: settembre 2024
Data di scadenza del modello: non prima del 28/04/2026
Contratti di licenza con l'utente finale e condizioni d'uso: Visualizza
Ciclo di vita del modello: attivo
Finestra contestuale: 128K token
Token di output massimi: 8K
| Modalità di input | Modalità di output | APIs supportate | Endpoint supportati |
|---|---|---|---|
Responses | bedrock-runtime | ||
Chat Completions | bedrock-mantle | ||
Invoke | |||
Converse | |||
Funzionalità e caratteristiche
Caratteristiche Bedrock
Funzionalità supportate tramite endpoint bedrock-runtime
Prezzi
Per i prezzi, consulta la pagina dei prezzi di Amazon Bedrock
Accesso programmatico
Utilizza il modello IDs e l'endpoint seguenti URLs per accedere a questo modello a livello di codice. Per ulteriori informazioni sugli endpoint disponibili, consulta APIs APIs Supported ed Endpoints supportati.
| Endpoint | ID del modello | URL dell'endpoint locale | ID di inferenza geografica | ID di inferenza globale |
|---|---|---|---|---|
bedrock-runtime |
writer.palmyra-x4-v1:0 |
https://bedrock-runtime.{region}.amazonaws.com |
us.writer.palmyra-x4-v1:0 |
Non supportata |
Ad esempio, se la regione è us-east-1 (Virginia settentrionale), l'URL dell'endpoint bedrock-runtime sarà "" e per bedrock-mantle sarà https://bedrock-runtime.us-east-1.amazonaws.com "https://bedrock-mantle.us-east-1.api.aws/v1».
Livelli di servizio
Amazon Bedrock offre diversi livelli di servizio per soddisfare i tuoi requisiti di carico di lavoro. Standard fornisce pay-per-token l'accesso senza impegno. Priority offre una maggiore produttività con un impegno basato sul tempo. Flex offre un accesso a basso costo per carichi di lavoro flessibili. non-time-sensitive Reserved offre un throughput dedicato con un impegno a termine per carichi di lavoro prevedibili. Per ulteriori informazioni, consulta i livelli di servizio.
| Standard | Priorità | Flex | riservato |
|---|---|---|---|
Disponibilità regionale
Disponibilità regionale a colpo d'occhio
Bedrock offre tre opzioni di inferenza: In-Region mantiene le richieste all'interno di un'unica regione per garantire la massima conformità, percorsi geografici interregionali tra regioni all'interno di un'area geografica (Stati Uniti, UE, ecc.) per una maggiore velocità di trasmissione nel rispetto della residenza dei dati e rotte globali interregionali in tutto il mondo per la massima produttività quando non ci sono vincoli di residenza. Disponibilità regionaleConsulta la pagina per maggiori dettagli.
| Region | All'interno della regione | Geo | Globale |
|---|---|---|---|
us-east-1(Virginia settentrionale) | |||
us-east-2(Ohio) | |||
us-west-1(California settentrionale) | |||
us-west-2(Oregon) |
Dettagli di geo-inferenza
Geo: USA
ID di inferenza geografica: us.writer.palmyra-x4-v1:0
| Regione di origine | Regioni di destinazione |
|---|---|
| us-east-1 (Virginia settentrionale) | us-east-1 (Virginia settentrionale), us-east-2 (Ohio), us-west-2 (Oregon) |
| us-east-2 (Ohio) | us-east-1 (Virginia settentrionale), us-east-2 (Ohio), us-west-2 (Oregon) |
| us-west-1 (California settentrionale) | us-east-1 (Virginia settentrionale), us-east-2 (Ohio), us-west-1 (California settentrionale), us-west-2 (Oregon) |
| us-west-2 (Oregon) | us-east-1 (Virginia settentrionale), us-east-2 (Ohio), us-west-2 (Oregon) |
Codice di esempio
Fase 1 - Account AWS: se hai già un account AWS, salta questo passaggio. Se non conosci AWS, registrati per un account AWS
Fase 2 - Chiave API: vai alla console Amazon Bedrock
Passaggio 3 - Scarica l'SDK: per utilizzare questa guida introduttiva, devi avere Python già installato. Quindi installa il software pertinente a seconda di APIs quello che stai utilizzando.
pip install boto3
Passaggio 4 - Imposta le variabili di ambiente: configura l'ambiente per utilizzare la chiave API per l'autenticazione.
AWS_BEARER_TOKEN_BEDROCK="<provide your Bedrock API key>"
Passaggio 5 - Esegui la tua prima richiesta di inferenza: salva il file come bedrock-first-request.py