Modelli di base generativi di intelligenza artificiale in Canvas SageMaker

Amazon SageMaker Canvas fornisce modelli di base di intelligenza artificiale generativa che puoi utilizzare per avviare chat conversazionali. Tali modelli di generazione di contenuti vengono addestrati su grandi quantità di dati di testo per apprendere i modelli statistici e le relazioni tra le parole e riescono a produrre testo coerente che è statisticamente simile al testo su cui sono stati addestrati. È possibile utilizzare tale funzionalità per aumentare la produttività eseguendo le seguenti operazioni:

Genera contenuti, come schemi di documenti, report e blog
Riassumi il testo partendo da grandi corpus di testo, ad esempio guadagni, trascrizioni di chiamate in videoconferenza, report annuali o capitoli di manuali utente
Estrai approfondimenti e principali conclusioni da ampi passaggi di testo, come appunti di riunioni o racconti
Migliora il testo e trova errori grammaticali o di battitura

I modelli base sono una combinazione di Amazon SageMaker JumpStart e Amazon Bedrock Large Language Models (LLM). Canvas offre i seguenti modelli:

Modello	Tipo	Description
Amazon Titan	Modello Amazon Bedrock	Amazon Titan è un potente modello linguistico generico che è possibile utilizzare per attività quali riepilogo, generazione di testo (come la creazione di un post in un blog), classificazione, domande e risposte aperte ed estrazione di informazioni. È preaddestrato su set di dati di grandi dimensioni, il che lo rende adatto per attività e ragionamenti complessi. Per continuare a supportare le best practice sull’utilizzo responsabile dell’IA, i modelli di fondazione Amazon Titan sono progettati per rilevare e rimuovere i contenuti dannosi nei dati, rifiutare i contenuti inappropriati nell’input dell’utente e filtrare gli output dei modelli che includono contenuti inappropriati (come incitamento all’odio, oscenità e violenza).
Anthropic Claude Instant	Modello Amazon Bedrock	Claude Instant di Anthropic è un modello più rapido ed economico ma pur sempre molto capace. Questo modello è in grado di gestire una serie di attività, tra cui dialoghi informali, analisi del testo, riepilogo e risposta alle domande dei documenti. Allo stesso modo Claude-2, Claude Instant può supportare fino a 100.000 token in ogni prompt, equivalenti a circa 200 pagine di informazioni.
Anthropic Claude-2	Modello Amazon Bedrock	Claude-2 è il modello più potente di Anthropic, che eccelle in un'ampia gamma di attività, dai dialoghi sofisticati e dalla generazione di contenuti creativi al seguire istruzioni dettagliate. Claude-2 può richiedere fino a 100.000 token in ogni prompt, equivalenti a circa 200 pagine di informazioni. Può generare risposte più lunghe rispetto alla versione precedente. Supporta casi d'uso come la risposta a domande, l'estrazione di informazioni, la rimozione delle PII, la generazione di contenuti, la classificazione a scelta multipla, il gioco di ruolo, il confronto di testo, il riepilogo e le domande e risposte di documenti con citazioni.
Falcon-7B-Instruct	JumpStart modello	Falcon-7B-Instruct ha 7 miliardi di parametri ed è stato ottimizzato su una combinazione di set di dati di chat e istruzioni. È adatto come assistente virtuale e offre le migliori prestazioni quando si seguono le istruzioni o si partecipa a una conversazione. Poiché il modello è stato addestrato su grandi quantità di dati English-language Web, presenta gli stereotipi e i pregiudizi comunemente presenti online e non è adatto per lingue diverse dall'inglese. Rispetto a Falcon-40B-Instruct, Falcon-7B-Instruct è un modello leggermente più piccolo e compatto.
Falcon-40B-Instruct	JumpStart modello	Falcon-40B-Instruct ha 40 miliardi di parametri ed è stato ottimizzato su una combinazione di set di dati di chat e istruzioni. È adatto come assistente virtuale e offre le migliori prestazioni quando si seguono le istruzioni o si partecipa a una conversazione. Poiché il modello è stato addestrato su grandi quantità di dati English-language Web, presenta gli stereotipi e i pregiudizi comunemente presenti online e non è adatto per lingue diverse dall'inglese. Rispetto a Falcon-7B-Instruct, Falcon-40B-Instruct è un modello leggermente più grande e potente.
Jurassic-2 Medio	Modello Amazon Bedrock	Jurassic-2 Mid è un modello di generazione di testo ad alte prestazioni basato su un enorme corpus di testo (attuale fino alla metà del 2022). È altamente versatile, generico e in grado di comporre testi simili a quelli umani e risolvere attività complesse come la risposta a domande, la classificazione del testo e molti altri. Questo modello offre funzionalità di istruzione zero-shot, consentendo che sia diretto solo con il linguaggio naturale e senza l'uso di esempi Funziona fino al 30% più velocemente rispetto al modello precedente. Jurassic-1 Jurassic-2 Mid è il modello di medie dimensioni di AI21, progettato con cura per trovare il giusto equilibrio tra qualità eccezionale e convenienza.
Jurassic-2 Ultra	Modello Amazon Bedrock	Jurassic-2 Ultra è un modello di generazione di testo ad alte prestazioni basato su un enorme corpus di testo (attuale fino alla metà del 2022). È altamente versatile, generico e in grado di comporre testi simili a quelli umani e risolvere attività complesse come la risposta a domande, la classificazione del testo e molti altri. Questo modello offre funzionalità di istruzione zero-shot, consentendo che sia diretto solo con il linguaggio naturale e senza l'uso di esempi Funziona fino al 30% più velocemente rispetto al modello precedente. Jurassic-1 Rispetto a Jurassic-2 Mid, Jurassic-2 Ultra è un modello leggermente più grande e potente.
Llama-2-7b-Chat	JumpStart modello	Llama-2-7b-Chat è un modello base di Meta adatto per impegnarsi in conversazioni significative e coerenti, generare nuovi contenuti ed estrarre risposte da note esistenti. Poiché il modello è stato addestrato su grandi quantità di dati English-language Internet, presenta i pregiudizi e le limitazioni che si riscontrano comunemente online ed è più adatto per le attività in inglese.
Llama-2-13B-Chat	Modello Amazon Bedrock	Llama-2-13B-Chat by Meta è stato perfezionato sui dati conversazionali dopo una formazione iniziale sui dati Internet. Le sue capacità ottimizzate per dialoghi naturali e chat coinvolgenti lo rendono un agente conversazionale ottimale. Rispetto a quello più piccolo Llama-2-7b-Chat, Llama-2-13B-Chat ha quasi il doppio dei parametri, il che gli consente di ricordare più il contesto e produrre risposte conversazionali più sfumate. Ad esempio Llama-2-7b-Chat, Llama-2-13B-Chat è stato addestrato sui English-language dati ed è più adatto per attività in inglese.
Llama-2-70B-Chat	Modello Amazon Bedrock	Allo Llama-2-7b-Chat stesso modo Llama-2-13B-Chat, il Llama-2-70B-Chat modello di Meta è ottimizzato per avviare dialoghi naturali e significativi. Con 70 miliardi di parametri, questo modello conversazionale di grandi dimensioni può ricordare un contesto più ampio e produrre risposte altamente coerenti rispetto alle versioni del modello più compatte. Tuttavia, ciò comporta il costo di risposte più lente e requisiti di risorse più elevati. Llama-2-70B-Chat è stato addestrato su grandi quantità di dati English-language Internet ed è più adatto per attività in inglese.
Mistral-7B	JumpStart modello	Mistral-7B by Mistral.AI è un eccellente modello di linguaggio generico adatto a un'ampia gamma di attività in linguaggio naturale (NLP) come la generazione di testo, il riepilogo e la risposta a domande. Utilizza l’attenzione alle query raggruppate (GQA), che aumenta la velocità di inferenza e rende le prestazioni del modello paragonabili a quelle di modelli con il doppio o il triplo dei parametri. È stato addestrato su una combinazione di dati di testo tra cui libri, siti web e articoli scientifici in lingua inglese, quindi funziona meglio per le attività in questa lingua.
Mistral-7B-Chat	JumpStart modello	Mistral-7B-Chat è un modello conversazionale Mistral.AI basato su. Mistral-7B Sebbene Mistral-7B sia ideale per le attività generali di PNL, è Mistral-7B-Chat stato ulteriormente ottimizzato sui dati conversazionali per ottimizzarne le capacità di chat naturali e coinvolgenti. Di conseguenza, Mistral-7B-Chat genera risposte più simili a quelle umane e ricorda il contesto delle risposte precedenti. Ad esempio Mistral-7B, questo modello è più adatto per le attività in lingua inglese.
MPT-7B-Instruct	JumpStart modello	MPT-7B-Instruct è un modello per istruzioni di lunga durata che seguono le attività e può aiutarvi nella scrittura di attività, tra cui il riepilogo del testo e la risposta a domande, per risparmiare tempo e fatica. Questo modello è stato addestrato su grandi quantità di dati ottimizzati e può affrontare input più grandi, come documenti complessi. Utilizzare questo modello quando si desidera elaborare grandi quantità di testo o che il modello generi risposte lunghe.

I modelli di base di Amazon Bedrock sono attualmente disponibili solo nelle Regioni Stati Uniti orientali (Virginia settentrionale) e Stati Uniti occidentali (Oregon). Inoltre, quando si utilizzano modelli di base di Amazon Bedrock, i costi vengono calcolati in base al volume dei token di input e di output, come specificato da ciascun fornitore di modelli. Per ulteriori informazioni, consulta la pagina Prezzi di Amazon Bedrock. I modelli JumpStart base vengono implementati su istanze di SageMaker AI Hosting e ti viene addebitata la durata dell'utilizzo in base al tipo di istanza utilizzata. Per ulteriori informazioni sul costo dei diversi tipi di istanze, consulta la sezione Amazon SageMaker AI Hosting: Real-Time Inference nella pagina dei SageMaker prezzi.

L'interrogazione dei documenti è una funzionalità aggiuntiva che è possibile utilizzare per interrogare e ottenere informazioni dai documenti archiviati negli indici utilizzando Amazon Kendra. Con questa funzionalità, è possibile generare contenuti dal contesto di tali documenti e ricevere risposte specifiche per il caso d'uso aziendale, anziché risposte generiche alle grandi quantità di dati su cui sono stati addestrati i modelli di base. Per ulteriori informazioni sugli indici in Amazon Kendra, consulta Guida per gli sviluppatori di Amazon Kendra.

Se desideri ricevere risposte da uno qualsiasi dei modelli di fondazione personalizzati in base ai tuoi dati e al tuo caso d’uso, puoi eseguire il fine-tuning dei modelli di fondazione. Per ulteriori informazioni, consulta Fine-tune modelli di base.

Se desideri ottenere previsioni da un modello Amazon SageMaker JumpStart Foundation tramite un'applicazione o un sito Web, puoi implementare il modello su un endpoint di SageMaker intelligenza artificiale. SageMaker Gli endpoint di intelligenza artificiale ospitano il tuo modello e puoi inviare richieste all'endpoint tramite il codice dell'applicazione per ricevere previsioni dal modello. Per ulteriori informazioni, consulta Distribuzione di modelli su un endpoint.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Automatizza la preparazione dei dati in Canvas SageMaker

Completamento dei prerequisiti