Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Opzioni e architetture di Retrieval Augmented Generation su AWS
<a name="introduction"></a>

*Mithil Shah, Rajeev Muralidhar e il forte di Natacha, Amazon Web Services*

*Ottobre 2024* [(storia](doc-history.md) del documento)

L'*intelligenza artificiale generativa* si riferisce a un sottoinsieme di modelli di intelligenza artificiale in grado di creare nuovi contenuti e artefatti, come immagini, video, testo e audio, da una semplice richiesta di testo. I modelli di intelligenza artificiale generativa vengono addestrati su grandi quantità di dati che comprendono un'ampia gamma di argomenti e attività. Ciò consente loro di dimostrare una notevole versatilità nell'esecuzione di varie attività, anche quelle per le quali non sono stati addestrati esplicitamente. A causa della capacità di un singolo modello di eseguire più attività, questi modelli vengono spesso definiti *modelli di base* ()FMs.

Una delle applicazioni più importanti dei modelli di intelligenza artificiale generativa è la loro capacità di rispondere alle domande. Tuttavia, ci sono sfide specifiche che sorgono quando questi modelli vengono utilizzati per rispondere a domande basate su documenti personalizzati. I documenti personalizzati possono includere informazioni proprietarie, siti Web interni, documentazione interna, Confluence pagine, SharePoint pagine e altro. Un'opzione è utilizzare *Retrieval Augmented Generation* (RAG). Con RAG, il modello di base fa riferimento a una fonte di dati autorevole che non rientra nelle sue fonti di dati di addestramento (come i documenti personalizzati) prima di generare una risposta.

Questa guida descrive le diverse opzioni di intelligenza artificiale generativa disponibili per rispondere alle domande della documentazione personalizzata, inclusi i sistemi Retrieval Augmented Generation (RAG). Fornisce inoltre una panoramica della creazione di sistemi RAG su Amazon Web Services (AWS). Esaminando le opzioni e le architetture RAG, puoi scegliere tra servizi completamente gestiti su AWS architetture RAG personalizzate.

## Destinatari principali
<a name="intended-audience"></a>

I destinatari di questa guida sono gli architetti e i manager di intelligenza artificiale generativa che desiderano creare una soluzione RAG, esaminare le architetture disponibili e comprendere i vantaggi e gli svantaggi di ciascuna opzione.

## Obiettivi
<a name="objectives"></a>

Questa guida ti consente di:
+ Comprendi le opzioni di intelligenza artificiale generativa disponibili per rispondere a domande contenute nei documenti personalizzati
+ Esamina le opzioni di architettura per i sistemi RAG su AWS
+ Comprendi i vantaggi e gli svantaggi di ciascuna opzione RAG
+ Scegliete un'architettura RAG per il vostro ambiente AWS