View a markdown version of this page

Utilizzo di S3 Vectors con Knowledge Base per Amazon Bedrock - Amazon Simple Storage Service

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Utilizzo di S3 Vectors con Knowledge Base per Amazon Bedrock

S3 Vectors si integra con Amazon Bedrock Knowledge Bases e Amazon SageMaker AI Unified Studio per semplificare e ridurre il costo dello storage vettoriale per le applicazioni RAG (Retrieval Augmented Generation).

Per ulteriori informazioni sui comandi della CLI di alto livello che integrano i modelli di embedding di Amazon Bedrock con le operazioni di S3 Vectors, consulta .

Panoramica dell’integrazione

Quando crei una knowledge base in Amazon Bedrock, puoi selezionare S3 Vectors come archivio vettoriale. Questa integrazione offre i seguenti vantaggi:

  • Risparmio sui costi per le applicazioni RAG con set di dati vettoriali di grandi dimensioni.

  • Perfetta integrazione con il flusso di lavoro RAG completamente gestito di Amazon Bedrock.

  • Gestione vettoriale automatica tramite il servizio Amazon Bedrock.

  • Latenza di query a freddo inferiore al secondo e latenza di query a caldo di soli 100 millisecondi per operazioni di recupero della knowledge base.

Amazon Bedrock Knowledge Bases fornisce un flusso di lavoro end-to-end RAG completamente gestito. Quando crei una knowledge base con S3 Vectors, Amazon Bedrock recupera automaticamente i dati dall’origine dati S3, converte i contenuti in blocchi di testo, genera gli embedding e li archivia nell’indice vettoriale. È quindi possibile eseguire query sulla knowledge base e ottenere risposte basate sui blocchi recuperati dai dati di origine.

Quando utilizzare questa integrazione

Valuta di utilizzare S3 Vectors con Knowledge Base per Amazon Bedrock quando hai bisogno di quanto segue:

  • Archiviazione vettoriale conveniente per set di dati di grandi dimensioni in cui una latenza di query inferiore al secondo soddisfa i requisiti dell’applicazione.

  • Recupero di documenti in base a testo e immagini per casi d’uso come la ricerca tra manuali, policy e contenuti visivi.

  • Applicazioni RAG che danno priorità all’ottimizzazione dei costi di archiviazione rispetto alle risposte a latenza ultrabassa.

  • Operazioni vettoriali gestite senza la necessità di imparare direttamente le operazioni API di S3 Vectors (puoi continuare a utilizzare le interfacce di Amazon Bedrock che già conosci).

  • Archiviazione vettoriale a lungo termine con la durabilità e la scalabilità di Amazon S3.

Questa integrazione è ideale per le organizzazioni che sviluppano applicazioni RAG e che devono cercare ed estrarre informazioni da contenuti di testo e immagini, laddove i vantaggi in termini di costo offerti da S3 Vectors siano in linea con requisiti di prestazioni delle query considerati accettabili.

Modelli di embedding supportati

Consulta i modelli supportati per gli incorporamenti vettoriali nella Amazon Bedrock User Guide.

Prerequisiti e autorizzazioni

Prima di creare una knowledge base con S3 Vectors, assicurati di disporre di quanto segue:

  • Autorizzazioni IAM appropriate per entrambi i servizi S3 Vectors e Amazon Bedrock. Per ulteriori informazioni sulle autorizzazioni IAM per S3 Vectors, consulta Identity and Access Management in S3 Vectors. Per ulteriori informazioni sulle autorizzazioni IAM relative al tuo ruolo di servizio per Knowledge Base per Amazon Bedrock per accedere a S3 Vectors, consulta Autorizzazioni per accedere all’archivio vettoriale in Amazon S3 Vectors nella Guida per l’utente di Amazon Bedrock.

  • Documenti di origine pronti per essere importati nella knowledge base.

  • Conoscenza dei requisiti del modello di embedding.

Quando configuri le configurazioni di sicurezza, puoi scegliere un ruolo IAM che fornisce l'autorizzazione ad Amazon Bedrock per accedere ai servizi richiesti AWS . Puoi lasciare che Amazon Bedrock crei il ruolo di servizio o utilizzi un ruolo personalizzato. Se utilizzi un ruolo personalizzato, configura una policy di bucket vettoriale che limiti l’accesso al bucket vettoriale e all’indice vettoriale al solo ruolo personalizzato.

Per informazioni dettagliate sulle autorizzazioni richieste e sui ruoli IAM, consulta Creazione di un ruolo di servizio per Knowledge Base per Amazon Bedrock nella Guida per l’utente di Amazon Bedrock. Il ruolo di servizio deve inoltre disporre delle autorizzazioni per S3 Vectors e le operazioni API. AWS KMS

Creazione di una knowledge base con S3 Vectors

Esistono due metodi per creare una knowledge base che utilizza S3 Vectors.

Metodo 1: utilizzando la console Amazon Bedrock

Quando crei una knowledge base nella console Amazon Bedrock, puoi selezionare “Bucket vettoriale S3” come opzione di archiviazione vettoriale. Sono disponibili due opzioni di configurazione:

  • Creazione rapida di un nuovo archivio vettoriale: Amazon Bedrock crea un bucket vettoriale S3 e un indice vettoriale, configurandoli con le impostazioni richieste. Per impostazione predefinita, il bucket vettoriale è crittografato tramite crittografia lato server utilizzando chiavi gestite di Amazon S3 (SSE-S3). Facoltativamente, puoi crittografare il bucket utilizzando. AWS KMS Per ulteriori informazioni sulla creazione rapida di un nuovo archivio vettoriale nella console, consulta Creazione di una knowledge base collegandosi a un’origine dati in Knowledge Base per Amazon Bedrock nella Guida per l’utente di Amazon Bedrock.

  • Selezione di un archivio vettoriale già creato: seleziona un bucket vettoriale S3 e un indice vettoriale esistenti dall’account che hai creato in precedenza. Per ulteriori informazioni sulla creazione di un bucket vettoriale S3 e di un indice vettoriale nella console di Knowledge Base per Amazon Bedrock, vedi la scheda S3 Vectors in Prerequisiti per l’utilizzo di un archivio vettoriale creato per una knowledge base nella Guida per l’utente di Amazon Bedrock.

Per step-by-step istruzioni dettagliate, consulta Creare una knowledge base collegandosi a un'origine dati in Amazon Bedrock Knowledge Bases nella Amazon Bedrock User Guide.

Metodo due: usare Amazon SageMaker Unified Studio

Puoi anche creare e gestire basi di conoscenza con S3 Vectors tramite Amazon Bedrock in Amazon SageMaker AI Unified Studio. che consiste in un ambiente di sviluppo unificato per creare e testare applicazioni di intelligenza artificiale che utilizzano basi di conoscenza.

Amazon Bedrock in SageMaker AI Unified Studio è progettato per gli utenti che necessitano di funzionalità notebook integrate e lavorano su più servizi di AWS ML e analisi. Puoi creare rapidamente un bucket vettoriale S3 e configurarlo come archivio vettoriale per le tue knowledge base quando crei applicazioni di IA generativa.

Per informazioni sull'uso di S3 Vectors con Amazon Bedrock in SageMaker AI Unified Studio, consulta Aggiungere una fonte di dati alla tua app Amazon Bedrock nella Guida per l'utente di SageMaker AI Unified Studio.

Gestione e interrogazione della knowledge base

Sincronizzazione e gestione dei dati

Knowledge Base per Amazon Bedrock offre operazioni basate su processi di acquisizione per garantire la sincronizzazione tra l’origine dati e gli embedding vettoriali. Quando sincronizzi l’origine dati, Amazon Bedrock scansiona ogni documento e verifica se è stato indicizzato nell’archivio vettoriale. Puoi anche indicizzare direttamente i documenti nell'archivio vettoriale utilizzando l'operazione. IngestKnowledgeBaseDocuments Al fine di garantire la sincronizzazione dei dati, è buona prassi creare un archivio vettoriale separato per ogni knowledge base.

Quando elimini una knowledge base o una risorsa di origine dati, Amazon Bedrock offre due policy di eliminazione dei dati: Delete (predefinita) e Retain. Se scegli la policy Delete, i vettori nell’indice vettoriale e nel bucket vettoriale vengono eliminati automaticamente.

Interrogazione e recupero

Dopo aver configurato la knowledge base, è possibile:

  • Recuperare i blocchi dai dati di origine utilizzando l’operazione Retrieve dell’API.

  • Genera risposte basate sui blocchi recuperati utilizzando l'operazione API. RetrieveAndGenerate

  • Provare le query direttamente nella console Amazon Bedrock.

Le risposte vengono restituite con citazioni che rimandano ai dati di origine.

Limitazioni

Quando usi S3 Vectors con Knowledge Base per Amazon Bedrock, è importante conoscere le seguenti limitazioni:

  • Solo ricerca semantica: S3 Vectors supporta la ricerca semantica, ma non le funzionalità di ricerca ibrida.

  • Limiti delle dimensioni in S3 Vectors: ogni vettore presenta sia un limite sulle dimensioni totali dei metadati sia un limite sulle dimensioni dei metadati filtrabili. Ciò potrebbe ridurre la quantità di metadati personalizzati e le opzioni di filtraggio disponibili. Quando usi S3 Vectors come archivio vettoriale con Amazon Bedrock Knowledge Bases, puoi allegare fino a 1 KB di metadati personalizzati e 35 chiavi di metadati per vettore.

  • Vincoli della strategia di suddivisione in blocchi: quando utilizzi un numero di token molto elevato con suddivisione in blocchi gerarchici nelle Knowledge Base di Amazon Bedrock, puoi superare i limiti massimi di dimensione dei metadati poiché le relazioni tra blocchi padre-figlio e il contesto gerarchico vengono archiviati come metadati non filtrabili in S3 Vectors. Per ulteriori informazioni sui limiti di Limitazioni e restrizioni dimensione dei metadati per vettore, consulta.

  • Solo vettori a virgola mobile: gli embedding vettoriali binari non sono supportati.

Per una guida completa su come lavorare con Knowledge Base per Amazon Bedrock, consulta Recupero dei dati e generazione di risposte basate su IA con Knowledge Base per Amazon Bedrock nella Guida per l’utente di Amazon Bedrock.