

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Ingestione vettoriale
Ingestione vettoriale

L'ingestione vettoriale consente di importare e indicizzare rapidamente domini e raccolte Serverless. OpenSearch OpenSearch Il servizio esamina il dominio o la raccolta e crea una pipeline di inserimento per conto dell'utente in cui caricare i dati. OpenSearch L'ingestione e l'indicizzazione del tuo dominio o della tua raccolta sono gestite per te da Vector ingestion.

Puoi accelerare e ottimizzare il processo di indicizzazione abilitando nuove funzionalità. [Accelerazione GPU per l'indicizzazione vettoriale](gpu-acceleration-vector-index.md) [Ottimizzazione automatica](serverless-auto-optimize.md) Con Vector ingestion, non è necessario gestire l'infrastruttura sottostante, applicare patch al software o scalare i cluster per supportare l'indicizzazione e l'ingestione del database vettoriale. Ciò consente di creare rapidamente il database vettoriale per soddisfare le proprie esigenze.

## Come funziona


L'ingestione vettoriale esamina il dominio o la raccolta e il relativo indice. È possibile configurare manualmente i campi dell'indice vettoriale o consentire OpenSearch l'utilizzo della configurazione automatica.

L'ingestione vettoriale utilizza OpenSearch Ingestion (OSI) come pipeline di dati tra Amazon S3 e. OpenSearch Il servizio elabora i vettori in parallelo per ottimizzare la velocità di inserimento rispettando i limiti di scalabilità di OSI e. OpenSearch

## OpenSearch Prezzi di importazione vettoriale


In un momento specifico, paghi solo per il numero di ingestioni vettoriali assegnate a una pipeline, indipendentemente dal fatto OCUs che i dati scorrano attraverso la pipeline. OpenSearch vector ingestion soddisfa immediatamente i carichi di lavoro aumentando o diminuendo la capacità della pipeline in base all'utilizzo.

Per i dettagli completi sui prezzi, consulta la pagina [dei prezzi OpenSearch di Amazon Service](https://aws.amazon.com/opensearch-service/pricing/).

## Prerequisiti


Prima di utilizzare l'ingestione vettoriale, assicurati di disporre delle seguenti risorse:
+ Bucket Amazon S3 contenente i tuoi documenti OpenSearch JSON in formato Parquet o JSONL
+ OpenSearch risorsa: un dominio o una raccolta
+ OpenSearch versione `2.19` o successiva (richiesta per l'integrazione con ottimizzazione automatica)

## Crea un database vettoriale


Utilizza il flusso di lavoro di creazione di lavori di inserimento vettoriale per configurare l'ottimizzazione automatica degli indici vettoriali e accelerare la creazione di indici su larga scala.

**Nota**  
Il contenuto procedurale di questa sezione è soggetto a modifiche man mano che l'interfaccia utente viene finalizzata. Il flusso di lavoro potrebbe essere aggiornato nelle versioni future per riflettere l'esperienza più recente sulla console.

**Per creare un processo di inserimento vettoriale**

1. Nella sezione **Dettagli del lavoro di ingestione vettoriale**, in **Nome, inserisci un nome per il tuo** lavoro di importazione.

1. Nella sezione **Origine dati, configura quanto segue**:

   1. Per l'**URI di Amazon S3**, inserisci la posizione del bucket Amazon S3 contenente OpenSearch i tuoi documenti Service JSON.

   1. Scegli **Browse Amazon S3** per selezionare tra i bucket disponibili oppure scegli **Visualizza per visualizzare** in anteprima il contenuto del bucket.

   1. Per **Tipo di contenuto**, seleziona una delle seguenti opzioni:
      + **Vettori**: i documenti contengono già dei vettori e non richiedono un'ulteriore generazione di vettori incorporati.
      + **Testo, immagine o audio**: i documenti contengono contenuti come testo, immagini o byte audio che devono essere codificati in incorporamenti vettoriali.

1. Nella sezione **Autorizzazioni per l'origine dei dati, configura le autorizzazioni** di accesso:

   1. Per il **ruolo IAM**, scegli una delle seguenti opzioni:
      + **Crea un nuovo ruolo**
      + **Usa un ruolo esistente**

   1. Per **il nome del ruolo IAM**, inserisci un nome per il ruolo.

1. Nella sezione **Destinazione**, configura l'endpoint del OpenSearch servizio:

   1. Per **Endpoint**, scegli **Scegli un'opzione** per selezionare tra i domini o le raccolte compatibili nella regione corrente.

   1. Scegli **Avanti** per procedere con l'endpoint selezionato.

1. Scegli **Avanti** per continuare con il passaggio successivo oppure scegli **Annulla** per uscire senza salvare.

## Funzionalità correlate


L'ingestione vettoriale funziona con le seguenti funzionalità di Amazon OpenSearch Service per ottimizzare le prestazioni del database vettoriale:

[Accelerazione GPU per l'indicizzazione vettoriale](gpu-acceleration-vector-index.md)  
L'accelerazione tramite GPU riduce il tempo necessario per creare, aggiornare ed eliminare gli indici vettoriali. Se utilizzata con l'ingestione vettoriale, è possibile accelerare in modo significativo il processo di inserimento e indicizzazione per database vettoriali su larga scala.

[Ottimizzazione automatica](serverless-auto-optimize.md)  
L'ottimizzazione automatica rileva automaticamente i compromessi ottimali tra latenza di ricerca, qualità e requisiti di memoria. L'ingestione vettoriale può applicare consigli di ottimizzazione automatica durante il processo di ingestione per garantire che gli indici vettoriali siano configurati in modo ottimale.

Per ottenere i migliori risultati, prendi in considerazione la possibilità di abilitare sia l'accelerazione GPU che l'ottimizzazione automatica quando utilizzi l'ingestione vettoriale per creare database vettoriali su larga scala.

# Esporta l'indice vettoriale di Amazon S3 nel motore vettoriale Service OpenSearch


Un' point-in-timeesportazione dell'indice vettoriale Amazon S3 selezionato in Service. OpenSearch Il motore vettoriale OpenSearch Service fornisce un archivio vettoriale semplice e scalabile con funzionalità di ricerca avanzate.

**Per esportare l'indice vettoriale di Amazon S3 nel motore vettoriale Service OpenSearch**

1. Nella sezione **Sorgente**, verifica i dettagli dell'indice vettoriale di Amazon S3:
   + **Indice vettoriale Amazon S3: il nome dell'indice** di origine
   + **Indice vettoriale Amazon S3 ARN**: il nome della risorsa Amazon del tuo indice

1. Nella sezione **Accesso al servizio**, configura OpenSearch l'autorizzazione al servizio:

   1. Per **Scegli un metodo per autorizzare il OpenSearch servizio**, seleziona una delle seguenti opzioni:
      + **Creare e utilizzare un nuovo ruolo di servizio**
      + **Usa un ruolo di servizio esistente**

   1. Per **Nome del ruolo di servizio**, inserisci un nome per il ruolo di servizio.
**Nota**  
Il nome del ruolo di servizio deve contenere da 1 a 64 caratteri. I caratteri validi sono a-z, A-Z, 0-9 e punti (.).

   1. Scegli **Visualizza i dettagli delle autorizzazioni** per esaminare le autorizzazioni richieste.

1. Espandi **Impostazioni aggiuntive: facoltativo** per configurare le opzioni avanzate, se necessario.

1. Nella sezione **Dettagli di esportazione**, configura le seguenti opzioni:
   + **Automatizza la creazione OpenSearch di raccolte vettoriali** nei OpenSearch servizi: le raccolte di servizi vengono utilizzate per archiviare dati vettoriali. La capacità di elaborazione serverless viene misurata in OpenSearch Service Compute Units (OCUs), per impostazione predefinita la capacità massima dell'OCU è 50.
   + **Automatizza la creazione di ruoli IAM per l'accesso al servizio**: questo ruolo viene utilizzato da OpenSearch Service per leggere l'indice vettoriale di Amazon S3 e scrivere OpenSearch nella raccolta Service.
   + **Automatizza la creazione della pipeline di importazione dei OpenSearch servizi: le pipeline** di importazione dei OpenSearch servizi vengono utilizzate per importare i dati. Un bucket Amazon S3 viene creato come best practice per acquisire e archiviare eventi non riusciti in un bucket Amazon S3 Dead Letter Queue (DLQ), permettendo un facile accesso per la risoluzione dei problemi e l'analisi.

1. **Scegli **Esporta** per avviare il processo di esportazione o scegli Annulla per uscire senza esportare.**

# Importa lo spazio dei nomi vettoriali Amazon S3 nel motore vettoriale Service OpenSearch


L'analisi dei dati vettoriali con OpenSearch Service richiede una raccolta di servizi una tantum OpenSearch e la configurazione delle autorizzazioni IAM.

**Per importare lo spazio dei nomi vettoriali Amazon S3 nel motore vettoriale Service OpenSearch**

1. Nella sezione **Sorgente**, configura l'indice vettoriale Amazon S3:

   1. Per l'**indice vettoriale Amazon S3 (ARN), inserisci l'ARN** del tuo indice vettoriale Amazon S3.
**Nota**  
Deve essere nel formato arn:aws:iam: :account-id: /\$1:index vector-bucket-name

1. **Nella sezione Accesso al servizio, configura l'autorizzazione al servizio:** OpenSearch 

   1. Per **Scegli un metodo per autorizzare il OpenSearch servizio**, seleziona una delle seguenti opzioni:
      + **Creare e utilizzare un nuovo ruolo di servizio**
      + **Usa un ruolo di servizio esistente**

   1. Per **Nome del ruolo di servizio**, inserisci un nome per il ruolo di servizio.
**Nota**  
Il nome del ruolo di servizio deve contenere da 1 a 64 caratteri. I caratteri validi sono a-z, A-Z, 0-9 e punti (.).

   1. Scegli **Visualizza i dettagli delle autorizzazioni** per esaminare le autorizzazioni richieste.

1. Espandi **Impostazioni aggiuntive: facoltativo** per configurare le opzioni avanzate, se necessario.

1. Nella sezione **Passaggi di importazione**, configura le seguenti opzioni di automazione:
   + **Automatizza la creazione OpenSearch di raccolte vettoriali** di OpenSearch Service: le raccolte di servizi vengono utilizzate per archiviare dati vettoriali. La capacità di elaborazione serverless viene misurata in OpenSearch Service Compute Units (OCUs), per impostazione predefinita la capacità massima dell'OCU è 50.
   + **Automatizza la creazione di ruoli IAM per l'accesso al servizio**: questo ruolo viene utilizzato da OpenSearch Service per leggere l'indice vettoriale di Amazon S3 e scrivere OpenSearch nella raccolta Service.
   + **Automatizza la creazione della pipeline OpenSearch di ingestione dei servizi: le pipeline** di importazione dei OpenSearch servizi vengono utilizzate per importare i dati. Un bucket Amazon S3 viene creato come best practice per acquisire e archiviare eventi non riusciti in un bucket Amazon S3 Dead Letter Queue (DLQ), permettendo un facile accesso per la risoluzione dei problemi e l'analisi.

1. **Scegli **Importa** per avviare il processo di importazione o scegli Annulla per uscire senza importare.**

# Visualizza i processi di inserimento vettoriale e la cronologia delle importazioni


I lavori di inserimento vettoriale creano una pipeline per la vettorializzazione dei set di dati, l'automazione dell'ottimizzazione degli indici vettoriali e l'accelerazione della creazione di indici su larga scala.

**Per visualizzare i lavori di ingestione vettoriale**

1. Nella sezione **Lavori di importazione vettoriale, visualizza le informazioni di** riepilogo:
   + **Lavori**: numero totale di lavori di ingestione
   + Scegli **Crea database vettoriale** per creare un nuovo lavoro di importazione

1. Nella sezione **Importazioni vettoriali di Amazon S3, visualizza il riepilogo delle importazioni**:
   + **Importazioni totali - Numero di importazioni** completate
   + Scegli **Importa vettori Amazon S3** per iniziare una nuova importazione

1. Nella tabella dei lavori di **ingestione di Vector, monitora i lavori** attivi con le seguenti informazioni:
   + **Nome: il nome del** lavoro
   + **Stato: stato** attuale del lavoro (ad esempio, Attivo)
   + **Fonte dei dati**: posizione della fonte (ad esempio, s3://location)
   + **Destinazione**: destinazione
   + **Ultimo aggiornamento**: data e ora dell'aggiornamento più recente

1. Utilizza la casella di ricerca per **trovare un lavoro di ingestione vettoriale per individuare lavori specifici.**

1. Per gestire i lavori, scegli una delle seguenti azioni:
   + Scegli **Elimina** per rimuovere i lavori selezionati
   + Scegli **Crea database vettoriale** per creare lavori aggiuntivi

1. Nella sezione **Cronologia delle importazioni di vettori Amazon S3, tieni traccia degli eventi di importazione**:

   1. Utilizza il filtro **Intervallo di date** per specificare un periodo di tempo per la cronologia delle importazioni.

   1. Utilizza il menu a discesa **Stato** per filtrare in base allo stato dell'importazione (ad esempio, Qualsiasi stato).

   1. Usa la casella di ricerca per **trovare le importazioni tramite l'indice vettoriale di Amazon S3 na**... per individuare importazioni specifiche.

   1. Visualizza i dettagli dell'importazione, tra cui:
      + **Importazione iniziata il (UTC\$1 5:30)** - Quando è iniziata l'importazione
      + **Stato dell'importazione: stato** attuale (in corso, completo, non riuscito, parzialmente completato)
      + **ARN - Indice vettoriale Amazon S3 - Identificatore dell'indice di origine**
      + **OpenSearch Raccolta vettoriale di servizio - Raccolta** di destinazioni

1. Scegli **Importa vettore Amazon S3** per iniziare un nuovo processo di importazione.