View a markdown version of this page

Tutorial: caricamento di dati in Amazon Keyspaces utilizzando DSBulk - Amazon Keyspaces (per Apache Cassandra)

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Tutorial: caricamento di dati in Amazon Keyspaces utilizzando DSBulk

Questo tutorial dettagliato ti guida nella migrazione dei dati da Apache Cassandra ad Amazon Keyspaces DataStax utilizzando il Bulk Loader (DSBulk) disponibile su. GitHub L'uso di DSBulk è utile per caricare set di dati su Amazon Keyspaces per scopi accademici o di test. Per ulteriori informazioni su come migrare i carichi di lavoro di produzione, consulta. Processo di migrazione offline: da Apache Cassandra ad Amazon Keyspaces In questo tutorial, completerai i seguenti passaggi.

Prerequisiti: configura un AWS account con credenziali, crea un file di trust store JKS per il certificato, configuracqlsh, scarica e installa DSBulk e configura un file. application.conf

  1. Crea CSV di origine e tabella di destinazione: prepara un file CSV come dati di origine e crea lo spazio chiave e la tabella di destinazione in Amazon Keyspaces.

  2. Preparazione dei dati: randomizza i dati nel file CSV e analizzali per determinare le dimensioni medie e massime delle righe.

  3. Imposta la capacità di trasmissione: calcola le unità di capacità di scrittura (WCU) richieste in base alla dimensione dei dati e al tempo di caricamento desiderato e configura la capacità assegnata alla tabella.

  4. Configura le impostazioni DSBulk: crea un file di configurazione DSBulk con impostazioni come autenticazione SSL/TLS, livello di coerenza e dimensione del pool di connessioni.

  5. Esegui il comando DSBulk load: esegui il comando DSBulk load per caricare i dati dal file CSV nella tabella Amazon Keyspaces e monitorare l'avanzamento.