Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
API dello strumento di caricamento in blocco per il piano dati Neptune
Bulk-load azioni:
Struttura del caricamento in blocco:
StartLoaderJob (azione)
Il nome AWS CLI per questa API è:. start-loader-job
Avvia un processo dello strumento di caricamento in blocco Neptune per caricare i dati da un bucket Amazon S3 in un'istanza database Neptune. Vedi Uso dello strumento di caricamento in blocco Amazon Neptune per importare i dati.
Quando si richiama questa operazione in un cluster Neptune con l'autenticazione IAM abilitata, l'utente o il ruolo IAM che effettua la richiesta deve avere una policy allegata che consenta l'azione StartLoaderJobneptune-db: IAM in quel cluster.
Richiesta
-
dependencies(nella CLI:
--dependencies) — una stringa, di tipo:string(una stringa UTF-8 codificata).Si tratta di un parametro facoltativo che può rendere subordinata una richiesta di caricamento in coda al completamento di una o più attività precedenti nella coda.
Neptune può accodare fino a 64 richieste di caricamento alla volta, se i relativi parametri
queueRequestsono impostati su"TRUE". Il parametrodependenciesconsente di rendere l'esecuzione di tale richiesta in coda dipendente dal completamento corretto di una o più richieste precedenti specificate nella coda.Ad esempio, se
Job-AeJob-Bdel caricamento sono indipendenti l'una dall'altra, maJob-Crichiede cheJob-AeJob-Bsiano completate prima del suo avvio, procedere come segue:-
Inviare
load-job-Aeload-job-Buna dopo l'altra in qualsiasi ordine e salvare i loro id di caricamento. -
Inviare
load-job-Ccon gli id di caricamento delle due attività nel campodependencies:
Esempio
"dependencies" : ["(job_A_load_id)", "(job_B_load_id)"]A causa del parametro
dependencies, il bulk loader non avviaJob-Cfino a quandoJob-AeJob-Bnon sono state completate correttamente. Se uno di essi fallisce, non Job-C verrà eseguito e il suo stato verrà impostato su.LOAD_FAILED_BECAUSE_DEPENDENCY_NOT_SATISFIEDÈ possibile impostare più livelli di dipendenza in questo modo, in modo che l'errore di un'attività causi l'annullamento di tutte le richieste direttamente o indirettamente dipendenti da essa.
-
-
failOnError (nella CLI:
--fail-on-error): un valore booleano di tipoboolean[un valore booleano (vero o falso)].failOnError: un flag per attivare un arresto completo in caso di errore.Valori consentiti:
"TRUE","FALSE".Valore predefinito:
"TRUE".Quando questo parametro è impostato su
"FALSE", il loader tenta di caricare tutti i dati nella posizione specificata, saltando eventuali voci con errori.Quando questo parametro è impostato su
"TRUE", il loader si arresta non appena rileva un errore. I dati caricati fino a quel punto persistono. -
format(nella CLI:
--format) — Obbligatorio: un formato, di tipo:string(una stringa UTF-8 codificata).Il formato dei dati. Per ulteriori informazioni sui formati di dati per il comando
Loaderdi Neptune, consulta Formati dei dati da caricare.Valori consentiti
-
csvper il formato dei dati CSV Gremlin. -
opencypherper il formato dei dati CSV openCypher. -
ntriplesper il formato di dati N-Triples RDF. -
nquadsper il formato di dati N-Quads RDF. -
rdfxmlper il formato dei dati RDF\XML RDF. -
turtleper il formato dei dati Turtle RDF.
-
-
iamRoleArn(nella CLI:
--iam-role-arn) — Obbligatorio: una stringa, di tipo:string(una stringa UTF-8 codificata).Il nome della risorsa Amazon (ARN) per un ruolo IAM che deve essere assunto dall'istanza database Neptune per l'accesso al bucket S3. L'ARN del ruolo IAM fornito qui deve essere collegato al cluster database (vedi Aggiunta del ruolo IAM a un cluster Amazon Neptune).
-
mode(nella CLI:
--mode) — una modalità, di tipo:string(una stringa UTF-8 codificata).Modalità del processo di caricamento
Valori consentiti:
RESUME,NEW,AUTO.Valore predefinito:
AUTO.-
RESUME: in modalità RESUME, lo strumento di caricamento cerca un caricamento precedente da questa origine e, se ne trova uno, riprende l'attività di caricamento. Se non viene trovata alcuna attività di caricamento precedente, il loader si arresta.Il loader evita di ricaricare i file caricati correttamente in un'attività precedente. Tenta di elaborare solo i file non caricati. Se sono stati eliminati i dati caricati in precedenza dal cluster Neptune, tali dati non vengono ricaricati in questa modalità. Se un processo di caricamento precedente ha caricato correttamente tutti i file dalla stessa origine, nulla viene ricaricato e lo strumento di caricamento restituisce un risultato positivo.
-
NEW: in modalità NEW viene creata una nuova richiesta di caricamento, indipendentemente da eventuali caricamenti precedenti. Questa modalità può essere utilizzata per ricaricare tutti i dati provenienti da un'origine dopo che sono stati eliminati dati caricati precedentemente dal cluster Neptune o per caricare nuovi dati disponibili nella stessa origine. -
AUTO: in modalità AUTO, lo strumento di caricamento cerca un'attività di caricamento precedente dalla stessa origine e, se ne trova una, riprende tale attività, proprio come in modalitàRESUME.Se il loader non trova un'attività di caricamento precedente dalla stessa origine, carica tutti i dati dall'origine, proprio come in modalità
NEW.
-
-
parallelism(nella CLI:
--parallelism) — un parallelismo, di tipo:string(una UTF-8 stringa codificata).Il parametro facoltativo
parallelismpuò essere impostato per ridurre il numero di thread utilizzati dall'attività di caricamento in blocco.Valori consentiti:
-
LOW: il numero di thread utilizzati è il numero di vCPU disponibili diviso per 8. -
MEDIUM: il numero di thread utilizzati è il numero di vCPU disponibili diviso per 2. -
HIGH: il numero di thread utilizzati corrisponde al numero di vCPU disponibili. -
OVERSUBSCRIBE: il numero di thread utilizzati è il numero di vCPU disponibili moltiplicato per 2. Se viene utilizzato questo valore, il bulk loader occupa tutte le risorse disponibili.Ciò non significa, tuttavia, che l'impostazione
OVERSUBSCRIBEcomporti un utilizzo della CPU al 100%. Poiché l'operazione di caricamento è I/O vincolata, l'utilizzo massimo della CPU previsto è compreso tra il 60% e il 70%.
Valore predefinito:
HIGHL'impostazione
parallelisma volte può causare un deadlock tra i thread durante il caricamento dei dati openCypher. Quando ciò accade, Neptune restituisce l'erroreLOAD_DATA_DEADLOCK. Di solito è possibile risolvere il problema impostandoparallelismsu un valore inferiore e riprovando il comando di caricamento. -
-
parserConfiguration (nella CLI:
--parser-configuration): un array di mappa con coppie chiave-valore in cui:Ogni chiave è una stringa, di tipo:
string(una stringa UTF-8 codificata).Ogni valore è una stringa, di tipo:
string(una stringa UTF-8 codificata).parserConfiguration: un oggetto opzionale con valori di configurazione del parser aggiuntivi. Ciascuno dei parametri figlio è anche facoltativo:-
namedGraphUri: il grafo predefinito per tutti i formati RDF quando non viene specificato alcun grafo (per formati non quads e voci NQUAD senza grafo).Il valore predefinito è
https://aws.amazon.com/neptune/vocab/v01/DefaultNamedGraph. -
baseUri— L'URI di base per i formati RDF/XML e Turtle.Il valore predefinito è
https://aws.amazon.com/neptune/default. -
allowEmptyStrings: gli utenti di Gremlin devono essere in grado di passare valori di stringa vuoti ("") come proprietà dei nodi e degli archi durante il caricamento di dati CSV. SeallowEmptyStringsè impostato sufalse(valore predefinito), le stringhe vuote vengono trattate come valori null e non vengono caricate.Se
allowEmptyStringsè impostato sutrue, lo strumento di caricamento considera le stringhe vuote come valori di proprietà validi e le carica di conseguenza.
-
-
queueRequest (nella CLI:
--queue-request): un valore booleano di tipoboolean[un valore booleano (vero o falso)].Si tratta di un parametro flag opzionale che indica se la richiesta di caricamento può essere accodata o meno.
Non è necessario attendere il completamento di un processo di caricamento prima di emettere quello successivo, perché Neptune può accodare fino a 64 processi alla volta, a condizione che i relativi parametri
queueRequestsiano tutti impostati su"TRUE". L'ordine di accodamento dei processi sarà first-in-first-out (FIFO).Se il parametro
queueRequestviene omesso o impostato su"FALSE", la richiesta di caricamento avrà esito negativo se un'altra attività di caricamento è già in esecuzione.Valori consentiti:
"TRUE","FALSE".Valore predefinito:
"FALSE". -
s3BucketRegion(nella CLI:
--s-3-bucket-region) — Obbligatorio: a S3BucketRegion, di tipo:string(una stringa UTF-8 codificata).La regione Amazon del bucket S3. Deve corrispondere alla regione Amazon del cluster database.
-
source(nella CLI:
--source) — Obbligatorio: una stringa, di tipo:string(una stringa UTF-8 codificata).Il parametro
sourceaccetta un URI S3 che identifica un singolo file, più file, una cartella o più cartelle. Neptune carica ogni file di dati in qualsiasi cartella specificata.l'URI può essere in uno dei seguenti formati.
-
s3://(bucket_name)/(object-key-name) -
https://s3.amazonaws.com/(bucket_name)/(object-key-name) -
https://s3.us-east-1.amazonaws.com/(bucket_name)/(object-key-name)
L'
object-key-nameelemento dell'URI è equivalente al parametro prefix in una chiamata API ListObjectsS3. Identifica tutti gli oggetti nel bucket S3 specificato i cui nomi iniziano con il prefisso specificato. Può trattarsi di un singolo file o cartella o di più cartelle di file and/or.La cartella o le cartelle specificate possono contenere più file di vertici e più file di archi.
-
-
updateSingleCardinalityProperties (nella CLI:
--update-single-cardinality-properties): un valore booleano di tipoboolean[un valore booleano (vero o falso)].updateSingleCardinalityPropertiesè un parametro facoltativo che controlla il modo in cui lo strumento di caricamento in blocco tratta un nuovo valore per le proprietà di vertici o archi a cardinalità singola.Valori consentiti:
"TRUE","FALSE".Valore predefinito:
"FALSE".Come impostazione predefinita o quando
updateSingleCardinalityPropertiesè impostato esplicitamente su"FALSE", il loader considera un nuovo valore come un errore, perché viola la cardinalità singola.Quando
updateSingleCardinalityPropertiesè impostato invece su"TRUE", il bulk loader sostituisce il valore esistente con quello nuovo. Se valori di proprietà multipli edge o vertice a cardinalità singola vengono forniti nei file di origine caricati, il valore finale alla fine del caricamento in blocco potrebbe essere uno qualsiasi di questi nuovi valori. Il loader garantisce solo che il valore esistente è stato sostituito da uno di quelli nuovi. -
userProvidedEdgeIds (nella CLI:
--user-provided-edge-ids): un valore booleano di tipoboolean[un valore booleano (vero o falso)].Questo parametro è richiesto solo quando si caricano dati openCypher che contengono ID di relazione. Deve essere incluso e impostato su
Truese gli ID delle relazioni openCypher vengono forniti esplicitamente nei dati da caricare (consigliato).Se
userProvidedEdgeIdsè assente o è impostato suTrue, in ogni file delle relazioni all'interno del caricamento deve esistere una colonna:ID.Se
userProvidedEdgeIdsè presente ed è impostato suFalse, i file delle relazioni all'interno del caricamento non devono contenere una colonna:ID. Lo strumento di caricamento Neptune genera automaticamente un ID per ogni relazione.È utile fornire in modo esplicito gli ID delle relazioni in modo che lo strumento di caricamento possa riprendere il caricamento dopo la correzione dell'errore nei dati CSV, senza dover ricaricare le relazioni già caricate. Se gli ID delle relazioni non sono stati assegnati in modo esplicito, lo strumento di caricamento non può riprendere un caricamento non riuscito se è stato necessario correggere un file delle relazioni, perciò dovrà ricaricare tutte le relazioni.
Risposta
-
payload: Obbligatorio: un array di mappa con coppie chiave-valore in cui:
Ogni chiave è una stringa, di tipo:
string(una stringa UTF-8 codificata).Ogni valore è una stringa, di tipo:
string(una stringa UTF-8 codificata).Contiene una coppia nome-valore
loadIdche fornisce un identificatore per l'operazione di caricamento. -
status— Obbligatorio: una stringa, di tipo:
string(una stringa UTF-8 codificata).Il codice HTTP restituito che indica lo stato del processo di caricamento.
Errori
GetLoaderJobStatus (azione)
Il nome AWS CLI per questa API è:. get-loader-job-status
Ottiene informazioni su un determinato processo di caricamento. Neptune tiene traccia dei 1.024 lavori di caricamento in blocco più recenti e archivia solo gli ultimi 10.000 dettagli di errore per processo.
Per ulteriori informazioni, consulta l'API Neptune Get-Status Loader.
Quando si richiama questa operazione in un cluster Neptune con l'autenticazione IAM abilitata, l'utente o il ruolo IAM che effettua la richiesta deve avere una policy allegata che consenta l'azione GetLoaderJobStatusneptune-db: IAM in quel cluster.
Richiesta
-
details (nella CLI:
--details): un valore booleano di tipoboolean[un valore booleano (vero o falso)].Flag che indica se includere o meno i dettagli oltre allo stato generale (
TRUEoFALSE, l'impostazione predefinita èFALSE). -
errors (nella CLI:
--errors): un valore booleano di tipoboolean[un valore booleano (vero o falso)].Flag che indica se includere o meno un elenco di errori riscontrati (
TRUEoFALSE, l'impostazione predefinita èFALSE).L'elenco degli errori è paginato. I parametri
pageederrorsPerPageconsentono di esaminare tutti gli errori. -
errorsPerPage(nella CLI:
--errors-per-page) — a PositiveInteger, di tipo:integer(un intero con segno a 32 bit), almeno 1? st?.Il numero di errori restituiti in ogni pagina (un numero intero positivo; l'impostazione predefinita è
10). È valido solo se il parametroerrorsè impostato suTRUE. -
loadId(nella CLI:
--load-id) — Obbligatorio: una stringa, di tipo:string(una stringa UTF-8 codificata).L'ID del processo di caricamento di cui ottenere lo stato.
-
page(nella CLI:
--page) — a PositiveInteger, di tipo:integer(un intero con segno a 32 bit), almeno 1? st?.Il numero della pagina di errore (un numero intero positivo; l'impostazione predefinita è
1). È valido solo se il parametroerrorsè impostato suTRUE.
Risposta
-
payload— Obbligatorio: un documento, di tipo:
document(un contenuto aperto indipendente dal protocollo rappresentato da un JSON-like modello di dati).Informazioni sullo stato del processo di caricamento, con un layout simile al seguente:
Esempio
{ "status" : "200 OK", "payload" : { "feedCount" : [ { "LOAD_FAILED" : (number) } ], "overallStatus" : { "fullUri" : "s3://(bucket)/(key)", "runNumber" : (number), "retryNumber" : (number), "status" : "(string)", "totalTimeSpent" : (number), "startTime" : (number), "totalRecords" : (number), "totalDuplicates" : (number), "parsingErrors" : (number), "datatypeMismatchErrors" : (number), "insertErrors" : (number), }, "failedFeeds" : [ { "fullUri" : "s3://(bucket)/(key)", "runNumber" : (number), "retryNumber" : (number), "status" : "(string)", "totalTimeSpent" : (number), "startTime" : (number), "totalRecords" : (number), "totalDuplicates" : (number), "parsingErrors" : (number), "datatypeMismatchErrors" : (number), "insertErrors" : (number), } ], "errors" : { "startIndex" : (number), "endIndex" : (number), "loadId" : "(string), "errorLogs" : [ ] } } } -
status— Obbligatorio: una stringa, di tipo:
string(una UTF-8 stringa codificata).Il codice di risposta HTTP per la richiesta.
Errori
ListLoaderJobs (azione)
Il nome AWS CLI per questa API è:. list-loader-jobs
Recupera un elenco di loadIds per tutti i processi dello strumento di caricamento attivi.
Quando si richiama questa operazione in un cluster Neptune con l'autenticazione IAM abilitata, l'utente o il ruolo IAM che effettua la richiesta deve avere una policy allegata che consenta l'azione ListLoaderJobsneptune-db: IAM in quel cluster.
Richiesta
-
includeQueuedLoads (nella CLI:
--include-queued-loads): un valore booleano di tipoboolean[un valore booleano (vero o falso)].Un parametro facoltativo che può essere utilizzato per escludere gli ID di caricamento delle richieste di caricamento in coda quando viene richiesto un elenco di ID di caricamento mediante l'impostazione del parametro su
FALSE. Il valore predefinito èTRUE. -
limit(nella CLI:
--limit) — a ListLoaderJobsInputLimitInteger, di tipo:integer(un intero con segno a 32 bit), non meno di 1 o più di 100? 1? s.Il numero di ID di caricamento da elencare. Deve essere un numero intero positivo maggiore di zero e non superiore a
100(valore predefinito).
Risposta
-
payload - obbligatorio: un oggetto LoaderIdResult.
L'elenco richiesto di ID dei processi.
-
status— Obbligatorio: una stringa, di tipo:
string(una stringa UTF-8 codificata).Restituisce lo stato della richiesta di elenco dei processi.
Errori
CancelLoaderJob (azione)
Il nome AWS CLI per questa API è:. cancel-loader-job
Annulla un processo di caricamento specificato. Questa è una richiesta HTTP DELETE. Per ulteriori informazioni, consulta l'API Neptune Get-Status Loader.
Quando si richiama questa operazione in un cluster Neptune con l'autenticazione IAM abilitata, l'utente o il ruolo IAM che effettua la richiesta deve avere una policy allegata che consenta l'azione CancelLoaderJobneptune-db: IAM in quel cluster.
Richiesta
-
loadId(nella CLI:
--load-id) — Obbligatorio: una stringa, di tipo:string(una stringa UTF-8 codificata).L'ID del processo di caricamento da eliminare.
Risposta
-
status— una stringa, di tipo:
string(una stringa UTF-8 codificata).Lo stato di annullamento.
Errori
Struttura del caricamento in blocco:
LoaderIdResult (struttura)
Contiene un elenco di ID di caricamento.
Campi
-
loadIds— Questa è una stringa, di tipo:
string(una stringa UTF-8 codificata).Un elenco di ID di caricamento.