View a markdown version of this page

Metriche in Amazon Redshift Spectrum - Amazon Redshift

Amazon Redshift non supporterà più la creazione di nuove UDF Python a partire dalla Patch 198. Le UDF Python esistenti continueranno a funzionare fino al 30 giugno 2026. Per ulteriori informazioni, consulta il post del blog.

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Metriche in Amazon Redshift Spectrum

Questo argomento descrive le viste di sistema che è possibile utilizzare per monitorare le query del data lake.

È possibile monitorare le query del data lake utilizzando le seguenti viste di sistema:

  • SVL_S3QUERY

    Utilizzate la vista SVL_S3QUERY per ottenere dettagli sulle query del data lake a livello di segmento e nodo slice.

  • SVL_S3QUERY_SUMMARY

    Utilizzate la vista SVL_S3QUERY_SUMMARY per ottenere un riepilogo di tutte le query sul data lake che sono state eseguite sul sistema.

Di seguito sono elencati alcuni elementi da cercare in SVL_S3QUERY_SUMMARY:

  • Il numero di file elaborati dalla query di Redshift Spectrum.

  • Il numero di byte sottoposti a scansione da Amazon S3. Il costo di una query di Redshift Spectrum viene riflesso nella quantità di dati sottoposti a scansione da Amazon S3.

  • Il numero di byte restituiti dal livello Redshift Spectrum al cluster. Se viene restituita una grande quantità di dati, è possibile che le prestazioni del sistema peggiorino.

  • La durata massima e la durata media delle richieste Redshift Spectrum. Long-running le richieste potrebbero indicare un collo di bottiglia.

Nota sui cluster con provisioning RG

Nei cluster con provisioning RG, le query Redshift Spectrum vengono eseguite sull'elaborazione propria del cluster anziché sulla flotta Spectrum dedicata utilizzata dai cluster con provisioning RA3 e DC2. SVL_S3QUERYe continuano a essere popolate su cluster SVL_S3QUERY_SUMMARYRG. Le seguenti colonne hanno una semantica diversa o sono obsolete.

Colonne popolate con semantica diversa su cluster forniti da RG

Nei cluster con provisioning RA3 e DC2, queste colonne descrivono righe, byte e unità di lavoro che si spostano tra il cluster e la flotta Spectrum. Sui cluster con provisioning RG, descrivono il lavoro equivalente svolto dal lettore nativo del cluster:

  • s3_scanned_rows — righe lette direttamente da Amazon S3 dal lettore nativo del cluster (prefiltro).

  • s3_scanned_bytes: dimensione totale dell'intervallo di scansione in byte elaborata dal lettore nativo del cluster.

  • s3query_returned_rows — righe prodotte dopo il push down del filtro dal lettore nativo del cluster.

  • s3query_returned_bytes — byte prodotti dopo il push down del filtro dal lettore nativo del cluster.

  • divisioni: numero di intervalli di scansione utilizzati dal lettore nativo del cluster.

  • total_split_size: dimensione totale di tutti gli intervalli di scansione consumati, in byte.

  • max_split_size: dimensione dell'intervallo di scansione più ampio utilizzato, in byte.

Colonne obsolete nei cluster forniti da RG

Queste colonne descrivono Spectrum-fleet concetti che non esistono su RG. Nei cluster RG vengono registrati come -1 in STL_S3QUERY e quindi appaiono come -1 o non sono significativi in SVL_S3QUERY e SVL_S3QUERY_SUMMARY:

  • total_retries, max_retries — Su RG, i nuovi tentativi avvengono a livello di client Amazon S3. Usa STL_S3CLIENT e STL_S3CLIENT_ERROR per i dettagli dei nuovi tentativi.

  • max_request_duration, avg_request_duration — RG non utilizza il modello di richiesta Spectrum.

  • max_request_parallelism, avg_request_parallelism — RG non utilizza i token di richiesta Spectrum.

  • slowdown_count, max_concurrent_slowdown_count — Su RG, i rallentamenti di Amazon S3 vengono tracciati in STL_S3CLIENT.

Per le metriche aggregate per query sui cluster RG (partizioni, file scansionati, righe e byte restituiti, formato del file, posizione del file, elenco e tempistica di recupero delle partizioni), puoi anche utilizzare la visualizzazione di monitoraggio. SYS_EXTERNAL_QUERY_DETAIL